Aprendizado de máquina com informação privilegiada: abordagens para agrupamento hierárquico de textos

Marcacini, Ricardo Marcondes; Hruschka, Eduardo Raul; Rezende, Solange Oliveira

Tese

Aprendizado de máquina com informação privilegiada: abordagens para agrupamento hierárquico de textos (2014)

Authors:
Autor USP: MARCACINI, RICARDO MARCONDES - ICMC
Unidade: ICMC
Sigla do Departamento: SCC
Subjects: APRENDIZADO COMPUTACIONAL; MINERAÇÃO DE DADOS; COMPUTAÇÃO EVOLUTIVA
Keywords: Agrupamento hierárquico de textos; Hierarchical text clustering; Informação privilegiada; Machine learning; Privileged information
Language: Português
Abstract: Métodos de agrupamento hierárquico de textos são muito úteis para analisar o conhecimento embutido em coleções textuais, organizando os documentos textuais em grupos e subgrupos para facilitar a exploração do conhecimento em diversos níveis de granularidade. Tais métodos pertencem à área de aprendizado não supervisionado de máquina, uma que vez obtêm modelos de agrupamento apenas pela observação de regularidades existentes na coleção textual, sem supervisão humana. Os métodos tradicionais de agrupamento assumem que a coleção textual é representada apenas pela informação técnica, ou seja, palavras e frases extraídas diretamente dos textos. Por outro lado, em muitas tarefas de agrupamento existe conhecimento adicional e valioso a respeito dos dados, geralmente extraído por um processo avançado com apoio de usuários especialistas do domínio do problema. Devido ao alto custo para obtenção desses dados, esta informação adicional é definida como privilegiada e usualmente está disponível para representar apenas um subconjunto dos documentos textuais. Recentemente, um novo paradigma de aprendizado de máquina denominado LUPI (Learning Using Privileged Information) foi proposto por Vapnik para incorporar informação privilegiada em métodos aprendizado supervisionado. Neste trabalho de doutorado, o paradigma LUPI foi estendido para aprendizado não supervisionado, em especial, para agrupamento hierárquico de textos. Foram propostas e avaliadas abordagens para lidar com diferentesdesafios existentes em tarefas de agrupamento, envolvendo a extração e estruturação da informação privilegiada e seu uso para refinar ou corrigir modelos de agrupamento. As abordagens propostas se mostraram eficazes em (i) consenso de agrupamentos, permitindo combinar diferentes representações e soluções de agrupamento; (ii) aprendizado de métricas, em que medidas de proximidades mais robustas foram obtidas com base na informação privilegiada; e (iii) seleção de modelos, em que a informação privilegiada é explorada para identificar relevantes estruturas de agrupamento hierárquico. Todas as abordagens apresentadas foram investigadas em um cenário de agrupamento incremental, permitindo seu uso em aplicações práticas caracterizadas pela necessidade de eficiência computacional e alta frequência de publicação de novo conhecimento textual
Imprenta:
- Publisher place: São Carlos
- Date published: 2014
Data da defesa: 14.10.2014

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

MARCACINI, Ricardo Marcondes. Aprendizado de máquina com informação privilegiada: abordagens para agrupamento hierárquico de textos. 2014. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2014. Disponível em: https://teses.usp.br/teses/disponiveis/55/55134/tde-05082015-094733/. Acesso em: 10 maio 2026.
APA

Marcacini, R. M. (2014). Aprendizado de máquina com informação privilegiada: abordagens para agrupamento hierárquico de textos (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://teses.usp.br/teses/disponiveis/55/55134/tde-05082015-094733/
NLM

Marcacini RM. Aprendizado de máquina com informação privilegiada: abordagens para agrupamento hierárquico de textos [Internet]. 2014 ;[citado 2026 maio 10 ] Available from: https://teses.usp.br/teses/disponiveis/55/55134/tde-05082015-094733/
Vancouver

Marcacini RM. Aprendizado de máquina com informação privilegiada: abordagens para agrupamento hierárquico de textos [Internet]. 2014 ;[citado 2026 maio 10 ] Available from: https://teses.usp.br/teses/disponiveis/55/55134/tde-05082015-094733/

ReP

Exportar registro bibliográfico

Aprendizado de máquina com informação privilegiada: abordagens para agrupamento hierárquico de textos (2014)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

ReP

Exportar registro bibliográfico

Aprendizado de máquina com informação privilegiada: abordagens para agrupamento hierárquico de textos (2014)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: