Aprendizado não supervisionado de hierarquias de tópicos a partir de coleções textuais dinâmicas (2011)
- Authors:
- Autor USP: MARCACINI, RICARDO MARCONDES - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- Subjects: CIÊNCIA DA COMPUTAÇÃO (METODOLOGIA;TÉCNICAS); MINERAÇÃO DE DADOS; INTELIGÊNCIA ARTIFICIAL
- Language: Português
- Abstract: A necessidade de extrair conhecimento útil e inovador de grandes massas de dados textuais, tem motivado cada vez mais a investigação de mátodos para Mineração de Textos. Dentre os métodos existentes, destacam-se as iniciativas para organização de conhecimento por meio de hierarquias de tópicos, nas quais o conhecimento implícito nos textos é representado em tópicos e subtópicos, e cada tópico contém documentos relacionados a um mesmo tema. As hierarquias de tópicos desempenham um papel importante na recuperação de informação, principalmente em tarefas de busca exploratória, pois permitem a análise do conhecimento de interesse em diversos níveis de granularidade e exploração interativa de grandes coleções de documentos. Para apoiar a construção de hierarquias de tópicos, métodos de agrupamento hierárquico têm sido utilizados, uma vez que organizam coleções textuais em grupos e subgrupos, de forma não supervisionada, por meio das similaridades entre os documentos. No entanto, a maioria dos métodos de agrupamento hierárquico não é adequada em cenários que envolvem coleções textuais dinâmicas, pois são exigidas frequentes atualizações dos agrupamentos. Métodos de agrupamento que respeitam os requisitos existentes em cenários dinâmicos devem processar novos documentos assim que são adicionados na coleção, realizando o agrupamento de forma incremental. Assim, neste trabalho é explorado o uso de métodos de agrupamento incremental para o aprendizado não supervisionado dehierarquias de tópicos em coleções textuais dinâmicas. O agrupamento incremental é aplicado na construção e atualização de uma representação condensada dos textos, que mantém um sumário das principais características dos dados. Os algoritmos de agrupamento hierárquico podem, então, ser aplicados sobre as representações condensadas, obtendo-se a organização da coleção textual de forma mais eficiente. Foram avaliadas experimentalmente três estratégias de agrupamento incremental da literatura, e proposta uma estratégia alternativa mais apropriada para hierarquias de tópicos. Os resultados indicaram que as hierarquias de tópicos construídas com uso de agrupamento incremental possuem qualidade próxima às hierarquias de tópicos construídas por métodos não incrementais, com significativa redução do custo computacional
- Imprenta:
- Publisher place: São Carlos
- Date published: 2011
- Data da defesa: 19.05.2011
-
ABNT
MARCACINI, Ricardo Marcondes. Aprendizado não supervisionado de hierarquias de tópicos a partir de coleções textuais dinâmicas. 2011. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2011. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-28072011-163026/. Acesso em: 28 dez. 2025. -
APA
Marcacini, R. M. (2011). Aprendizado não supervisionado de hierarquias de tópicos a partir de coleções textuais dinâmicas (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-28072011-163026/ -
NLM
Marcacini RM. Aprendizado não supervisionado de hierarquias de tópicos a partir de coleções textuais dinâmicas [Internet]. 2011 ;[citado 2025 dez. 28 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-28072011-163026/ -
Vancouver
Marcacini RM. Aprendizado não supervisionado de hierarquias de tópicos a partir de coleções textuais dinâmicas [Internet]. 2011 ;[citado 2025 dez. 28 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-28072011-163026/ - Aprendizado de máquina com informação privilegiada: abordagens para agrupamento hierárquico de textos
- Opinion mining for App reviews: identifying and prioritizing emerging issues for software maintenance and evolution
- Complaint analysis in fintech domain: a case study in Brazilian brokerage firms
- Named Entity Recognition approaches applied to legal document segmentation
- Issue detection and prioritization based on mobile application reviews
- Combining prompt-based language models and weak supervision for labeling named entity recognition on legal documents
- Monitoring temporal dynamics of issues in crowdsourced user reviews and their impact on mobile App updates
- MApp-IDEA: monitoring app for issue detection and prioritization
- Embedding propagation over heterogeneous information networks
- DODFMiner: an automated tool for named entity recognition from Official Gazettes
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
