Exportar registro bibliográfico

Hierarchical semi-supervised confidence-based active clustering and its application to the extraction of topic hierarchies from document collections (2013)

  • Authors:
  • Autor USP: NOGUEIRA, BRUNO MAGALHÃES - ICMC
  • Unidade: ICMC
  • Sigla do Departamento: SCC
  • Subjects: MINERAÇÃO DE DADOS (TÉCNICAS); CIÊNCIA DA COMPUTAÇÃO (METODOLOGIA;TÉCNICAS); INTELIGÊNCIA ARTIFICIAL
  • Keywords: Active learning; Agrupamento semissupervisionado; Aprendizado ativo; Hierarquias de tópicos; Semi-supervised clustering; Topic hierarchies
  • Language: Inglês
  • Abstract: Hierarquias de tópicos são formas eficientes de organização de coleções de documentos, auxiliando usuários a gerir o conhecimento materializado nessas publicações textuais. Tais hierarquias são usualmente construídas por meio de algoritmos de agrupamento hierárquico não supervisionado. Entretanto, por não considerarem o contexto do usuário na formação dos grupos, hierarquias de tópicos não supervisionadas nem sempre conseguem atender as suas expectativas. Uma solução para este problema e o emprego de algoritmos de agrupamento semissupervisionado, os quais incorporam o conhecimento de domínio do usuário por meio de restrições. Entretanto, para o contexto de agrupamento hierárquico semissupervisionado, não são eficientemente explorados na literatura métodos de seleção de casos (instâncias ou grupos) para receber restrições, bem como não há formas eficientes de interação do usuário com o processo de agrupamento hierárquico. Dessa maneira, neste trabalho, dois algoritmos de agrupamento hierárquico semissupervisionado são propostos: HCAC (Hierarchical Confidence-based Active Clustering) e HCAC-LC (Hierarchical Confidence-based Active Clustering with Limited Constraints). Estes algoritmos empregam uma abordagem de aprendizado ativo baseado na confiança de uma junção de clusters. Quando uma junção de baixa confiança e detectada, o usuário e convidado a decidir, em um conjunto de pares de grupos candidatos, a melhor junção naquele ponto. Estes algoritmos são aqui utilizados naextração de hierarquias de tópicos por meio do framework SMITH, também proposto nesse trabalho. Este framework fornece uma série de atividades bem definidas que possibilitam a interação do usuário para a obtenção de hierarquias de tópicos. A abordagem de aprendizado ativo utilizado nos algoritmos HCAC e HCAC-LC, o tipo de restrição utilizada nestes algoritmos, bem como o framework SMITH para obtenção de hierarquias de tópicos semissupervisionadas são inovações ao estado da arte propostos neste trabalho. Os resultados obtidos indicam que os algoritmos HCAC e HCAC-LC superam o desempenho de outros algoritmos hierárquicos semissupervisionados em diversos cenários. Os resultados também indicam que hierarquias de tópico semissupervisionadas obtidas por meio do framework SMITH são mais intuitivas e fáceis de navegar do que aquelas não supervisionadas
  • Imprenta:
  • Data da defesa: 16.12.2013
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      NOGUEIRA, Bruno Magalhães. Hierarchical semi-supervised confidence-based active clustering and its application to the extraction of topic hierarchies from document collections. 2013. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2013. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-06052014-103312/. Acesso em: 13 fev. 2026.
    • APA

      Nogueira, B. M. (2013). Hierarchical semi-supervised confidence-based active clustering and its application to the extraction of topic hierarchies from document collections (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-06052014-103312/
    • NLM

      Nogueira BM. Hierarchical semi-supervised confidence-based active clustering and its application to the extraction of topic hierarchies from document collections [Internet]. 2013 ;[citado 2026 fev. 13 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-06052014-103312/
    • Vancouver

      Nogueira BM. Hierarchical semi-supervised confidence-based active clustering and its application to the extraction of topic hierarchies from document collections [Internet]. 2013 ;[citado 2026 fev. 13 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-06052014-103312/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2026