Exportar registro bibliográfico

Construção Automática de Funções de Proximidade para Redes de Termos usando Evolução Gramatical (2019)

  • Authors:
  • Autor USP: COUTINHO, FELIPE PROVEZANO - ICMC
  • Unidade: ICMC
  • Sigla do Departamento: SCC
  • Subjects: PROCESSAMENTO DE TEXTO; PROCESSAMENTO DE DADOS; APRENDIZADO COMPUTACIONAL; ALGORITMOS GENÉTICOS
  • Keywords: Classificação de documentos; Document classification; Evolução gramatical; Funções de proximidade; Grammatical evolution; Proximity functions; Rede de termos; Terms network
  • Language: Português
  • Abstract: Com o crescente volume de dados textuais, a simples tarefa de rotulação de documentos tornase onerosa. Algoritmos de aprendizado de máquina podem aprender com dados históricos e então serem capazes de realizar a tarefa de rotulação automática em novos documentos. Geralmente, os algoritmos supervisionados são utilizados. Nessa abordagem uma grande quantidade de exemplos é necessária para que o algoritmo seja capaz de identificar padrões e generalizar esse conhecimento com a rotulação de novos exemplos. Uma alternativa é o uso de algoritmos transdutivos, que necessitam apenas de poucos documentos rotulados para realizar a generalização. Geralmente, algoritmos transdutivos utilizam redes de documentos ou um modelo espaço vetorial para representação de documentos. A rede de documentos cresce a medida que novos documentos são adicionados, enquanto o modelo espaço vetorial sofre de problemas como a independência entre termos e alta esparsidade. Uma rede de termos é uma alternativa interessante aos modelos anteriores porque o número de termos tende a se estabilizar a medida que novos documentos são adicionados, a representação da relação entre termos é natural e é possível realizar a seleção de termos diminuir a rede e acelerar a classificação. O Transductive Classification through Terms Networks (TCTN) é estado-da-arte na classificação de documentos utilizando rede de termos, contudo um de seus hiperparâmetros é a função de proximidade que quantifica a proximidade entre termos e aescolha por uma função pode não ser trivial. Nessa dissertação, uma abordagem para construção automática de funções de proximidade para redes de termos é proposta, implementada e avaliada. A abordagem denominada Grammatical Evolution for Automatically Design Interestingness Measures for Transductive Classification through Term Networks (GE-TCTN) utiliza uma gramática livre de contexto para evolução de novas funções de proximidade através do algoritmo de otimização denominado Evolução Gramatical. Os resultados do GE-TCTN são comparados com os resultados do TCTN com objetivo de verificar se novas funções de proximidade construídas automaticamente pelo GETCTN são capazes de produzir resultados de classificação de documentos melhores do que os resultados produzidos utilizando-se funções de proximidade tradicionais da literatura em termos da medida de avaliação de classificação F1-ponderada. Além disso, o GE-TCTN é comparado aos algoritmos aprendizado transdutivo tradicionais e avaliados estatisticamente. Os resultados do GE-TCTN são competitivos com os algoritmos tradicionais e o GE-TCTN é capaz de produzir funções de proximidade que levam a resultados de classificação de documentos superiores ao TCTN.
  • Imprenta:
  • Data da defesa: 04.12.2019
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      COUTINHO, Felipe Provezano. Construção Automática de Funções de Proximidade para Redes de Termos usando Evolução Gramatical. 2019. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2019. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-16032020-150627/. Acesso em: 23 abr. 2024.
    • APA

      Coutinho, F. P. (2019). Construção Automática de Funções de Proximidade para Redes de Termos usando Evolução Gramatical (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-16032020-150627/
    • NLM

      Coutinho FP. Construção Automática de Funções de Proximidade para Redes de Termos usando Evolução Gramatical [Internet]. 2019 ;[citado 2024 abr. 23 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-16032020-150627/
    • Vancouver

      Coutinho FP. Construção Automática de Funções de Proximidade para Redes de Termos usando Evolução Gramatical [Internet]. 2019 ;[citado 2024 abr. 23 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-16032020-150627/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024