Exportar registro bibliográfico

O algoritmo de aprendizado semi-supervisionado co-training e sua aplicação na rotulação de documentos (2004)

  • Authors:
  • Autor USP: MATSUBARA, EDSON TAKASHI - ICMC
  • Unidade: ICMC
  • Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL; ALGORITMOS E ESTRUTURAS DE DADOS
  • Language: Português
  • Abstract: Em Aprendizado de Máquina, a abordagem supervisionada normalmente necessita de um número significativo de exemplos de treinamento para a indução de classificadores precisos. Entretanto, a rotulação de dados é freqüentemente realizada manualmente, o que torna esse processo demorado e caro. Por outro lado, exemplos não-rotulados são facilmente obtidos se comparados a exemplos rotulados. Isso é particularmente verdade para tarefas de classificação de textos que envolvem fontes de dados on-line tais como páginas de internet, email e artigos científicos. A classificação de textos tem grande importância dado o grande volume de textos disponível on-line. Aprendizado semi-supervisionado, uma área de pesquisa relativamente nova em Aprendizado de Máquina, representa a junção do aprendizado supervisionado e não-supervisionado, e tem o potencial de reduzir a necessidade de dados rotulados quando somente um pequeno conjunto de exemplos rotulados está disponível. Este trabalho descreve o algoritmo de aprendizado semi-supervisionado co-training, que necessita de duas descrições de cada exemplo. Deve ser observado que as duas descrições necessárias para co-training podem ser facilmente obtidas de documentos textuais por meio de pré-processamento. Neste trabalho, várias extensões do algoritmo co-training foram implementadas. Ainda mais, foi implementado um ambiente computacional para o pré-processamento de textos, denominado PreTexT, com o objetivo de utilizar co-training emproblemas de classificação de textos. Os resultados experimentais foram obtidos utilizando três conjuntos de dados. Dois conjuntos de dados estão relacionados com classificação de textos e o outro com classificação de páginas de internet. Os resultados, que variam de excelentes a ruins, mostram que co-training, similarmente a outros algoritmos de aprendizado semi-supervisionado, é afetado de maneira bastante ) complexa pelos diferentes aspectos na indução dos modelos
  • Imprenta:
  • Data da defesa: 26.05.2004
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      MATSUBARA, Edson Takashi; MONARD, Maria Carolina. O algoritmo de aprendizado semi-supervisionado co-training e sua aplicação na rotulação de documentos. 2004.Universidade de São Paulo, São Carlos, 2004. Disponível em: < http://www.teses.usp.br/teses/disponiveis/55/55134/tde-19082004-092311/ >.
    • APA

      Matsubara, E. T., & Monard, M. C. (2004). O algoritmo de aprendizado semi-supervisionado co-training e sua aplicação na rotulação de documentos. Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-19082004-092311/
    • NLM

      Matsubara ET, Monard MC. O algoritmo de aprendizado semi-supervisionado co-training e sua aplicação na rotulação de documentos [Internet]. 2004 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-19082004-092311/
    • Vancouver

      Matsubara ET, Monard MC. O algoritmo de aprendizado semi-supervisionado co-training e sua aplicação na rotulação de documentos [Internet]. 2004 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-19082004-092311/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2021