Exportar registro bibliográfico

Aprendizado semissupervisionado multidescrição em classificação de textos (2010)

  • Authors:
  • Autor USP: BRAGA, ÍGOR ASSIS - ICMC
  • Unidade: ICMC
  • Sigla do Departamento: SCC
  • Subjects: APRENDIZADO COMPUTACIONAL; INTELIGÊNCIA ARTIFICIAL; MINERAÇÃO DE DADOS
  • Language: Português
  • Abstract: Algoritmos de aprendizado semissupervisionado aprendem a partir de uma combinação de dados rotulados e não rotulados. Assim, eles podem ser aplicados em domínios em que poucos exemplos rotulados e uma vasta quantidade de exemplos não rotulados estão disponíveis. Além disso, os algoritmos semissupervisionados podem atingir um desempenho superior aos algoritmos supervisionados treinados nos mesmos poucos exemplos rotulados. Uma poderosa abordagem ao aprendizado semissupervisionado, denominada aprendizado multidescrição, pode ser usada sempre que os exemplos de treinamento são descritos por dois ou mais conjuntos de atributos disjuntos. A classificação de textos é um domínio de aplicação no qual algoritmos semissupervisionados vêm obtendo sucesso. No entanto, o aprendizado semissupervisionado multidescrição ainda não foi bem explorado nesse domínio dadas as diversas maneiras possíveis de se descrever bases de textos. O objetivo neste trabalho á analisar o desempenho de algoritmos semissupervisionados multidescrição na classificação de textos, usando unigramas e bigramas para compor duas descrições distintas de documentos textuais. Assim, é considerado inicialmente o difundido algoritmo multidescrição CO-TRAINING, para o qual são propostas modificações a fim de se tratar o problema dos pontos de contenção. É também proposto o algoritmo COAL, o qual pode melhorar ainda mais o algoritmo CO-TRAINING pela incorporação de aprendizado ativo como uma maneira de tratar pontos decontenção. Uma ampla avaliação experimental desses algoritmos foi conduzida em bases de textos reais. Os resultados mostram que o algoritmo COAL, usando unigramas como uma descrição das bases textuais e bigramas como uma outra descrição, atinge um desempenho significativamente melhor que um algoritmo semissupervisionado monodescrição. Levando em consideração os bons resultados obtidos por COAL, conclui-se que o uso de unigramas e bigramas como duas descrições distintas de bases de textos pode ser bastante compensador
  • Imprenta:
  • Data da defesa: 23.04.2010
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      BRAGA, Ígor Assis. Aprendizado semissupervisionado multidescrição em classificação de textos. 2010. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2010. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-02062010-160019/. Acesso em: 14 out. 2024.
    • APA

      Braga, Í. A. (2010). Aprendizado semissupervisionado multidescrição em classificação de textos (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-02062010-160019/
    • NLM

      Braga ÍA. Aprendizado semissupervisionado multidescrição em classificação de textos [Internet]. 2010 ;[citado 2024 out. 14 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-02062010-160019/
    • Vancouver

      Braga ÍA. Aprendizado semissupervisionado multidescrição em classificação de textos [Internet]. 2010 ;[citado 2024 out. 14 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-02062010-160019/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024