Aprendizado semissupervisionado multidescrição em classificação de textos

Braga, Ígor Assis; Monard, Maria Carolina

Tese

Aprendizado semissupervisionado multidescrição em classificação de textos (2010)

Authors:
- Braga, Ígor Assis
- Monard, Maria Carolina (Orientador)
Autor USP: BRAGA, ÍGOR ASSIS - ICMC
Unidade: ICMC
Sigla do Departamento: SCC
Subjects: APRENDIZADO COMPUTACIONAL; INTELIGÊNCIA ARTIFICIAL; MINERAÇÃO DE DADOS
Language: Português
Abstract: Algoritmos de aprendizado semissupervisionado aprendem a partir de uma combinação de dados rotulados e não rotulados. Assim, eles podem ser aplicados em domínios em que poucos exemplos rotulados e uma vasta quantidade de exemplos não rotulados estão disponíveis. Além disso, os algoritmos semissupervisionados podem atingir um desempenho superior aos algoritmos supervisionados treinados nos mesmos poucos exemplos rotulados. Uma poderosa abordagem ao aprendizado semissupervisionado, denominada aprendizado multidescrição, pode ser usada sempre que os exemplos de treinamento são descritos por dois ou mais conjuntos de atributos disjuntos. A classificação de textos é um domínio de aplicação no qual algoritmos semissupervisionados vêm obtendo sucesso. No entanto, o aprendizado semissupervisionado multidescrição ainda não foi bem explorado nesse domínio dadas as diversas maneiras possíveis de se descrever bases de textos. O objetivo neste trabalho á analisar o desempenho de algoritmos semissupervisionados multidescrição na classificação de textos, usando unigramas e bigramas para compor duas descrições distintas de documentos textuais. Assim, é considerado inicialmente o difundido algoritmo multidescrição CO-TRAINING, para o qual são propostas modificações a fim de se tratar o problema dos pontos de contenção. É também proposto o algoritmo COAL, o qual pode melhorar ainda mais o algoritmo CO-TRAINING pela incorporação de aprendizado ativo como uma maneira de tratar pontos decontenção. Uma ampla avaliação experimental desses algoritmos foi conduzida em bases de textos reais. Os resultados mostram que o algoritmo COAL, usando unigramas como uma descrição das bases textuais e bigramas como uma outra descrição, atinge um desempenho significativamente melhor que um algoritmo semissupervisionado monodescrição. Levando em consideração os bons resultados obtidos por COAL, conclui-se que o uso de unigramas e bigramas como duas descrições distintas de bases de textos pode ser bastante compensador
Imprenta:
- Publisher place: São Carlos
- Date published: 2010
Data da defesa: 23.04.2010

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

BRAGA, Ígor Assis. Aprendizado semissupervisionado multidescrição em classificação de textos. 2010. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2010. Disponível em: https://teses.usp.br/teses/disponiveis/55/55134/tde-02062010-160019/. Acesso em: 22 mar. 2026.
APA

Braga, Í. A. (2010). Aprendizado semissupervisionado multidescrição em classificação de textos (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de https://teses.usp.br/teses/disponiveis/55/55134/tde-02062010-160019/
NLM

Braga ÍA. Aprendizado semissupervisionado multidescrição em classificação de textos [Internet]. 2010 ;[citado 2026 mar. 22 ] Available from: https://teses.usp.br/teses/disponiveis/55/55134/tde-02062010-160019/
Vancouver

Braga ÍA. Aprendizado semissupervisionado multidescrição em classificação de textos [Internet]. 2010 ;[citado 2026 mar. 22 ] Available from: https://teses.usp.br/teses/disponiveis/55/55134/tde-02062010-160019/

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

Stochastic density ratio estimation and its application to feature selection

ReP

Exportar registro bibliográfico

Aprendizado semissupervisionado multidescrição em classificação de textos (2010)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

ReP

Exportar registro bibliográfico

Aprendizado semissupervisionado multidescrição em classificação de textos (2010)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: