Modelos de tópicos na classificação automática de resenhas de usuário (2009)
- Authors:
- Autor USP: MAUÁ, DENIS DERATANI - EP
- Unidade: EP
- Sigla do Departamento: PMR
- Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL; PROCESSAMENTO DE TEXTO
- Language: Português
- Abstract: Existe um grande número de resenhas de usuário na internet contendo valiosas informações sobre serviços, produtos, política e tendências. A compreensão automática dessas opiniões é não somente cientificamente interessante, mas potencialmente lucrativa. A tarefa de classificação de sentimentos visa a extração automática das opiniões expressas em documentos de texto. Diferentemente da tarefa mais tradicional de categorização de textos, na qual documentos são classificados em assuntos como esportes, economia e turismo, a classificação de sentimentos consiste em anotar documentos com os sentimentos expressos no texto. Se comparados aos classificadores tradicionais, os classificadores de sentimentos possuem um desempenho insatisfatório. Uma das possíveis causas do baixo desempenho é a ausência de representações adequadas que permitam a discriminação das opiniões expressas de uma forma concisa e própria para o processamento de máquina. Modelos de tópicos são modelos estatísticos que buscam extrair informações semânticas ocultas na grande quantidade de dados presente em coleções de texto. Eles representam um documento como uma mistura de tópicos, onde cada tópico é uma distribuição de probabilidades sobre palavras. Cada distribuição representa um conceito semântico implícito nos dados. Modelos de tópicos, as palavras são substituídas por tópicos que representam seu significado de forma sucinta. De fato, os modelos de tópicos realizam uma redução de dimensionalidade nos dados que pode levar a um aumento do desempenho das técnicas de categorização de texto e recuperação de informação. Na classificação de sentimentos, eles podem fornecer a representação necessária através da extração de tópicos que representem os sentimentos expressos no texto. Este trabalho dedica-se ao estudo da aplicação de modelos de tópicos na representação e classificação de sentimentos de resenhas de usuário.Em particular, o modelo Latent Dirichlet Allocation (LDA) e quatro extensões (duas delas desenvolvidas pelo autor) são avaliados na tarefa de classificação de sentimentos baseada em múltiplos aspectos. As extensões ao modelo LDA permitem uma investigação dos efeitos da incorporação de informações adicionais como contexto, avaliações de aspecto e avaliações de múltiplos aspectos no modelo original.
- Imprenta:
- Data da defesa: 14.08.2009
-
ABNT
MAUÁ, Denis Deratani. Modelos de tópicos na classificação automática de resenhas de usuário. 2009. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2009. Disponível em: http://www.teses.usp.br/teses/disponiveis/3/3152/tde-03082016-090653/. Acesso em: 04 dez. 2025. -
APA
Mauá, D. D. (2009). Modelos de tópicos na classificação automática de resenhas de usuário (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/3/3152/tde-03082016-090653/ -
NLM
Mauá DD. Modelos de tópicos na classificação automática de resenhas de usuário [Internet]. 2009 ;[citado 2025 dez. 04 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3152/tde-03082016-090653/ -
Vancouver
Mauá DD. Modelos de tópicos na classificação automática de resenhas de usuário [Internet]. 2009 ;[citado 2025 dez. 04 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3152/tde-03082016-090653/ - Hidden Markov models with set-valued parameters
- Initialization heuristics for greedy bayesian network structure learning
- Time robust trees: using temporal invariance to improve generalization
- University entrance exam as a guiding test for artificial intelligence
- On using sum-product networks for multi-label classification
- Advances in learning Bayesian networks of bounded treewidth
- Early classification of time series by Hidden Markov Models with set-valued parameters
- Better initialization heuristics for order-based bayesian network structure learning
- International Journal of Approximate Reasoning
- Advances in automatically solving the ENEM
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
