Modelos de tópicos na classificação automática de resenhas de usuário (2009)
- Authors:
- Autor USP: MAUÁ, DENIS DERATANI - EP
- Unidade: EP
- Sigla do Departamento: PMR
- Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL; PROCESSAMENTO DE TEXTO
- Language: Português
- Abstract: Existe um grande número de resenhas de usuário na internet contendo valiosas informações sobre serviços, produtos, política e tendências. A compreensão automática dessas opiniões é não somente cientificamente interessante, mas potencialmente lucrativa. A tarefa de classificação de sentimentos visa a extração automática das opiniões expressas em documentos de texto. Diferentemente da tarefa mais tradicional de categorização de textos, na qual documentos são classificados em assuntos como esportes, economia e turismo, a classificação de sentimentos consiste em anotar documentos com os sentimentos expressos no texto. Se comparados aos classificadores tradicionais, os classificadores de sentimentos possuem um desempenho insatisfatório. Uma das possíveis causas do baixo desempenho é a ausência de representações adequadas que permitam a discriminação das opiniões expressas de uma forma concisa e própria para o processamento de máquina. Modelos de tópicos são modelos estatísticos que buscam extrair informações semânticas ocultas na grande quantidade de dados presente em coleções de texto. Eles representam um documento como uma mistura de tópicos, onde cada tópico é uma distribuição de probabilidades sobre palavras. Cada distribuição representa um conceito semântico implícito nos dados. Modelos de tópicos, as palavras são substituídas por tópicos que representam seu significado de forma sucinta. De fato, os modelos de tópicos realizam uma redução de dimensionalidade nos dados que pode levar a um aumento do desempenho das técnicas de categorização de texto e recuperação de informação. Na classificação de sentimentos, eles podem fornecer a representação necessária através da extração de tópicos que representem os sentimentos expressos no texto. Este trabalho dedica-se ao estudo da aplicação de modelos de tópicos na representação e classificação de sentimentos de resenhas de usuário.Em particular, o modelo Latent Dirichlet Allocation (LDA) e quatro extensões (duas delas desenvolvidas pelo autor) são avaliados na tarefa de classificação de sentimentos baseada em múltiplos aspectos. As extensões ao modelo LDA permitem uma investigação dos efeitos da incorporação de informações adicionais como contexto, avaliações de aspecto e avaliações de múltiplos aspectos no modelo original.
- Imprenta:
- Data da defesa: 14.08.2009
-
ABNT
MAUÁ, Denis Deratani. Modelos de tópicos na classificação automática de resenhas de usuário. 2009. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2009. Disponível em: https://teses.usp.br/teses/disponiveis/3/3152/tde-03082016-090653/. Acesso em: 20 mar. 2026. -
APA
Mauá, D. D. (2009). Modelos de tópicos na classificação automática de resenhas de usuário (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/3/3152/tde-03082016-090653/ -
NLM
Mauá DD. Modelos de tópicos na classificação automática de resenhas de usuário [Internet]. 2009 ;[citado 2026 mar. 20 ] Available from: https://teses.usp.br/teses/disponiveis/3/3152/tde-03082016-090653/ -
Vancouver
Mauá DD. Modelos de tópicos na classificação automática de resenhas de usuário [Internet]. 2009 ;[citado 2026 mar. 20 ] Available from: https://teses.usp.br/teses/disponiveis/3/3152/tde-03082016-090653/ - International Journal of Approximate Reasoning
- Early classification of time series by Hidden Markov Models with set-valued parameters
- Hidden Markov models with set-valued parameters
- Equivalences between maximum a posteriori inference in Bayesian networks and maximum expected utility computation in influence diagrams
- Time robust trees: using temporal invariance to improve generalization
- Better initialization heuristics for order-based bayesian network structure learning
- Initialization heuristics for greedy bayesian network structure learning
- Advances in learning Bayesian networks of bounded treewidth
- A compositional atlas for algebraic circuits
- Approximation complexity of maximum a posteriori inference in sum-product networks
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
