Agrupamento semântico de aspectos para mineração de opinião (2017)
- Authors:
- Autor USP: VARGAS, FRANCIELLE ALVES - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; LINGUÍSTICA COMPUTACIONAL; PROCESSAMENTO DE TEXTO; ANÁLISE DO DISCURSO
- Keywords: Aspect-based opinion mining; Mineração de opinião baseada em aspectos; Natural Language Processing
- Language: Português
- Abstract: Com o rápido crescimento do volume de informações opinativas na web, extrair e sintetizar conteúdo subjetivo e relevante da rede é uma tarefa prioritária e que perpassa vários domínios da sociedade: político, social, econômico, etc. A organização semântica desse tipo de conteúdo, é uma tarefa importante no contexto atual, pois possibilita um melhor aproveitamento desses dados, além de benefícios diretos tanto para consumidores quanto para organizações privadas e governamentais. A área responsável pela extração, processamento e apresentação de conteúdo subjetivo é a mineração de opinião, também chamada de análise de sentimentos. A mineração de opinião é dividida em níveis de granularidade de análise: o nível do documento, o nível da sentença e o nível de aspectos. Neste trabalho, atuou-se no nível mais fino de granularidade, a mineração de opinião baseada em aspectos, que consiste de três principais tarefas: o reconhecimento e agrupamento de aspectos, a extração de polaridade e a sumarização. Aspectos são propriedades do alvo da opinião e podem ser implícitos e explícitos. Reconhecer e agrupar aspectos são tarefas críticas para mineração de opinião, no entanto, também são desafiadoras. Por exemplo, em textos opinativos, usuários utilizam termos distintos para se referir a uma mesma propriedade do objeto. Portanto, neste trabalho, atuamos no problema de agrupamento de aspectos para mineração de opinião. Para resolução deste problema, optamos por uma abordagem baseada emconhecimento linguístico. Investigou-se os principais fenômenos intrínsecos e extrínsecos em textos opinativos a fim de encontrar padrões linguísticos e insumos acionáveis para proposição de métodos automáticos de agrupamento de aspectos correlatos para mineração de opinião. Nós propomos, implementamos e comparamos seis métodos automáticos baseados em conhecimento linguístico para a tarefa de agrupamento de aspectos explícitos e implícitos. Um método inédito foi proposto para essa tarefa que superou os demais métodos implementados, especialmente o método baseado em léxico de sinônimos (baseline) e o modelo estatístico com base em word embeddings. O método proposto também não é dependente de uma língua ou de um domínio, no entanto, focamos no Português do Brasil e no domínio de produtos da web.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2017
- Data da defesa: 29.11.2017
-
ABNT
VARGAS, Francielle Alves. Agrupamento semântico de aspectos para mineração de opinião. 2017. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2017. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-31072018-170236/. Acesso em: 23 abr. 2024. -
APA
Vargas, F. A. (2017). Agrupamento semântico de aspectos para mineração de opinião (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-31072018-170236/ -
NLM
Vargas FA. Agrupamento semântico de aspectos para mineração de opinião [Internet]. 2017 ;[citado 2024 abr. 23 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-31072018-170236/ -
Vancouver
Vargas FA. Agrupamento semântico de aspectos para mineração de opinião [Internet]. 2017 ;[citado 2024 abr. 23 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-31072018-170236/ - Aspect clustering for sentiment analysis
- Toward discourse-aware models for multilingual fake news detection
- Rhetorical structure approach for online deception detection: a survey
- Studying dishonest intentions in brazilian portuguese texts
- Linguistic rules for fine-grained opinion extraction
- Predicting sentence-level factuality of news and bias of media outlets
- Identifying fine-grained opinion and classifying polarity on coronavirus pandemic
- Socially responsible hate speech detection: can classifiers reflect social stereotypes?
- NoHateBrazil: a brazilian portuguese text offensiveness analysis system
- HateBR: a large expert annotated corpus of brazilian Instagram comments for offensive language and hate speech detection
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas