From reviews to features: opinion mining from user reviews with neural language model (2025)
- Authors:
- Autor USP: ARAUJO, ADAILTON FERREIRA DE - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- DOI: 10.11606/T.55.2025.tde-21052025-103324
- Subjects: APRENDIZADO COMPUTACIONAL; APLICATIVOS MÓVEIS; MINERAÇÃO DE DADOS; ENGENHARIA DE REQUISITOS
- Keywords: Machine learning; Mineração de opiniões; Mobile applications; Modelos neurais de linguagem; Neural language models; Opinion mining; Requirements engineering
- Agências de fomento:
- Language: Inglês
- Abstract: Aplicativos populares recebem centenas de milhares ou até milhões de revisões e a análise manual desse grande volume de informação se torna uma tarefa impraticável. Diante disso, vários trabalhos foram desenvolvidos na última década com objetivo de viabilizar a execução dessa tarefa. Esse processo de mineração de opiniões não é trivial. Dentre os principais desafios estão: i) uso de linguagem natural (não estruturada) e muitas vezes informal; ii) múltiplos aspectos ou requisitos do app são abordados em um mesma revisão; iii) grande volume de ruídos presentes nas revisões; e iv) variedade de domínios de apps, na qual cada domínio possui um conjunto de recursos e vocabulário particulares. Grande parte dos trabalhos da literatura que exploram mineração de opiniões para revisões de aplicativos ainda utilizam o modelo tradicional de Bag-of-Words (BoW) para representação textual ou modelos baseados em regras linguísticas. As abordagens baseadas em representação espaço vetorial representam cada documento textual (revisão) como um vetor e cada dimensão do vetor por uma característica (atributo). Uma vez construídos os vetores, algoritmos clássicos de aprendizado de máquina são treinados com os vetores de representação como entrada. Já as abordagens baseadas em regras linguísticas avaliam previamente um conjunto de reviews com o objetivo de identificar padrões linguísticos recorrentes, associados à classe gramatical, estrutura das sentenças, dependência semântica, etc., que remetemao tipo de informação de interesse para análise da revisão de app. Posteriormente algoritmos são treinados para identificar automaticamente esses padrões predefinidos que representam as informações de interesse. Embora essas duas estratégias tenham trazido evoluções para a mineração de opinião de revisões de app, elas ainda apresentam limitações em relação a eficiência, precisão, capacidade de generalização e capacidade de representação semântica. Outro desafio nesta área é lidar com a grande diferença entre domínios, uma vez que os apps são organizados em dezenas de categorias e, mesmo dentro de uma mesma categoria, os apps possuem funcionalidades diversas. Diante disso, esta tese concentra-se em investigar métodos e abordagens para lidar com estes desafios, alavancando representações estruturadas e semânticas de avaliações de aplicativos, bem como técnicas para extrair e organizar requisitos em vários domínios. Especificamente, exploramos a aplicação de Modelos de Linguagem Neural (NLMs) para várias tarefas de mineração de opinião na análise de avaliações de aplicativos. Essas tarefas incluem extração de recursos de avaliações, que podem indicar solicitações de novos requisitos, bem como classificação, agrupamento, classificação e análise de sentimentos. Os resultados apresentados mostram que abordagens baseadas em NLMs são promissoras em todas as tarefas do pipeline de análise automática de revisão de aplicativos. Especificamente, Large Language Models (LLMs) aindafornecem uma oportunidade para captura extensiva do contexto de revisão e permitem que dados sejam gerados a partir de uma única entrada para múltiplas tarefas no pipeline de análise de revisão de aplicativos.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2025
- Data da defesa: 07.02.2025
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
ARAUJO, Adailton Ferreira de. From reviews to features: opinion mining from user reviews with neural language model. 2025. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2025. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-21052025-103324/. Acesso em: 28 dez. 2025. -
APA
Araujo, A. F. de. (2025). From reviews to features: opinion mining from user reviews with neural language model (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-21052025-103324/ -
NLM
Araujo AF de. From reviews to features: opinion mining from user reviews with neural language model [Internet]. 2025 ;[citado 2025 dez. 28 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-21052025-103324/ -
Vancouver
Araujo AF de. From reviews to features: opinion mining from user reviews with neural language model [Internet]. 2025 ;[citado 2025 dez. 28 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-21052025-103324/ - Hierarchical cluster labeling of software requirements using contextual word embeddings
- RE-BERT: automatic extraction of software requirements from app reviews using BERT language model
- Temporal dynamics of requirements engineering from mobile app reviews
- Detecting relevant app reviews for software evolution and maintenance through multimodal one-class learning
- Opinion mining for app reviews: an analysis of textual representation and predictive models
- From Bag-of-Words to pre-trained neural language models: improving automatic classification of App reviews for requirements engineering
Informações sobre o DOI: 10.11606/T.55.2025.tde-21052025-103324 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
