Exportar registro bibliográfico


Metrics:

From reviews to features: opinion mining from user reviews with neural language model (2025)

  • Authors:
  • Autor USP: ARAUJO, ADAILTON FERREIRA DE - ICMC
  • Unidade: ICMC
  • Sigla do Departamento: SCC
  • DOI: 10.11606/T.55.2025.tde-21052025-103324
  • Subjects: APRENDIZADO COMPUTACIONAL; APLICATIVOS MÓVEIS; MINERAÇÃO DE DADOS; ENGENHARIA DE REQUISITOS
  • Keywords: Machine learning; Mineração de opiniões; Mobile applications; Modelos neurais de linguagem; Neural language models; Opinion mining; Requirements engineering
  • Agências de fomento:
  • Language: Inglês
  • Abstract: Aplicativos populares recebem centenas de milhares ou até milhões de revisões e a análise manual desse grande volume de informação se torna uma tarefa impraticável. Diante disso, vários trabalhos foram desenvolvidos na última década com objetivo de viabilizar a execução dessa tarefa. Esse processo de mineração de opiniões não é trivial. Dentre os principais desafios estão: i) uso de linguagem natural (não estruturada) e muitas vezes informal; ii) múltiplos aspectos ou requisitos do app são abordados em um mesma revisão; iii) grande volume de ruídos presentes nas revisões; e iv) variedade de domínios de apps, na qual cada domínio possui um conjunto de recursos e vocabulário particulares. Grande parte dos trabalhos da literatura que exploram mineração de opiniões para revisões de aplicativos ainda utilizam o modelo tradicional de Bag-of-Words (BoW) para representação textual ou modelos baseados em regras linguísticas. As abordagens baseadas em representação espaço vetorial representam cada documento textual (revisão) como um vetor e cada dimensão do vetor por uma característica (atributo). Uma vez construídos os vetores, algoritmos clássicos de aprendizado de máquina são treinados com os vetores de representação como entrada. Já as abordagens baseadas em regras linguísticas avaliam previamente um conjunto de reviews com o objetivo de identificar padrões linguísticos recorrentes, associados à classe gramatical, estrutura das sentenças, dependência semântica, etc., que remetemao tipo de informação de interesse para análise da revisão de app. Posteriormente algoritmos são treinados para identificar automaticamente esses padrões predefinidos que representam as informações de interesse. Embora essas duas estratégias tenham trazido evoluções para a mineração de opinião de revisões de app, elas ainda apresentam limitações em relação a eficiência, precisão, capacidade de generalização e capacidade de representação semântica. Outro desafio nesta área é lidar com a grande diferença entre domínios, uma vez que os apps são organizados em dezenas de categorias e, mesmo dentro de uma mesma categoria, os apps possuem funcionalidades diversas. Diante disso, esta tese concentra-se em investigar métodos e abordagens para lidar com estes desafios, alavancando representações estruturadas e semânticas de avaliações de aplicativos, bem como técnicas para extrair e organizar requisitos em vários domínios. Especificamente, exploramos a aplicação de Modelos de Linguagem Neural (NLMs) para várias tarefas de mineração de opinião na análise de avaliações de aplicativos. Essas tarefas incluem extração de recursos de avaliações, que podem indicar solicitações de novos requisitos, bem como classificação, agrupamento, classificação e análise de sentimentos. Os resultados apresentados mostram que abordagens baseadas em NLMs são promissoras em todas as tarefas do pipeline de análise automática de revisão de aplicativos. Especificamente, Large Language Models (LLMs) aindafornecem uma oportunidade para captura extensiva do contexto de revisão e permitem que dados sejam gerados a partir de uma única entrada para múltiplas tarefas no pipeline de análise de revisão de aplicativos.
  • Imprenta:
  • Data da defesa: 07.02.2025
  • Acesso à fonteAcesso à fonteDOI
    Informações sobre o DOI: 10.11606/T.55.2025.tde-21052025-103324 (Fonte: oaDOI API)
    • Este periódico é de acesso aberto
    • Este artigo é de acesso aberto
    • URL de acesso aberto
    • Cor do Acesso Aberto: gold
    • Licença: cc-by-nc-sa

    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      ARAUJO, Adailton Ferreira de. From reviews to features: opinion mining from user reviews with neural language model. 2025. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2025. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-21052025-103324/. Acesso em: 29 dez. 2025.
    • APA

      Araujo, A. F. de. (2025). From reviews to features: opinion mining from user reviews with neural language model (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-21052025-103324/
    • NLM

      Araujo AF de. From reviews to features: opinion mining from user reviews with neural language model [Internet]. 2025 ;[citado 2025 dez. 29 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-21052025-103324/
    • Vancouver

      Araujo AF de. From reviews to features: opinion mining from user reviews with neural language model [Internet]. 2025 ;[citado 2025 dez. 29 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-21052025-103324/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2025