Exportar registro bibliográfico


Metrics:

Detecção de notícias falsas usando poucos dados positivos rotulados (2023)

  • Authors:
  • Autor USP: SOUZA, MARIANA CARAVANTI DE - ICMC
  • Unidade: ICMC
  • Sigla do Departamento: SCC
  • DOI: 10.11606/T.55.2023.tde-22122023-125502
  • Subjects: FAKE NEWS; APRENDIZADO COMPUTACIONAL; MINERAÇÃO DE DADOS
  • Keywords: Aprendizado de uma única classe; Aprendizado positivo e não rotulado; Aprendizado semissupervisionado; Detecção de notícias falsas; Heterogeneous networks; One class learning; Positive and unlabeled learning; Redes heterogêneas; Semi-supervised learning
  • Agências de fomento:
  • Language: Português
  • Abstract: O avanço da tecnologia tem permitido a disseminação de notícias falsas em larga escala. Criadas para manipular a perspectiva de usuários, atrair sua postura ideológica e instigá-los a compartilhar a informação, notícias falsas vêm se tornando mais suscetíveis a enganar o público alvo. Métodos de Aprendizado de Máquina têm sido utilizados como estratégia promissora para auxiliar na detecção de conteúdo falso, cujo problema geralmente é modelado com algoritmos de aprendizado binário ou multiclasse. No entanto, um dos desafios é definir um conjunto de notícias representativo e conciso para treinar os algoritmos, devido (i) ao desbalanceamento naturalmente latente entre a quantidade de notícias verdadeiras e falsas disponíveis; (ii) a dinamicidade na qual notícias falsas evoluem, cada vez mais convincentes e semelhantes a notícias verídicas; (iii) além da dificuldade em se rotular uma grande quantidade de notícias, sendo necessário a checagem de cada fato relatado no conteúdo da publicação. Considerando a dificuldade na rotulação de notícias falsas (exemplos de interesse, ou positivos) enquanto a caracterização de notícias verdadeiras é ampla (exemplos não interessantes, ou negativos), neste projeto é proposta uma abordagem para detecção de notícias falsas que caracteriza o problema por meio de Aprendizado de Uma Única Classe (OCL). Algoritmos OCL aprendem modelos de classificação considerando apenas informações da classe de interesse. Além disso, métodos de Aprendizado Positivoe Não Rotulado (PUL) utilizam informações de dados não rotulados com o intuito de aumentar o desempenho de classificação. Neste trabalho são propostas abordagens baseadas no algoritmo Positive and Unlabeled Learning by Label Propagation (PU-LP), um algoritmo PUL baseado em redes de similaridade. PU-LP identifica potenciais exemplos da classe positiva e negativa, e posteriormente um algoritmo semissupervionado realiza a classificação dos demais nós não rotulados. São avaliadas diferentes configurações de rede e algoritmos de classificação semissupervisionados em seis bases de notícias que apresentam cenários distintos quanto a linguagem, tópicos, tipo de coleta e balanceamento entre as classes. Experimentos indicam que redes compostas por notícias e termos representativos podem beneficiar o desempenho da abordagem, que é capaz de indetificar notícias falsas com até 94% de F1 usando 10% de dados positivos rotulados.
  • Imprenta:
  • Data da defesa: 05.09.2023
  • Acesso à fonteAcesso à fonteDOI
    Informações sobre o DOI: 10.11606/T.55.2023.tde-22122023-125502 (Fonte: oaDOI API)
    • Este periódico é de acesso aberto
    • Este artigo NÃO é de acesso aberto

    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      SOUZA, Mariana Caravanti de. Detecção de notícias falsas usando poucos dados positivos rotulados. 2023. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2023. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-22122023-125502/. Acesso em: 10 fev. 2026.
    • APA

      Souza, M. C. de. (2023). Detecção de notícias falsas usando poucos dados positivos rotulados (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-22122023-125502/
    • NLM

      Souza MC de. Detecção de notícias falsas usando poucos dados positivos rotulados [Internet]. 2023 ;[citado 2026 fev. 10 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-22122023-125502/
    • Vancouver

      Souza MC de. Detecção de notícias falsas usando poucos dados positivos rotulados [Internet]. 2023 ;[citado 2026 fev. 10 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-22122023-125502/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2026