Detecção de notícias falsas usando poucos dados positivos rotulados

Souza, Mariana Caravanti de; Jorge, Alípio Mário Guedes; Rezende, Solange Oliveira

Tese

Detecção de notícias falsas usando poucos dados positivos rotulados (2023)

Authors:
Autor USP: SOUZA, MARIANA CARAVANTI DE - ICMC
Unidade: ICMC
Sigla do Departamento: SCC
DOI: 10.11606/T.55.2023.tde-22122023-125502
Subjects: FAKE NEWS; APRENDIZADO COMPUTACIONAL; MINERAÇÃO DE DADOS
Keywords: Aprendizado de uma única classe; Aprendizado positivo e não rotulado; Aprendizado semissupervisionado; Detecção de notícias falsas; Heterogeneous networks; One class learning; Positive and unlabeled learning; Redes heterogêneas; Semi-supervised learning
Agências de fomento:
Language: Português
Abstract: O avanço da tecnologia tem permitido a disseminação de notícias falsas em larga escala. Criadas para manipular a perspectiva de usuários, atrair sua postura ideológica e instigá-los a compartilhar a informação, notícias falsas vêm se tornando mais suscetíveis a enganar o público alvo. Métodos de Aprendizado de Máquina têm sido utilizados como estratégia promissora para auxiliar na detecção de conteúdo falso, cujo problema geralmente é modelado com algoritmos de aprendizado binário ou multiclasse. No entanto, um dos desafios é definir um conjunto de notícias representativo e conciso para treinar os algoritmos, devido (i) ao desbalanceamento naturalmente latente entre a quantidade de notícias verdadeiras e falsas disponíveis; (ii) a dinamicidade na qual notícias falsas evoluem, cada vez mais convincentes e semelhantes a notícias verídicas; (iii) além da dificuldade em se rotular uma grande quantidade de notícias, sendo necessário a checagem de cada fato relatado no conteúdo da publicação. Considerando a dificuldade na rotulação de notícias falsas (exemplos de interesse, ou positivos) enquanto a caracterização de notícias verdadeiras é ampla (exemplos não interessantes, ou negativos), neste projeto é proposta uma abordagem para detecção de notícias falsas que caracteriza o problema por meio de Aprendizado de Uma Única Classe (OCL). Algoritmos OCL aprendem modelos de classificação considerando apenas informações da classe de interesse. Além disso, métodos de Aprendizado Positivoe Não Rotulado (PUL) utilizam informações de dados não rotulados com o intuito de aumentar o desempenho de classificação. Neste trabalho são propostas abordagens baseadas no algoritmo Positive and Unlabeled Learning by Label Propagation (PU-LP), um algoritmo PUL baseado em redes de similaridade. PU-LP identifica potenciais exemplos da classe positiva e negativa, e posteriormente um algoritmo semissupervionado realiza a classificação dos demais nós não rotulados. São avaliadas diferentes configurações de rede e algoritmos de classificação semissupervisionados em seis bases de notícias que apresentam cenários distintos quanto a linguagem, tópicos, tipo de coleta e balanceamento entre as classes. Experimentos indicam que redes compostas por notícias e termos representativos podem beneficiar o desempenho da abordagem, que é capaz de indetificar notícias falsas com até 94% de F1 usando 10% de dados positivos rotulados.
Imprenta:
- Publisher place: São Carlos
- Date published: 2023
Data da defesa: 05.09.2023

Informações sobre o DOI: 10.11606/T.55.2023.tde-22122023-125502 (Fonte: oaDOI API)

Este periódico é de acesso aberto
Este artigo NÃO é de acesso aberto

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

SOUZA, Mariana Caravanti de. Detecção de notícias falsas usando poucos dados positivos rotulados. 2023. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2023. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-22122023-125502/. Acesso em: 10 fev. 2026.
APA

Souza, M. C. de. (2023). Detecção de notícias falsas usando poucos dados positivos rotulados (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-22122023-125502/
NLM

Souza MC de. Detecção de notícias falsas usando poucos dados positivos rotulados [Internet]. 2023 ;[citado 2026 fev. 10 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-22122023-125502/
Vancouver

Souza MC de. Detecção de notícias falsas usando poucos dados positivos rotulados [Internet]. 2023 ;[citado 2026 fev. 10 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-22122023-125502/

ReP

Exportar registro bibliográfico

Detecção de notícias falsas usando poucos dados positivos rotulados (2023)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

ReP

Exportar registro bibliográfico

Detecção de notícias falsas usando poucos dados positivos rotulados (2023)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: