Detecção de notícias falsas usando poucos dados positivos rotulados (2023)
- Authors:
- Autor USP: SOUZA, MARIANA CARAVANTI DE - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- DOI: 10.11606/T.55.2023.tde-22122023-125502
- Subjects: FAKE NEWS; APRENDIZADO COMPUTACIONAL; MINERAÇÃO DE DADOS
- Keywords: Aprendizado de uma única classe; Aprendizado positivo e não rotulado; Aprendizado semissupervisionado; Detecção de notícias falsas; Heterogeneous networks; One class learning; Positive and unlabeled learning; Redes heterogêneas; Semi-supervised learning
- Agências de fomento:
- Language: Português
- Abstract: O avanço da tecnologia tem permitido a disseminação de notícias falsas em larga escala. Criadas para manipular a perspectiva de usuários, atrair sua postura ideológica e instigá-los a compartilhar a informação, notícias falsas vêm se tornando mais suscetíveis a enganar o público alvo. Métodos de Aprendizado de Máquina têm sido utilizados como estratégia promissora para auxiliar na detecção de conteúdo falso, cujo problema geralmente é modelado com algoritmos de aprendizado binário ou multiclasse. No entanto, um dos desafios é definir um conjunto de notícias representativo e conciso para treinar os algoritmos, devido (i) ao desbalanceamento naturalmente latente entre a quantidade de notícias verdadeiras e falsas disponíveis; (ii) a dinamicidade na qual notícias falsas evoluem, cada vez mais convincentes e semelhantes a notícias verídicas; (iii) além da dificuldade em se rotular uma grande quantidade de notícias, sendo necessário a checagem de cada fato relatado no conteúdo da publicação. Considerando a dificuldade na rotulação de notícias falsas (exemplos de interesse, ou positivos) enquanto a caracterização de notícias verdadeiras é ampla (exemplos não interessantes, ou negativos), neste projeto é proposta uma abordagem para detecção de notícias falsas que caracteriza o problema por meio de Aprendizado de Uma Única Classe (OCL). Algoritmos OCL aprendem modelos de classificação considerando apenas informações da classe de interesse. Além disso, métodos de Aprendizado Positivoe Não Rotulado (PUL) utilizam informações de dados não rotulados com o intuito de aumentar o desempenho de classificação. Neste trabalho são propostas abordagens baseadas no algoritmo Positive and Unlabeled Learning by Label Propagation (PU-LP), um algoritmo PUL baseado em redes de similaridade. PU-LP identifica potenciais exemplos da classe positiva e negativa, e posteriormente um algoritmo semissupervionado realiza a classificação dos demais nós não rotulados. São avaliadas diferentes configurações de rede e algoritmos de classificação semissupervisionados em seis bases de notícias que apresentam cenários distintos quanto a linguagem, tópicos, tipo de coleta e balanceamento entre as classes. Experimentos indicam que redes compostas por notícias e termos representativos podem beneficiar o desempenho da abordagem, que é capaz de indetificar notícias falsas com até 94% de F1 usando 10% de dados positivos rotulados.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2023
- Data da defesa: 05.09.2023
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
SOUZA, Mariana Caravanti de. Detecção de notícias falsas usando poucos dados positivos rotulados. 2023. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2023. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-22122023-125502/. Acesso em: 26 dez. 2025. -
APA
Souza, M. C. de. (2023). Detecção de notícias falsas usando poucos dados positivos rotulados (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-22122023-125502/ -
NLM
Souza MC de. Detecção de notícias falsas usando poucos dados positivos rotulados [Internet]. 2023 ;[citado 2025 dez. 26 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-22122023-125502/ -
Vancouver
Souza MC de. Detecção de notícias falsas usando poucos dados positivos rotulados [Internet]. 2023 ;[citado 2025 dez. 26 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-22122023-125502/ - A heterogeneous network-based positive and unlabeled learning approach to detect fake news
- One-class learning for fake news detection through multimodal variational autoencoders
- Learning textual representations from multiple modalities to detect fake news through one-class learning
- A network-based positive and unlabeled learning approach for fake news detection
- Keywords attention for fake news detection using few positive labels
Informações sobre o DOI: 10.11606/T.55.2023.tde-22122023-125502 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
