Detecção automática de notícias falsas em português

Santos, Roney Lira de Sales; Pardo, Thiago Alexandre Salgueiro

Tese

Detecção automática de notícias falsas em português (2022)

Authors:
- Santos, Roney Lira de Sales
- Pardo, Thiago Alexandre Salgueiro (Orientador)
Autor USP: SANTOS, RONEY LIRA DE SALES - ICMC
Unidade: ICMC
Sigla do Departamento: SCC
DOI: 10.11606/T.55.2022.tde-14072022-165613
Subjects: APRENDIZADO COMPUTACIONAL; FAKE NEWS; LINGUÍSTICA COMPUTACIONAL; REPRESENTAÇÃO DE CONHECIMENTO; ANÁLISE DE TEXTO; LÍNGUA PORTUGUESA
Keywords: Atributos linguísticos; Checagem de fatos; Fact-checking; Grafo de conhecimento; Knowledge graph; Linguistic features; Machine learning; Notícia Falsa
Agências de fomento:
Language: Português
Abstract: A propagação e produção das notícias falsas são um problema atual e perigoso, que pode atingir as pessoas com consequências terríveis. Elas podem influenciar um grande número de pessoas em uma ampla gama de assuntos, que vão desde política à saúde. Embora sempre tenham existido, por meio de fofocas e tabloides, o volume de notícias falsas aumentou recentemente devido ao crescente número de usuários de redes sociais e mensageiros instantâneos, por conta da facilidade que se tem ao acesso a tais ambientes. Essas notícias podem causar perdas diretas a pessoas e corporações, pois notícias falsas podem incluir difamação de pessoas, produtos e empresas, por terem uma natureza apelativa. A dificuldade do humano de identificar as notícias falsas já foi foco de pesquisas que comprovaram esse fato, que pode estar relacionado a crenças e opiniões próprias que o humano não consegue distinguir do fato, além de não procurar o contexto que a notícia está inserida. Uma vez que a propagação de notícias falsas alcançou um ponto crítico, iniciativas de combate começaram a surgir. Entretanto, a escassez de conjunto de dados rotulados, principalmente em português, impedia que os classificadores filtrassem automaticamente esses documentos. Além disso, a falta de métodos e abordagens de checagem de fatos automática, também principalmente para o português, faz com que o trabalho manual esteja sujeito a erros e opiniões humanas, o que é altamente prejudicial nas tentativas de combate a esseproblema. Esta tese de doutorado tem como objetivo a investigação e proposição de abordagens que contenham métodos para a detecção de notícias falsas na língua portuguesa, por meio da análise linguística do texto e de checagem de fatos automática, uma vez que tem-se a hipótese de que as notícias falsas deixam pistas linguísticas que as fazem detectáveis, em comparação com notícias verdadeiras. Inspirado em iniciativas anteriores para outras línguas, é apresentado o primeiro corpus de referência nesta área para o português, composto por notícias verdadeiras e falsas alinhadas, que foram analisadas para descobrir alguns dos atributos linguísticos das notícias, denominado de FAKE.BR CORPUS. A partir dele, usando os atributos linguísticos extraídos, formas de representação textual, algoritmos de aprendizado de máquina e estruturas que mapeiam os eventos das notícias, como os grafos de conhecimento, nesta tese são detalhadas as abordagens adaptadas de outras línguas, bem como a proposição de novas abordagens para a detecção de notícias falsas em três tipos de abordagens: baseadas em atributos linguísticos baseadas no conteúdo e baseadas na estrutura do texto. Os resultados alcançados são promissores e mostram que há uma direção a ser tomada na difícil tarefa que é a detecção de notícias falsas na web, com contribuição para o PLN no português.
Imprenta:
- Publisher place: São Carlos
- Date published: 2022
Data da defesa: 09.05.2022

Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).

Status:

Artigo publicado em periódico de acesso aberto (Gold Open Access)

Versão do Documento:

Versão publicada (Published version)

Acessar versão aberta:

PDF de acesso aberto

Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

SANTOS, Roney Lira de Sales. Detecção automática de notícias falsas em português. 2022. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2022. Disponível em: https://teses.usp.br/teses/disponiveis/55/55134/tde-14072022-165613/. Acesso em: 07 maio 2026.
APA

Santos, R. L. de S. (2022). Detecção automática de notícias falsas em português (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://teses.usp.br/teses/disponiveis/55/55134/tde-14072022-165613/
NLM

Santos RL de S. Detecção automática de notícias falsas em português [Internet]. 2022 ;[citado 2026 maio 07 ] Available from: https://teses.usp.br/teses/disponiveis/55/55134/tde-14072022-165613/
Vancouver

Santos RL de S. Detecção automática de notícias falsas em português [Internet]. 2022 ;[citado 2026 maio 07 ] Available from: https://teses.usp.br/teses/disponiveis/55/55134/tde-14072022-165613/

ReP

Exportar registro bibliográfico

Detecção automática de notícias falsas em português (2022)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

ReP

Exportar registro bibliográfico

Detecção automática de notícias falsas em português (2022)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: