Authorship attribution of comments in Portuguese extracted from Reddit (2023)
- Authors:
- USP affiliated authors: DIGIAMPIETRI, LUCIANO ANTONIO - EACH ; MATIAS, VINICIUS ALVES - EACH
- Unidade: EACH
- DOI: 10.5335/rbca.v15i2.14045
- Assunto: REDES SOCIAIS
- Language: Inglês
- Abstract: Os ambientes de interação da Internet, como as redes sociais, transferem dados textuais em larga escala que carregam implicitamente os estilos de escrita de cada usuário da rede. Dado o fluxo constante e intenso de dados nos sistemas de informação deste tipo, torna-se necessário desenvolver técnicas que consigam distinguir um texto entre dois candidatos a autores por motivos de, por exemplo, evitar o regresso de utilizadores banidos da plataforma. Este artigo abordou e avaliou diferentes formas de realizar atribuição de autoria por meio de processamento de linguagem natural e aprendizado de máquina, com base em comentários em português extraídos da rede social Reddit. Este artigo visou a atualizar a literatura de atribuição de autoria usando o português como língua principal, dada a escassez de trabalhos atualizados neste idioma. Os resultados de vários métodos viáveis para a tarefa de autoria binária foram expostos e avaliados de acordo com sua significância estatística e foram encontrados dois modelos independentes no mesmo intervalo de confiança que atingiu 0,88 de F1-score e 0,94 de AUC com extração de atributos textuais a partir de embeddings BERTimbau e utilizando de TF-IDF de palavras
- Imprenta:
- Publisher place: Passo Fundo
- Date published: 2023
- Source:
- Título: Revista Brasileira de Computação Aplicada
- ISSN: 2176-6649
- Volume/Número/Paginação/Ano: v. 15, n. 2, p. 01-10, July 2023
- Este artigo possui versão em acesso aberto
- URL de acesso aberto
- PDF de acesso aberto
- Versão do Documento: Versão publicada (Published version)
-
Status: Artigo publicado em periódico de acesso aberto (Gold Open Access) -
ABNT
MATIAS, Vinicius Alves e DIGIAMPIETRI, Luciano Antonio. Authorship attribution of comments in Portuguese extracted from Reddit. Revista Brasileira de Computação Aplicada, v. 15, n. 2, p. 01-10, 2023Tradução . . Disponível em: https://doi.org/10.5335/rbca.v15i2.14045. Acesso em: 14 mar. 2026. -
APA
Matias, V. A., & Digiampietri, L. A. (2023). Authorship attribution of comments in Portuguese extracted from Reddit. Revista Brasileira de Computação Aplicada, 15( 2), 01-10. doi:10.5335/rbca.v15i2.14045 -
NLM
Matias VA, Digiampietri LA. Authorship attribution of comments in Portuguese extracted from Reddit [Internet]. Revista Brasileira de Computação Aplicada. 2023 ; 15( 2): 01-10.[citado 2026 mar. 14 ] Available from: https://doi.org/10.5335/rbca.v15i2.14045 -
Vancouver
Matias VA, Digiampietri LA. Authorship attribution of comments in Portuguese extracted from Reddit [Internet]. Revista Brasileira de Computação Aplicada. 2023 ; 15( 2): 01-10.[citado 2026 mar. 14 ] Available from: https://doi.org/10.5335/rbca.v15i2.14045 - Explaining the black-box or using the black-box to develop better interpretable solutions?
- Improving researcher’s area of expertise identification using TF-IDF Characters N-grams
- Methods and Challenges in Social bots Detection: a Systematic Review
- A systematic review of automated feature engineering solutions in machine learning problems
- Desenvolvimento de jogos para o aperfeiçoamento na aprendizagem de disciplinas de ciência da computação
- Análise da relação entre obtenção de bolsas de produtividade do CNPq e medidas bibliométricas e de análise de redes sociais
- Dinâmica das relações de coautoria nos programas de pós-graduação em computação no Brasil
- Análise da evolução das relações de coautoria nos programas de pós-graduação em computação no Brasil
- Um estudo de caso sobre genes compartilhados e mais representativos para bactérias do gênero Xanthomonas
- Um sistema de predição de relacionamentos em redes sociais
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
