Análise e classificação automática de domínios discursivos no Português do Brasil (2025)
- Authors:
- USP affiliated authors: MONTE, VANESSA MARTINS DO - FFLCH ; SOUSA, MARIA CLARA PAIXAO DE - FFLCH ; FINGER, MARCELO - IME ; PALMA, MAYARA FELICIANO - FFLCH ; SERRAS, FELIPE RIBAS - IME ; CARPI, MIGUEL DE MELLO - IME ; STURZENEKER, MARIANA LOURENÇO - FFLCH ; CRESPO, MARIA CLARA RAMOS MORALES - FFLCH
- Unidades: FFLCH; IME
- DOI: 10.21814/lm.17.2.476
- Subjects: APRENDIZADO COMPUTACIONAL; PORTUGUÊS DO BRASIL; VARIAÇÃO LINGUÍSTICA
- Keywords: domínios discursivos; Português Brasileiro; classificação de sentenças; modelos transformer; variação linguística; discourse domains; Brazilian Portuguese; sentence classification; transformer models; linguistic variation
- Agências de fomento:
- Language: Português
- Abstract: Este artigo trata da identificação dos domínios discursivos Jurídico, Entretenimento, Jornalístico, Fórum Virtual e Instrucional do português brasileiro no nível sentencial, amostrados do corpus Carolina. Avaliamos propriedades gramaticais, lexicais e semânticas. Demonstramos que os domínios são discerníveis e se organizam em uma escala consistente que associamos à distinção oral-envolvido vs. literato-informacional a partir da comparação com outros trabalhos. Treinamos classificadores Transformer em um novo dataset de sentenças para identificação de domínios, alcançando alta performance. Os padrões de erro dos modelos correlacionam-se com a escala identificada, indicando a captura desta dimensão de variação. Disponibilizamos publicamente os datasets e modelos produzidos.
- Imprenta:
- Source:
- Título: Linguamática
- ISSN: 1647-0818
- Volume/Número/Paginação/Ano: v. 17, n. 2, p. 131-171, 2025
- Status:
- Artigo publicado em periódico de acesso aberto (Gold Open Access)
- Versão do Documento:
- Versão publicada (Published version)
- Acessar versão aberta:
-
ABNT
SERRAS, Felipe Ribas et al. Análise e classificação automática de domínios discursivos no Português do Brasil. Linguamática, v. 17, n. 2, p. 131-171, 2025Tradução . . Disponível em: https://doi.org/10.21814/lm.17.2.476. Acesso em: 15 abr. 2026. -
APA
Serras, F. R., Carpi, M. de M., Sturzeneker, M. L., Palma, M. F., Costa, A. S., Monte, V. M. do, et al. (2025). Análise e classificação automática de domínios discursivos no Português do Brasil. Linguamática, 17( 2), 131-171. doi:10.21814/lm.17.2.476 -
NLM
Serras FR, Carpi M de M, Sturzeneker ML, Palma MF, Costa AS, Monte VM do, Namiuti C, Crespo MCRM, Sousa MCP de, Finger M. Análise e classificação automática de domínios discursivos no Português do Brasil [Internet]. Linguamática. 2025 ; 17( 2): 131-171.[citado 2026 abr. 15 ] Available from: https://doi.org/10.21814/lm.17.2.476 -
Vancouver
Serras FR, Carpi M de M, Sturzeneker ML, Palma MF, Costa AS, Monte VM do, Namiuti C, Crespo MCRM, Sousa MCP de, Finger M. Análise e classificação automática de domínios discursivos no Português do Brasil [Internet]. Linguamática. 2025 ; 17( 2): 131-171.[citado 2026 abr. 15 ] Available from: https://doi.org/10.21814/lm.17.2.476 - Exploring computational discernibility of discourse domains in brazilian portuguese within the Carolina corpus
- Building Carolina: metadata for provenance and typology in a corpus of contemporary Brazilian Portuguese
- Analysing and validating language complexity metrics across South American indigenous languages
- Por uma filologia virtual: o caso das atas da Câmara de São Paulo (1562-1596)
- verBERT: automating brazilian case law document multi-label categorization using BERT
- DHandES - First Workshop on Digital Humanities and e-Science: preface
- "e declarou que ela não tinha senão natura de mulher": edição digital e análise paleográfica de dois processos inquisitoriais portugueses de sodomia homoerótica feminina do século XVI
- Algoritmos baseados em atenção neural para a automação da classicação multirrótulo de acórdãos jurídicos
- Prescrição versus criatividade no ensino da gramática do português
- Construções de SE-passivo na história do português e a posição de sujeitos e complementos
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| 3290317_-_Análise_e_Clas... |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
