Análise e Classificação Automática de Domínios Discursivos no Português do Brasil (2025)
- Authors:
- USP affiliated authors: MONTE, VANESSA MARTINS DO - FFLCH ; SOUSA, MARIA CLARA PAIXAO DE - FFLCH ; FINGER, MARCELO - IME ; PALMA, MAYARA FELICIANO - FFLCH ; SERRAS, FELIPE RIBAS - IME ; CARPI, MIGUEL DE MELLO - IME ; STURZENEKER, MARIANA LOURENÇO - FFLCH ; CRESPO, MARIA CLARA RAMOS MORALES - FFLCH
- Unidades: FFLCH; IME
- DOI: 10.21814/lm.17.2.476
- Subjects: APRENDIZADO COMPUTACIONAL; PORTUGUÊS DO BRASIL; VARIAÇÃO LINGUÍSTICA
- Keywords: domínios discursivos; Português Brasileiro; classificação de sentenças; modelos transformer; variação linguística; discourse domains; Brazilian Portuguese; sentence classification; transformer models; linguistic variation
- Agências de fomento:
- Language: Português
- Abstract: Este artigo trata da identificação dos domínios discursivos Jurídico, Entretenimento, Jornalístico, Fórum Virtual e Instrucional do português brasileiro no nível sentencial, amostrados do corpus Carolina. Avaliamos propriedades gramaticais, lexicais e semânticas. Demonstramos que os domínios são discerníveis e se organizam em uma escala consistente que associamos à distinção oral-envolvido vs. literato-informacional a partir da comparação com outros trabalhos. Treinamos classificadores Transformer em um novo dataset de sentenças para identificação de domínios, alcançando alta performance. Os padrões de erro dos modelos correlacionam-se com a escala identificada, indicando a captura desta dimensão de variação. Disponibilizamos publicamente os datasets e modelos produzidos.
- Imprenta:
- Source:
- Título: Linguamática
- ISSN: 1647-0818
- Volume/Número/Paginação/Ano: v. 17, n. 2, p. 131-171, 2025
- Este periódico é de acesso aberto
- Este artigo NÃO é de acesso aberto
-
ABNT
SERRAS, Felipe Ribas et al. Análise e Classificação Automática de Domínios Discursivos no Português do Brasil. Linguamática, v. 17, n. 2, p. 131-171, 2025Tradução . . Disponível em: https://doi.org/10.21814/lm.17.2.476. Acesso em: 20 fev. 2026. -
APA
Serras, F. R., Carpi, M. de M., Sturzeneker, M. L., Palma, M. F., Costa, A. S., Monte, V. M. do, et al. (2025). Análise e Classificação Automática de Domínios Discursivos no Português do Brasil. Linguamática, 17( 2), 131-171. doi:10.21814/lm.17.2.476 -
NLM
Serras FR, Carpi M de M, Sturzeneker ML, Palma MF, Costa AS, Monte VM do, Namiuti C, Crespo MCRM, Sousa MCP de, Finger M. Análise e Classificação Automática de Domínios Discursivos no Português do Brasil [Internet]. Linguamática. 2025 ; 17( 2): 131-171.[citado 2026 fev. 20 ] Available from: https://doi.org/10.21814/lm.17.2.476 -
Vancouver
Serras FR, Carpi M de M, Sturzeneker ML, Palma MF, Costa AS, Monte VM do, Namiuti C, Crespo MCRM, Sousa MCP de, Finger M. Análise e Classificação Automática de Domínios Discursivos no Português do Brasil [Internet]. Linguamática. 2025 ; 17( 2): 131-171.[citado 2026 fev. 20 ] Available from: https://doi.org/10.21814/lm.17.2.476 - Exploring computational discernibility of discourse domains in brazilian portuguese within the Carolina corpus
- Building Carolina: metadata for provenance and typology in a corpus of contemporary Brazilian Portuguese
- Analysing and validating language complexity metrics across South American indigenous languages
- Por uma filologia virtual: o caso das atas da Câmara de São Paulo (1562-1596)
- verBERT: automating brazilian case law document multi-label categorization using BERT
- DHandES - First Workshop on Digital Humanities and e-Science: preface
- "e declarou que ela não tinha senão natura de mulher": edição digital e análise paleográfica de dois processos inquisitoriais portugueses de sodomia homoerótica feminina do século XVI
- Algoritmos baseados em atenção neural para a automação da classicação multirrótulo de acórdãos jurídicos
- As formas de tratamento em documentos paulistas do século XVIII
- As Cartas Marienses (1935-1995) compõem o volume 4 da coleção Cartas Brasileiras ... [Orelha]
Informações sobre o DOI: 10.21814/lm.17.2.476 (Fonte: oaDOI API)
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| 3290317_-_Análise_e_Clas... |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
