DANTEStocks: a multi-layered annotated corpus of stock market tweets for Brazilian portuguese (2025)
- Authors:
- Autor USP: ROMAN, NORTON TREVISAN - EACH
- Unidade: EACH
- DOI: 10.1590/1984-6398202549802
- Assunto: MERCADO FINANCEIRO
- Agências de fomento:
- Language: Inglês
- Abstract: Nesse artigo, apresenta-se o DANTEStocks, um corpus com multicamadas de anotação pioneiro para subsidiar pesquisas de Processamento das Línguas Naturais (PLN) para conteúdo gerado por usuário. O corpus possui 4.048 tweets (posts X) sobre o mercado financeiro em português brasileiro, anotados com três camadas de informação de modo standoff, a saber, emoção (conforme a Roda das Emoções de Plutchik), categoria morfossintática e relação de dependência (segundo o modelo de Dependências Universais), e entidade nomeada (seguindo a taxonomia definida no segundo HAREM). O DANTEStocks tem sido construído no âmbito do Projeto POeTiSA, que visa aumentar os recursos linguísticos (lingwares) e desenvolver ferramentas e aplicações de PLN voltadas para o português brasileiro. Neste artigo, aborda-se o desenho das diversas anotações, reportando o trabalho já realizado
- Imprenta:
- Publisher place: Belo Horizonte
- Date published: 2025
- Source:
- Título: Revista Brasileira de Linguistica Aplicada
- ISSN: 1984-6398
- Volume/Número/Paginação/Ano: v. 25, n. 1, p. 01-32, 2025
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by
-
ABNT
FELIPPO, Ariani di e ROMAN, Norton Trevisan. DANTEStocks: a multi-layered annotated corpus of stock market tweets for Brazilian portuguese. Revista Brasileira de Linguistica Aplicada, v. 25, n. 1, p. 01-32, 2025Tradução . . Disponível em: http://dx.doi.org/10.1590/1984-6398202549802. Acesso em: 12 jan. 2026. -
APA
Felippo, A. di, & Roman, N. T. (2025). DANTEStocks: a multi-layered annotated corpus of stock market tweets for Brazilian portuguese. Revista Brasileira de Linguistica Aplicada, 25( 1), 01-32. doi:10.1590/1984-6398202549802 -
NLM
Felippo A di, Roman NT. DANTEStocks: a multi-layered annotated corpus of stock market tweets for Brazilian portuguese [Internet]. Revista Brasileira de Linguistica Aplicada. 2025 ; 25( 1): 01-32.[citado 2026 jan. 12 ] Available from: http://dx.doi.org/10.1590/1984-6398202549802 -
Vancouver
Felippo A di, Roman NT. DANTEStocks: a multi-layered annotated corpus of stock market tweets for Brazilian portuguese [Internet]. Revista Brasileira de Linguistica Aplicada. 2025 ; 25( 1): 01-32.[citado 2026 jan. 12 ] Available from: http://dx.doi.org/10.1590/1984-6398202549802 - Programming fundamentals and human factors: an empirical study of three variables
- A multi-dimensional annotation scheme for behaviour in dialogues
- Complementing RRL for dialogue summarisation
- Analysing Bias in Political News
- Forecasting stock market index daily direction: a Bayesian network approach
- A comparative analysis of centering-based algorithms for pronoun resolution in portuguese
- From concrete to abstract? Problem domain in the learning to introductory programming
- MetaAnn: um gerador de ferramentas para anotação de textos
- JWN-Br: uma API Java para a WordNet.Br
- Rede Neural Artificial MultilayerPerceptron para previsão de tendências de fechamento do IBOVESPA: índices que influenciam o IBOVESPA
Informações sobre o DOI: 10.1590/1984-6398202549802 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
