Etiquetagem morfossintática multigênero para o português do Brasil segundo o modelo Universal Dependencies (2023)
- Authors:
- Autor USP: SILVA, EMANUEL HUBER DA - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- DOI: 10.11606/D.55.2023.tde-04092023-145651
- Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; CORPUS; GÊNEROS TEXTUAIS; LÍNGUA PORTUGUESA
- Keywords: Etiquetagem morfossintática; Etiquetagem multigêner; Multigenre tagging; Part-of-Speech tagging; Universal dependencies; Universal Dependencies
- Agências de fomento:
- Language: Português
- Abstract: A etiquetagem morfossintática é um dos primeiros níveis de estruturação linguística. Encontrandose entre a morfologia e a sintaxe, busca-se identificar as classes gramaticais de cada palavra ou token. A tarefa é necessária para desambiguação morfossintática e, consequentemente, para a criação de ferramentas e métodos de Processamento de Língua Natural mais robustos. Nessa linha, existe uma variedade de trabalhos para o português do Brasil utilizando córpus de gênero jornalístico com diferentes conjuntos de etiquetas. O formalismo Universal Dependencies (UD) é a teoria linguística que tem sido mais adotada por córpus na área, o que permite a padronização entre diferentes línguas e gêneros textuais, inclusive, do conjunto de etiquetas morfossintáticas. Apesar de existirem trabalhos de etiquetadores para o português do Brasil baseados em diversos formalismos, existem poucos trabalhos que se baseiam na UD. Além disso, há escassez de trabalhos que abordam córpus com variedade de gêneros textuais. Cada gênero textual possui diferentes características linguísticas e, consequentemente, apresenta desafios para os métodos de etiquetagem. Nesse projeto, foi realizada a investigação de métodos de etiquetagem morfossintática para o português do Brasil adotando o formalismo UD. Destaca-se a análise no contexto multigênero com textos jornalísticos, acadêmicos e Conteúdo Gerado por Usuário (CGU)
- Imprenta:
- Publisher place: São Carlos
- Date published: 2023
- Data da defesa: 05.06.2023
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
SILVA, Emanuel Huber da. Etiquetagem morfossintática multigênero para o português do Brasil segundo o modelo Universal Dependencies. 2023. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2023. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-04092023-145651/. Acesso em: 02 out. 2024. -
APA
Silva, E. H. da. (2023). Etiquetagem morfossintática multigênero para o português do Brasil segundo o modelo Universal Dependencies (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-04092023-145651/ -
NLM
Silva EH da. Etiquetagem morfossintática multigênero para o português do Brasil segundo o modelo Universal Dependencies [Internet]. 2023 ;[citado 2024 out. 02 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-04092023-145651/ -
Vancouver
Silva EH da. Etiquetagem morfossintática multigênero para o português do Brasil segundo o modelo Universal Dependencies [Internet]. 2023 ;[citado 2024 out. 02 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-04092023-145651/
Informações sobre o DOI: 10.11606/D.55.2023.tde-04092023-145651 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas