Modelagem de contextos para aprendizado automático aplicado à análise morfossintática (2010)
- Authors:
- Autor USP: KEPLER, FÁBIO NATANAEL - IME
- Unidade: IME
- Sigla do Departamento: MAC
- DOI: 10.11606/T.45.2010.tde-05082010-223515
- Assunto: LINGUÍSTICA COMPUTACIONAL
- Agências de fomento:
- Language: Português
- Abstract: A etiquetagem morfossintática envolve atribuir às palavras de uma sentença suas classes morfossintáticas de acordo com os contextos em que elas aparecem. Cadeias de Markov de Tamanho Variável (VLMCs, do inglês Variable-Lenght Markov Chains) oferecem uma forma de modelar contextos maiores que trigramas sem sofrer demais com a esparsidade de dados e a complexidade do espaço de estados. Mesmo assim, duas palavras do português apresentam um alto grau de ambigüidade: que e a. O número de erros na etiquetagem dessas palavras corresponde a um quarto do total de erros cometidos por um etiquetador baseado em VLMCs. Além disso, essas palavras parecem apresentar dois diferentes tipos de ambigüidade: um dependendo de contexto não local e outro de contexto direito. Exploramos maneiras de expandir o modelo baseado em VLMCs através do uso de diferentes modelos e métodos, a fim de atacar esses problemas. As abordagens mostraram variado grau de sucesso, com um método em particular (aprendizado guiado) se mostrando capaz de resolver boa parte da ambigüidade de a. Discutimos razões para isso acontecer. Com relação a que, ao longo desta tese propusemos e testamos diversos métodos de aprendizado de informação contextual para tentar desambiguá-lo. Mostramos como, em todos eles, o nível de ambigüidade de quepermanece praticamente constante.
- Imprenta:
- Data da defesa: 28.05.2010
- Status:
- Artigo publicado em periódico de acesso aberto (Gold Open Access)
- Versão do Documento:
- Versão publicada (Published version)
- Acessar versão aberta:
-
ABNT
KEPLER, Fábio Natanael. Modelagem de contextos para aprendizado automático aplicado à análise morfossintática. 2010. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2010. Disponível em: https://teses.usp.br/teses/disponiveis/45/45134/tde-05082010-223515/. Acesso em: 16 abr. 2026. -
APA
Kepler, F. N. (2010). Modelagem de contextos para aprendizado automático aplicado à análise morfossintática (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/45/45134/tde-05082010-223515/ -
NLM
Kepler FN. Modelagem de contextos para aprendizado automático aplicado à análise morfossintática [Internet]. 2010 ;[citado 2026 abr. 16 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-05082010-223515/ -
Vancouver
Kepler FN. Modelagem de contextos para aprendizado automático aplicado à análise morfossintática [Internet]. 2010 ;[citado 2026 abr. 16 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-05082010-223515/ - Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável
- Part-of-speech tagging of portuguese based on variable length Markov chains
- Comparing two Markov methods for part-of-speech tagging of portuguese
- Variable-length Markov models and ambiguous words in portuguese
- Classifying ontologies
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
