Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável (2005)
- Authors:
- Autor USP: KEPLER, FABIO NATANAEL - IME
- Unidade: IME
- Sigla do Departamento: MAC
- Assunto: LINGUÍSTICA COMPUTACIONAL
- Language: Português
- Abstract: Dado um texto, queremos atribuir a cada palavra, de acordo com seu contexto, uma categoria morfo-sintática. Para isto, implementamos dois etiquetadores morfo-sintáticos baseados em cadeias de Markov. Primeiro, utilizando uma abordagem bastante conhecida, construímos um etiquetador que usa cadeias de Markov de ordem fixa igual a dois. Então, propomos e implementamos outro etiquetador utilizando uma abordagem recente, baseada em cadeias de Markov de tamanho variável. Depois de mostrar a teoria estatística dos dois modelos e os problemas e desafios mais comuns a serem resolvidos, explicamos o funcionamento dos etiquetadores e expomos os resultados obtidos. Com estes resultados, obtemos uma comparação mais precisa da eficiência destes dois modelos aplicados à etiquetagem morfo-sintática, identificando pontos fortes e fracos de cada um. Por uma combinação de fatores, consideramos o etiquetador com cadeias de Markov de tamanho variável melhor do que o de ordem fixa, e alcançamos um dos melhores resultados em etiquetagem morfo-sintática do português atualmente: 95,51% de precisão, obtida em um tempo total de execução, incluindo o aprendizado e etiquetagem de mais de um milhão de palavras, de menos de três minutos. Contribuímos, assim, com o estado da arte da área e, além disso, fornecemos resultados que nos permitem observar limitações e vantagens da aplicação de modelos estatísticos, em geral, ao problema focado, que podem ajudar a comunidade a identificar pontos críticossobre os quais as pesuqisas nessa área deverão procurar se concentrar.
- Imprenta:
- Data da defesa: 12.04.2005
-
ABNT
KEPLER, Fábio Natanael. Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável. 2005. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2005. Disponível em: https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-141428/. Acesso em: 19 fev. 2026. -
APA
Kepler, F. N. (2005). Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-141428/ -
NLM
Kepler FN. Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável [Internet]. 2005 ;[citado 2026 fev. 19 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-141428/ -
Vancouver
Kepler FN. Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável [Internet]. 2005 ;[citado 2026 fev. 19 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-141428/ - Modelagem de contextos para aprendizado automático aplicado à análise morfossintática
- Part-of-speech tagging of portuguese based on variable length Markov chains
- Variable-length Markov models and ambiguous words in portuguese
- Comparing two Markov methods for part-of-speech tagging of portuguese
- Classifying ontologies
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
