Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável (2005)
- Authors:
- Autor USP: KEPLER, FABIO NATANAEL - IME
- Unidade: IME
- Sigla do Departamento: MAC
- DOI: 10.11606/D.45.2005.tde-20210729-141428
- Assunto: LINGUÍSTICA COMPUTACIONAL
- Language: Português
- Abstract: Dado um texto, queremos atribuir a cada palavra, de acordo com seu contexto, uma categoria morfo-sintática. Para isto, implementamos dois etiquetadores morfo-sintáticos baseados em cadeias de Markov. Primeiro, utilizando uma abordagem bastante conhecida, construímos um etiquetador que usa cadeias de Markov de ordem fixa igual a dois. Então, propomos e implementamos outro etiquetador utilizando uma abordagem recente, baseada em cadeias de Markov de tamanho variável. Depois de mostrar a teoria estatística dos dois modelos e os problemas e desafios mais comuns a serem resolvidos, explicamos o funcionamento dos etiquetadores e expomos os resultados obtidos. Com estes resultados, obtemos uma comparação mais precisa da eficiência destes dois modelos aplicados à etiquetagem morfo-sintática, identificando pontos fortes e fracos de cada um. Por uma combinação de fatores, consideramos o etiquetador com cadeias de Markov de tamanho variável melhor do que o de ordem fixa, e alcançamos um dos melhores resultados em etiquetagem morfo-sintática do português atualmente: 95,51% de precisão, obtida em um tempo total de execução, incluindo o aprendizado e etiquetagem de mais de um milhão de palavras, de menos de três minutos. Contribuímos, assim, com o estado da arte da área e, além disso, fornecemos resultados que nos permitem observar limitações e vantagens da aplicação de modelos estatísticos, em geral, ao problema focado, que podem ajudar a comunidade a identificar pontos críticossobre os quais as pesuqisas nessa área deverão procurar se concentrar.
- Imprenta:
- Data da defesa: 12.04.2005
- Status:
- Artigo publicado em periódico de acesso aberto (Gold Open Access)
- Versão do Documento:
- Versão publicada (Published version)
- Acessar versão aberta:
-
ABNT
KEPLER, Fábio Natanael. Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável. 2005. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2005. Disponível em: https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-141428/. Acesso em: 16 abr. 2026. -
APA
Kepler, F. N. (2005). Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-141428/ -
NLM
Kepler FN. Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável [Internet]. 2005 ;[citado 2026 abr. 16 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-141428/ -
Vancouver
Kepler FN. Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável [Internet]. 2005 ;[citado 2026 abr. 16 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-141428/ - Modelagem de contextos para aprendizado automático aplicado à análise morfossintática
- Part-of-speech tagging of portuguese based on variable length Markov chains
- Comparing two Markov methods for part-of-speech tagging of portuguese
- Variable-length Markov models and ambiguous words in portuguese
- Classifying ontologies
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
