Investigação de métodos de desambiguação lexical de sentidos de verbos do português do Brasil (2015)
- Authors:
- Autor USP: CABEZUDO, MARCO ANTONIO SOBREVILLA - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- Subjects: LINGUÍSTICA COMPUTACIONAL; PROCESSAMENTO DE LINGUAGEM NATURAL; LINGUÍSTICA DE CORPUS
- Keywords: Computational linguistics; Desambiguação lexical de sentindo; Natural language processing; Word sense disambiguation
- Language: Português
- Abstract: A Desambiguação Lexical de Sentido (DLS) consiste em determinar o sentido mais apropriado da palavra em um contexto determinado, utilizando-se um repositório de sentidos pré-especificado. Esta tarefa é importante para outras aplicações, por exemplo, a tradução automática. Para o inglês, a DLS tem sido amplamente explorada, utilizando diferentes abordagens e técnicas, contudo, esta tarefa ainda é um desafio para os pesquisadores em semântica. Analisando os resultados dos métodos por classes gramaticais, nota-se que todas as classes não apresentam os mesmos resultados, sendo que os verbos são os que apresentam os piores resultados. Estudos ressaltam que os métodos de DLS usam informações superficiais e os verbos precisam de informação mais profunda para sua desambiguação, como frames sintáticos ou restrições seletivas. Para o português, existem poucos trabalhos nesta área e só recentemente tem-se investigado métodos de uso geral. Além disso, salienta-se que, nos últimos anos, têm sido desenvolvidos recursos lexicais focados nos verbos. Nesse contexto, neste trabalho de mestrado, visou-se investigar métodos de DLS de verbos em textos escritos em português do Brasil. Em particular, foram explorados alguns métodos tradicionais da área e, posteriormente, foi incorporado conhecimento linguístico proveniente da Verbnet.Br. Para subsidiar esta investigação, o córpus CSTNews foi anotado com sentidos de verbos usando a WordNet-Pr como repositório de sentidos. Os resultados obtidosmostraram que os métodos de DLS investigados não conseguiram superar o baseline mais forte e que a incorporação de conhecimento da VerbNet.Br produziu melhorias nos métodos, porém, estas melhorias não foram estatisticamente significantes. Algumas contribuições deste trabalho de mestrado foram um córpus anotado com sentidos de verbos, a criação de uma ferramenta que auxilie a anotação de sentidos, a investigação de métodos de DLS e o uso de informações especificas de verbos (provenientes da VerbNet.Br) na DLS de verbos
- Imprenta:
- Publisher place: São Carlos
- Date published: 2015
- Data da defesa: 28.08.2015
-
ABNT
CABEZUDO, Marco Antonio Sobrevilla. Investigação de métodos de desambiguação lexical de sentidos de verbos do português do Brasil. 2015. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2015. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-07012016-112043/. Acesso em: 28 dez. 2025. -
APA
Cabezudo, M. A. S. (2015). Investigação de métodos de desambiguação lexical de sentidos de verbos do português do Brasil (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-07012016-112043/ -
NLM
Cabezudo MAS. Investigação de métodos de desambiguação lexical de sentidos de verbos do português do Brasil [Internet]. 2015 ;[citado 2025 dez. 28 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-07012016-112043/ -
Vancouver
Cabezudo MAS. Investigação de métodos de desambiguação lexical de sentidos de verbos do português do Brasil [Internet]. 2015 ;[citado 2025 dez. 28 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-07012016-112043/ - Geração de linguagem natural por meio de representações semânticas abstratas para o português do Brasil
- Public riots in Twitter: domain-based event filtering during civil unrest
- Efficient strategies for hierarchical text classification: external knowledge and auxiliary tasks
- NILC at SR'20: exploring pre-trained models in surface realisation
- Low-resource AMR-to-Text generation: a study on brazilian portuguese
- Towards a general abstract meaning representation corpus for brazilian portuguese
- NILC at WebNLG+: pretrained sequence-to-sequence models on RDF-to-text generation
- Back-translation as strategy to tackle the lack of corpus in natural language generation from semantic representations
- Exploring a POS-based two-stage approach for improving low-resource AMR-to-text generation
- The AMR-PT corpus and the semantic annotation of challenging sentences from journalistic and opinion texts
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
