Um modelo de classificação para o Reconhecimento de Entidades Nomeadas (2020)
- Authors:
- Autor USP: SILVA, ANDRESSA VIEIRA E - FFLCH
- Unidade: FFLCH
- Sigla do Departamento: FLL
- DOI: 10.11606/D.8.2020.tde-06042021-192617
- Subjects: LINGUÍSTICA COMPUTACIONAL; PROCESSAMENTO DE LINGUAGEM NATURAL; REDES NEURAIS
- Keywords: Linguistic feature representation; Named Entity Recognition; Reconhecimento de Entidades Nomeadas; Representações word embeddings; Traços de representação linguística; Word embeddings
- Agências de fomento:
- Language: Português
- Abstract: O Reconhecimento de Entidades Nomeadas (REN) é uma tarefa de Processamento de Linguagem Natural (PLN) que busca identificar as Entidades Nomeadas de um texto, tais como nomes de pessoas, cidades e organizações, classificando-as em um conjunto pré-definido de categorias. Essa é considerada uma tarefa difícil, pois as Entidades Nomeadas constituem uma classe gramatical com muita variação lexical e de baixa frequência quando comparadas à massa total de dados textuais. Recentemente, as pesquisas com redes neurais profundas têm mostrado excelentes resultados em diversas aplicações de PLN, incluindo o REN. Nesta pesquisa, foram investigadas duas arquiteturas de redes neurais para o REN no Harem, um corpus de língua portuguesa: BERT (devlin et al., 2018) e uma rede neural bidirecional LSTM (BiLSTM). O objetivo principal foi explorar traços baseados na distribuição contextual das entidades, através de representações vetoriais word embeddings associadas a traços linguísticos. Foram usados traços de etiquetagem morfossintática, forma ortográfica da palavra e recursos lexicais. Esses traços foram concatenados às representações word embeddings para alimentar a BiLSTM. Os resultados mostraram uma melhora estatisticamente significativa no desempenho desse modelo em comparação à BiLSTM apenas com os word embeddings. O modelo BERT, por sua vez, obteve medidas próximas ao estado da arte no Harem
- Imprenta:
- Data da defesa: 16.12.2020
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
SILVA, Andressa Vieira e e LOPES, Marcos Fernando. Um modelo de classificação para o Reconhecimento de Entidades Nomeadas. 2020. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2020. Disponível em: https://www.teses.usp.br/teses/disponiveis/8/8139/tde-06042021-192617/. Acesso em: 08 jan. 2026. -
APA
Silva, A. V. e, & Lopes, M. F. (2020). Um modelo de classificação para o Reconhecimento de Entidades Nomeadas (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/8/8139/tde-06042021-192617/ -
NLM
Silva AV e, Lopes MF. Um modelo de classificação para o Reconhecimento de Entidades Nomeadas [Internet]. 2020 ;[citado 2026 jan. 08 ] Available from: https://www.teses.usp.br/teses/disponiveis/8/8139/tde-06042021-192617/ -
Vancouver
Silva AV e, Lopes MF. Um modelo de classificação para o Reconhecimento de Entidades Nomeadas [Internet]. 2020 ;[citado 2026 jan. 08 ] Available from: https://www.teses.usp.br/teses/disponiveis/8/8139/tde-06042021-192617/
Informações sobre o DOI: 10.11606/D.8.2020.tde-06042021-192617 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
