Modelo para sumarização computacional de textos científicos (2017)
- Authors:
- USP affiliated author: GUZMÁN, ALEJANDRO TARAFA - EP
- School: EP
- Sigla do Departamento: PTC
- Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; ARTIGO CIENTÍFICO
- Language: Português
- Abstract: Neste trabalho, propõe-se um modelo para a sumarização computacional extrativa de textos de artigos técnico-cientificos em inglês. A metodologia utilizada baseia-se em um módulo de avaliação de similaridade semântica textual entre sentenças, desenvolvido especialmente para integrar o modelo de sumarização. A aplicação deste módulo de similaridade à extração de sentenças é feita por intermédio do conceito de uma janela deslizante de comprimento variável, que facilita a detecção de equivalência semântica entre frases do artigo e aquelas de um léxico de frases típicas, atribuíveis a uma estrutura básica dos artigos. Os sumários obtidos em aplicações do modelo apresentam qualidade razoável e utilizável, para os efeitos de antecipar a informação contida nos artigos.
- Imprenta:
- Data da defesa: 07.03.2017
-
ABNT
TARAFA GUZMÁN, Alejandro; FERREIRA, Ademar. Modelo para sumarização computacional de textos científicos. 2017.Universidade de São Paulo, São Paulo, 2017. Disponível em: < http://www.teses.usp.br/teses/disponiveis/3/3139/tde-10082017-145217/pt-br.php >. -
APA
Tarafa Guzmán, A., & Ferreira, A. (2017). Modelo para sumarização computacional de textos científicos. Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/3/3139/tde-10082017-145217/pt-br.php -
NLM
Tarafa Guzmán A, Ferreira A. Modelo para sumarização computacional de textos científicos [Internet]. 2017 ;Available from: http://www.teses.usp.br/teses/disponiveis/3/3139/tde-10082017-145217/pt-br.php -
Vancouver
Tarafa Guzmán A, Ferreira A. Modelo para sumarização computacional de textos científicos [Internet]. 2017 ;Available from: http://www.teses.usp.br/teses/disponiveis/3/3139/tde-10082017-145217/pt-br.php
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas