Modelo para sumarização computacional de textos científicos (2017)
- Autores:
- Autor USP: GUZMÁN, ALEJANDRO TARAFA - EP
- Unidade: EP
- Sigla do Departamento: PTC
- Assuntos: PROCESSAMENTO DE LINGUAGEM NATURAL; ARTIGO CIENTÍFICO
- Idioma: Português
- Resumo: Neste trabalho, propõe-se um modelo para a sumarização computacional extrativa de textos de artigos técnico-cientificos em inglês. A metodologia utilizada baseia-se em um módulo de avaliação de similaridade semântica textual entre sentenças, desenvolvido especialmente para integrar o modelo de sumarização. A aplicação deste módulo de similaridade à extração de sentenças é feita por intermédio do conceito de uma janela deslizante de comprimento variável, que facilita a detecção de equivalência semântica entre frases do artigo e aquelas de um léxico de frases típicas, atribuíveis a uma estrutura básica dos artigos. Os sumários obtidos em aplicações do modelo apresentam qualidade razoável e utilizável, para os efeitos de antecipar a informação contida nos artigos.
- Imprenta:
- Data da defesa: 07.03.2017
-
ABNT
TARAFA GUZMÁN, Alejandro. Modelo para sumarização computacional de textos científicos. 2017. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2017. Disponível em: http://www.teses.usp.br/teses/disponiveis/3/3139/tde-10082017-145217/. Acesso em: 18 set. 2024. -
APA
Tarafa Guzmán, A. (2017). Modelo para sumarização computacional de textos científicos (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/3/3139/tde-10082017-145217/ -
NLM
Tarafa Guzmán A. Modelo para sumarização computacional de textos científicos [Internet]. 2017 ;[citado 2024 set. 18 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3139/tde-10082017-145217/ -
Vancouver
Tarafa Guzmán A. Modelo para sumarização computacional de textos científicos [Internet]. 2017 ;[citado 2024 set. 18 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3139/tde-10082017-145217/
Como citar
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas