Investigação de modelos de coerência local para sumários multidocumento (2016)
- Authors:
- Autor USP: DIAS, MÁRCIO DE SOUZA - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- Subjects: LINGUÍSTICA COMPUTACIONAL; PROCESSAMENTO DE LINGUAGEM NATURAL; CORPUS
- Keywords: Anotação de córpus; Avaliação da coerência local; Corpus annotation; Erros de qualidade linguística; Evaluation of the local coherence; Linguistic quality errors; Multi-document summarization; Sumarização multidocumento
- Language: Português
- Abstract: A sumarização multidocumento consiste na tarefa de produzir automaticamente um único sumário a partir de um conjunto de textos derivados de um mesmo assunto. É imprescindível que seja feito o tratamento de fenômenos que ocorrem neste cenário, tais como: (i) a redundância, a complementaridade e a contradição de informações; (ii) a uniformização de estilos de escrita; (iii) tratamento de expressões referenciais; (iv) a manutenção de focos e perspectivas diferentes nos textos; (v) e a ordenação temporal das informações no sumário. O tratamento de tais fenômenos contribui significativamente para que seja produzido ao final um sumário informativo e coerente, características difíceis de serem garantidas ainda que por um humano. Um tipo particular de coerência estudado nesta tese é a coerência local, a qual á definida por meio de relações entre enunciados (unidades menores) em uma sequência de sentenças, de modo a garantir que os relacionamentos contribuirão para a construção do sentido do texto em sua totalidade. Partindo do pressuposto de que o uso de conhecimento discursivo pode melhorar a avaliação da coerência local, o presente trabalho propõe-se a investigar o uso de relações discursivas para elaborar modelos de coerência local, os quais são capazes de distinguir automaticamente sumários coerentes dos incoerentes. Além disso, um estudo sobre os erros que afetam a Qualidade Linguística dos sumários foi realizado com o propósito de verificar quais são os erros que afetam aa coerência local dos sumários, se os modelos de coerência podem identificar tais erros e se há alguma relação entre os modelos de coerência e a informatividade dos sumários. Para a realização desta pesquisa foi necessário fazer o uso das informações semântico-discursivas dos modelos CST (Cross-document Structure Theory) e RST (Rhetorical Structure Theory) anotadas no córpus, de ferramentas automáticas, como o parser Palavras e de algoritmos que extraíram informações do córpus. Os resultados mostraram que o uso de informações semântico-discursivas foi bem sucedido na distinção dos sumários coerentes dos incoerentes e que os modelos de coerência implementados nesta tese podem ser usados na identificação de erros da qualidade linguística que afetam a coerência local.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2016
- Data da defesa: 10.05.2016
-
ABNT
DIAS, Márcio de Souza; PARDO, Thiago Alexandre Salgueiro. Investigação de modelos de coerência local para sumários multidocumento. 2016.Universidade de São Paulo, São Carlos, 2016. Disponível em: < http://www.teses.usp.br/teses/disponiveis/55/55134/tde-11112016-084734/ >. -
APA
Dias, M. de S., & Pardo, T. A. S. (2016). Investigação de modelos de coerência local para sumários multidocumento. Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-11112016-084734/ -
NLM
Dias M de S, Pardo TAS. Investigação de modelos de coerência local para sumários multidocumento [Internet]. 2016 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-11112016-084734/ -
Vancouver
Dias M de S, Pardo TAS. Investigação de modelos de coerência local para sumários multidocumento [Internet]. 2016 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-11112016-084734/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas