Exportar registro bibliográfico

Investigação de modelos de coerência local para sumários multidocumento (2016)

  • Authors:
  • Autor USP: DIAS, MÁRCIO DE SOUZA - ICMC
  • Unidade: ICMC
  • Sigla do Departamento: SCC
  • Subjects: LINGUÍSTICA COMPUTACIONAL; PROCESSAMENTO DE LINGUAGEM NATURAL; CORPUS
  • Keywords: Anotação de córpus; Avaliação da coerência local; Corpus annotation; Erros de qualidade linguística; Evaluation of the local coherence; Linguistic quality errors; Multi-document summarization; Sumarização multidocumento
  • Language: Português
  • Abstract: A sumarização multidocumento consiste na tarefa de produzir automaticamente um único sumário a partir de um conjunto de textos derivados de um mesmo assunto. É imprescindível que seja feito o tratamento de fenômenos que ocorrem neste cenário, tais como: (i) a redundância, a complementaridade e a contradição de informações; (ii) a uniformização de estilos de escrita; (iii) tratamento de expressões referenciais; (iv) a manutenção de focos e perspectivas diferentes nos textos; (v) e a ordenação temporal das informações no sumário. O tratamento de tais fenômenos contribui significativamente para que seja produzido ao final um sumário informativo e coerente, características difíceis de serem garantidas ainda que por um humano. Um tipo particular de coerência estudado nesta tese é a coerência local, a qual á definida por meio de relações entre enunciados (unidades menores) em uma sequência de sentenças, de modo a garantir que os relacionamentos contribuirão para a construção do sentido do texto em sua totalidade. Partindo do pressuposto de que o uso de conhecimento discursivo pode melhorar a avaliação da coerência local, o presente trabalho propõe-se a investigar o uso de relações discursivas para elaborar modelos de coerência local, os quais são capazes de distinguir automaticamente sumários coerentes dos incoerentes. Além disso, um estudo sobre os erros que afetam a Qualidade Linguística dos sumários foi realizado com o propósito de verificar quais são os erros que afetam aa coerência local dos sumários, se os modelos de coerência podem identificar tais erros e se há alguma relação entre os modelos de coerência e a informatividade dos sumários. Para a realização desta pesquisa foi necessário fazer o uso das informações semântico-discursivas dos modelos CST (Cross-document Structure Theory) e RST (Rhetorical Structure Theory) anotadas no córpus, de ferramentas automáticas, como o parser Palavras e de algoritmos que extraíram informações do córpus. Os resultados mostraram que o uso de informações semântico-discursivas foi bem sucedido na distinção dos sumários coerentes dos incoerentes e que os modelos de coerência implementados nesta tese podem ser usados na identificação de erros da qualidade linguística que afetam a coerência local.
  • Imprenta:
  • Data da defesa: 10.05.2016
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      DIAS, Márcio de Souza; PARDO, Thiago Alexandre Salgueiro. Investigação de modelos de coerência local para sumários multidocumento. 2016.Universidade de São Paulo, São Carlos, 2016. Disponível em: < http://www.teses.usp.br/teses/disponiveis/55/55134/tde-11112016-084734/ >.
    • APA

      Dias, M. de S., & Pardo, T. A. S. (2016). Investigação de modelos de coerência local para sumários multidocumento. Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-11112016-084734/
    • NLM

      Dias M de S, Pardo TAS. Investigação de modelos de coerência local para sumários multidocumento [Internet]. 2016 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-11112016-084734/
    • Vancouver

      Dias M de S, Pardo TAS. Investigação de modelos de coerência local para sumários multidocumento [Internet]. 2016 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-11112016-084734/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2021