Exportar registro bibliográfico

Exploração de métodos de sumarização automática multidocumento com base em conhecimento semântico-discursivo (2014)

  • Authors:
  • Autor USP: CARDOSO, PAULA CHRISTINA FIGUEIRA - ICMC
  • Unidade: ICMC
  • Sigla do Departamento: SCC
  • Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; ANÁLISE CRÍTICA DO DISCURSO (MODELOS); LINGUÍSTICA COMPUTACIONAL
  • Keywords: Automatic summarization; Discourse models; Modelos discursivos; Sumarização automática
  • Language: Português
  • Abstract: A sumarização automática multidocumento visa à produção de um sumário a partir de um conjunto de textos relacionados, para ser utilizado por um usuário particular e/ou para determinada tarefa. Com o crescimento exponencial das informações disponíveis e a necessidade das pessoas obterem a informação em um curto espaço de tempo, a tarefa de sumarização automática tem recebido muita atenção nos últimos tempos. Sabe-se que em um conjunto de textos relacionados existem informações redundantes, contraditórias e complementares, que representam os fenômenos multidocumento. Em cada texto-fonte, o assunto principal é descrito em uma sequência de subtópicos. Além disso, as sentenças de um texto-fonte possuem graus de relevância diferentes. Nesse contexto, espera-se que um sumário multidocumento consista das informações relevantes que representem o total de textos do conjunto. No entanto, as estratégias de sumarização automática multidocumento adotadas até o presente utilizam somente os relacionamentos entre textos e descartam a análise da estrutura textual de cada texto-fonte, resultando em sumários que são pouco representativos dos subtópicos textuais e menos informativos do que poderiam ser. A fim de tratar adequadamente a relevância das informações, os fenômenos multidocumento e a distribuição de subtópicos, neste trabalho de doutorado, investigou-se como modelar o processo de sumarização automática usando o conhecimento semântico-discursivo em métodos de seleção de conteúdo e oimpacto disso para a produção de sumários mais informativos e representativos dos textos-fonte. Na formalização do conhecimento semântico-discursivo, foram utilizadas as teorias semântico-discursivas RST (Rhetorical Structure Theory) e CST (Cross-document Structure Theory). Para apoiar o trabalho, um córpus multidocumento foi anotado com RST e subtópicos, consistindo em um recurso disponível para outras pesquisas. A partir da análise de córpus, foram propostos 10 métodos de segmentação em subtópicos e 13 métodos inovadores de sumarização automática. A avaliação dos métodos de segmentação em subtópicos mostrou que existe uma forte relação entre a estrutura de subtópicos e a análise retórica de um texto. Quanto à avaliação dos métodos de sumarização automática, os resultados indicam que o uso do conhecimento semântico-discursivo em boas estratégias de seleção de conteúdo afeta positivamente a produção de sumários informativos
  • Imprenta:
  • Data da defesa: 05.09.2014
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      CARDOSO, Paula Christina Figueira. Exploração de métodos de sumarização automática multidocumento com base em conhecimento semântico-discursivo. 2014. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2014. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-16032015-161912/. Acesso em: 09 jan. 2026.
    • APA

      Cardoso, P. C. F. (2014). Exploração de métodos de sumarização automática multidocumento com base em conhecimento semântico-discursivo (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-16032015-161912/
    • NLM

      Cardoso PCF. Exploração de métodos de sumarização automática multidocumento com base em conhecimento semântico-discursivo [Internet]. 2014 ;[citado 2026 jan. 09 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-16032015-161912/
    • Vancouver

      Cardoso PCF. Exploração de métodos de sumarização automática multidocumento com base em conhecimento semântico-discursivo [Internet]. 2014 ;[citado 2026 jan. 09 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-16032015-161912/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2026