Exportar registro bibliográfico

Parsing probabilístico para o português do Brasil (2003)

  • Authors:
  • Autor USP: BONFANTE, ANDREIA GENTIL - ICMC
  • Unidade: ICMC
  • Sigla do Departamento: SCE
  • Subjects: INTELIGÊNCIA ARTIFICIAL; MODELOS PARA PROCESSOS ESTOCÁSTICOS; ANÁLISE SINTÁTICA (AUTOMAÇÃO)
  • Language: Português
  • Abstract: A análise sintática automática de sentenças (parsing) é uma tarefa vital para a maioria das aplicações que envolvem Processamento de Língua Natural (PLN). Para que os parsers tenham robustez e boa precisão, eles devem se basear em gramáticas abrangentes e, por isso, complexas. O processo manual de definição de uma gramática "ideal" envolve um alto grau de conhecimento lingüístico e também um alto risco de ambigüidade, dadas as variedades sintáticas envolvidas. Alguns métodos de aprendizado de máquina podem ser usados para a obtenção de gramáticas a partir de grandes conjuntos de sentenças analisadas (treebanks). Entre eles, destacam-se os estatíticos, cuja característica é atribuir probabilidades à análises encontradas e, com isso, conseguir classificá-las, a ponto de produzir as mais prováveis para uma deternminada sentença. O objetivo desta tese foi investigar o comportamento de um desses métodos estatísticos quando usado para analisar sentenças da língua portuguesa do Brasil. O método implementado usa um modelo gerativo de destaque na literatura, cuja característica é considerar o núcleo como o elemento principal e direcionador de todo o processo de análise. Como produto, apresenta-se o ambiente PAPO, formado por vários módulos que executam três funções básicas: (1) o pré-processamento e a preparação dos dados do conjunto de sentenças usado no treinamento, 92) a geração de dois modelos probabilísticos de análise (PAPO-I e PAPO-II), e (3) um parserpropriamente dito, que usa um dos modelos gerados e produz as árvores sintáticas mais prováveis para uma sentença. Uma avaliação qualitativa dos casos de teste é apresentada
  • Imprenta:
  • Data da defesa: 09.06.2003

  • How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      BONFANTE, Andréia Gentil. Parsing probabilístico para o português do Brasil. 2003. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2003. . Acesso em: 18 set. 2024.
    • APA

      Bonfante, A. G. (2003). Parsing probabilístico para o português do Brasil (Tese (Doutorado). Universidade de São Paulo, São Carlos.
    • NLM

      Bonfante AG. Parsing probabilístico para o português do Brasil. 2003 ;[citado 2024 set. 18 ]
    • Vancouver

      Bonfante AG. Parsing probabilístico para o português do Brasil. 2003 ;[citado 2024 set. 18 ]

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024