Exportar registro bibliográfico

Building knowledge graphs in a domain with limited resources (2024)

  • Authors:
  • Autor USP: LIGABUE, PEDRO DE MORAES - EP
  • Unidade: EP
  • Sigla do Departamento: PCS
  • Assunto: ENGENHARIA DE COMPUTAÇÃO
  • Language: Inglês
  • Abstract: Grafos de conhecimento são utilizados em diversas aplicações, tais como sistemas de perguntas e respostas e sistemas recomendadores, em função da sua capacidade de representar relações entre conceitos. Nesta pequisa, nós buscamos desenvolver um sistema capaz de gerar grafos de conhecimento de forma automática a partir de textos em inglês e em português, ao mesmo tempo em que focamos em um contexto de poucos recursos, tanto em termos de capacidade de processamento quando em termos da disponibilidade de dados. Primeiramente, nós descrevemos o CtxKG, nosso método de geração de grafos de conhecimento, o qual é baseado no OpenIE (um método de extração de triplas de relacionamento) e no BERT (um modelo de linguagem) e contém quatro etapas: a extração de triplas de relacionamento diretamente do texto; a identificação de sinônimos entre triplas; a junção de entidades similares; e a construção de pontes entre grafos de conhecimento de documentos diferentes. O CtxKG se distingue de outros trabalhos da literatura (i) através do seu uso da árvore sintática para evitar a geração de entidade repetidas que ocorre com a implementações básicas do OpenIE; e (ii) através das pontes, as quais criam uma rede conectada de grafos, superando uma limitação de métodos similares que apresentam um grafo isolado para cada documento. Nós comparamos o CtxKG com dois outros métodos através da geração de grafos para artigos de filmes na Wikipédia e comparando-os a grafos de referência construídos com o conjunto de dados OMDb. Então, nós descrevemos a versão em português do CtxKG, o PtxKG, o qual, embora seja semelhante em sua estrutura, inclui alterações-chave, especialmente com relação à etapa de extração de triplas de relacionamento, necessárias para adaptar o método ao contexto do português, que não édiferente apenas em função da linguagem, mas também com relação aos recursos de processamento de linguagem natural disponíveis.
  • Imprenta:
  • Data da defesa: 02.07.2024
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      LIGABUE, Pedro de Moraes. Building knowledge graphs in a domain with limited resources. 2024. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2024. Disponível em: https://teses.usp.br/teses/disponiveis/3/3141/tde-10072025-072257/. Acesso em: 02 abr. 2026.
    • APA

      Ligabue, P. de M. (2024). Building knowledge graphs in a domain with limited resources (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/3/3141/tde-10072025-072257/
    • NLM

      Ligabue P de M. Building knowledge graphs in a domain with limited resources [Internet]. 2024 ;[citado 2026 abr. 02 ] Available from: https://teses.usp.br/teses/disponiveis/3/3141/tde-10072025-072257/
    • Vancouver

      Ligabue P de M. Building knowledge graphs in a domain with limited resources [Internet]. 2024 ;[citado 2026 abr. 02 ] Available from: https://teses.usp.br/teses/disponiveis/3/3141/tde-10072025-072257/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2026