Building knowledge graphs in a domain with limited resources (2024)
- Authors:
- Autor USP: LIGABUE, PEDRO DE MORAES - EP
- Unidade: EP
- Sigla do Departamento: PCS
- Assunto: ENGENHARIA DE COMPUTAÇÃO
- Language: Inglês
- Abstract: Grafos de conhecimento são utilizados em diversas aplicações, tais como sistemas de perguntas e respostas e sistemas recomendadores, em função da sua capacidade de representar relações entre conceitos. Nesta pequisa, nós buscamos desenvolver um sistema capaz de gerar grafos de conhecimento de forma automática a partir de textos em inglês e em português, ao mesmo tempo em que focamos em um contexto de poucos recursos, tanto em termos de capacidade de processamento quando em termos da disponibilidade de dados. Primeiramente, nós descrevemos o CtxKG, nosso método de geração de grafos de conhecimento, o qual é baseado no OpenIE (um método de extração de triplas de relacionamento) e no BERT (um modelo de linguagem) e contém quatro etapas: a extração de triplas de relacionamento diretamente do texto; a identificação de sinônimos entre triplas; a junção de entidades similares; e a construção de pontes entre grafos de conhecimento de documentos diferentes. O CtxKG se distingue de outros trabalhos da literatura (i) através do seu uso da árvore sintática para evitar a geração de entidade repetidas que ocorre com a implementações básicas do OpenIE; e (ii) através das pontes, as quais criam uma rede conectada de grafos, superando uma limitação de métodos similares que apresentam um grafo isolado para cada documento. Nós comparamos o CtxKG com dois outros métodos através da geração de grafos para artigos de filmes na Wikipédia e comparando-os a grafos de referência construídos com o conjunto de dados OMDb. Então, nós descrevemos a versão em português do CtxKG, o PtxKG, o qual, embora seja semelhante em sua estrutura, inclui alterações-chave, especialmente com relação à etapa de extração de triplas de relacionamento, necessárias para adaptar o método ao contexto do português, que não édiferente apenas em função da linguagem, mas também com relação aos recursos de processamento de linguagem natural disponíveis.
- Imprenta:
- Data da defesa: 02.07.2024
-
ABNT
LIGABUE, Pedro de Moraes. Building knowledge graphs in a domain with limited resources. 2024. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2024. Disponível em: https://teses.usp.br/teses/disponiveis/3/3141/tde-10072025-072257/. Acesso em: 02 abr. 2026. -
APA
Ligabue, P. de M. (2024). Building knowledge graphs in a domain with limited resources (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/3/3141/tde-10072025-072257/ -
NLM
Ligabue P de M. Building knowledge graphs in a domain with limited resources [Internet]. 2024 ;[citado 2026 abr. 02 ] Available from: https://teses.usp.br/teses/disponiveis/3/3141/tde-10072025-072257/ -
Vancouver
Ligabue P de M. Building knowledge graphs in a domain with limited resources [Internet]. 2024 ;[citado 2026 abr. 02 ] Available from: https://teses.usp.br/teses/disponiveis/3/3141/tde-10072025-072257/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
