Desenvolvimento de operadores de agrupamento por similaridade em SGBD relacionais (2018)
- Authors:
- Autor USP: LAVERDE, NATAN DE ALMEIDA - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- Subjects: BANCO DE DADOS RELACIONAIS; DADOS CINÉTICOS; OPERADORES E COMPILADORES
- Keywords: Agregação por similaridade; Agrupamento por similaridade; RDBMS; SGBDR; Similaridade; Similarity; Similarity aggregation; Similarity group
- Agências de fomento:
- Language: Português
- Abstract: O operador de agrupamento e as funções de agregação são as principais ferramentas utilizadas para sumarizar dados em um Sistema de Gerenciamento de Base de Dados Relacionais (SGBDR). O operador de agrupamento funciona criando partições nos dados utilizando comparações por identidade, e permite que sejam aplicadas funções de agregação que retornam um único valor representando o grupo como um todo. Entretanto, para dados métricos, agrupamento utilizando identidade tem pouca utilidade. Neste caso, adotar o conceito de similaridade é frequentemente uma abordagem mais promissora. A literatura apresenta alguns operadores que podem agrupar os dados utilizando similaridade. Todos eles utilizam um limiar de valor de distância para atribuir os elementos aos grupos. No entanto, estes operadores não obtêm resultados satisfatórios quando a distribuição dos dados apresenta variações significativas na densidade de objetos em diferentes regiões do espaço. Para alcançar melhores resultados nestas situações, propusemos um novo operador que atribui os grupos utilizando uma eleição envolvendo grupos já atribuídos. Também propusemos generalizações, para os operadores existentes e propostos, para trabalhar com uma quantidade de vizinhos mais próximos e aproximação dos vizinhos mais próximos ao invés de um limiar de distância. Para possibilitar a inclusão destes operadores em SGBDR, propusemos uma extensão à Structured Query Language (SQL) e novas funções de agregação. Implementamos estesoperadores em nosso framework em C++ usando a biblioteca Arboretum. Para avaliar os métodos propostos, analisamos tanto qualidade dos resultados quanto tempo de execução, utilizando conjuntos de dados reais e sintéticos. Os operadores propostos alcançaram melhores resultados quanto à qualidade de resultados, e mantiveram os tempos de execução similares. Os operadores que utilizam aproximação aos vizinhos mais próximos produziram resultados de qualidade similar quando comparados aos operadores que utilizando os vizinhos mais próximos, podendo ser executados em menor tempo que estes.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2018
- Data da defesa: 16.05.2018
-
ABNT
LAVERDE, Natan de Almeida. Desenvolvimento de operadores de agrupamento por similaridade em SGBD relacionais. 2018. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2018. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-22102018-172305/. Acesso em: 10 jan. 2026. -
APA
Laverde, N. de A. (2018). Desenvolvimento de operadores de agrupamento por similaridade em SGBD relacionais (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-22102018-172305/ -
NLM
Laverde N de A. Desenvolvimento de operadores de agrupamento por similaridade em SGBD relacionais [Internet]. 2018 ;[citado 2026 jan. 10 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-22102018-172305/ -
Vancouver
Laverde N de A. Desenvolvimento de operadores de agrupamento por similaridade em SGBD relacionais [Internet]. 2018 ;[citado 2026 jan. 10 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-22102018-172305/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
