Analysis of variants of similarity retrieval operators in Metric Access Methods (2025)
- Authors:
- Autor USP: SILVA, WILLIAM ZANIBONI - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- DOI: 10.11606/D.55.2025.tde-06082025-183402
- Subjects: BANCO DE DADOS RELACIONAIS; PROCESSAMENTO DE IMAGENS; ANÁLISE DE DADOS
- Keywords: Billing reduction; Consultas por similaridade; DBMS; Métodos de acesso métricos; Metric access methods; Query variations; Redução de custo financeiro; SGBDs; Similarity query; Variações de consulta
- Language: Inglês
- Abstract: Os Sistemas de Gerenciamento de Bases de Dados (SGBDs) são ferramentas responsáveis por armazenar e recuperar dados por excelência. No entanto, seus recursos foram desenvolvidos com enfoque em dados escalares, como números e pequenos textos. Ao se considerar dados complexos (não escalares) como imagens e vídeos, os recursos disponibilizados por essas ferramentas tornam-se pouco úteis no contexto de recuperação e organização dos dados. Além disso, para dados complexos, a recuperação baseada na similaridade entre os elementos faz mais sentido. A definição da similaridade depende de características particulares do domínio de aplicação, e os Métodos de Acesso Métricos (MAM) são utilizados na estruturação desses dados para tornar mais eficientes os processo de recuperação por similaridade. Alguns poucos trabalhos da literatura apresentam integrações entre SGBDs Relacionais de código aberto e consultas por similaridade utilizando MAMs. Nesses casos, as operações de recuperação por similaridade disponibilizadas se restringem às mais básicas e elas tendem a trabalhar somente sobre o dado complexo. O objetivo deste trabalho de mestrado é avaliar variações de consultas que devem ser aceleradas e criar meios para execução utilizando Métodos de Acesso Métricos dentro do motor de execução do SGBD Relacional e posteriormente avaliar possíveis aplicações desses conceitos em sistemas NoSQL. O enfoque será sobre o MAM e o desenvolvimento de seus operadores de recuperação, para que operaçõesfeitas em SGBDs possam ser variadas e otimizadas (não está no escopo do trabalho realizar a integração do MAM no SGBDR). Como resultados, esta tese de mestrado: define e detalha a aplicabilidade de diversas variações de consultas por similaridade; desenvolve um novo MAM, chamado Include-Slim, que permite acelerar essas consultas dentro de um SGBDR; define e desenvolve o novo framework chamado Similarity-Slim, que permite que consultas por similaridade sejam aceleradas e tenham os seus custos financeiros reduzidos quando executados em bases de dados NoSQL em nuvem que utilizam de coleções de documentos; e apresenta dois novos algoritmos para pós-processamento, Slim-Bloat e Slim-Replace, que podem ser aplicados sobre qualquer MAM, para gerar uma estrutura melhor. Os resultados das avaliações realizadas mostram que a Include-Slim pode acelerar as variantes de consultas em até quatro ordens de magnitude e o Similarity-Slim pode reduzir o custo financeiro das consultas em até três ordens de magnitude. Até onde sabemos, este é o primeiro trabalho que trata da aceleração das variantes apresentadas e o primeiro aplicado na redução de custos financeiros em ambientes NoSQL.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2025
- Data da defesa: 28.05.2025
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
SILVA, William Zaniboni. Analysis of variants of similarity retrieval operators in Metric Access Methods. 2025. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2025. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06082025-183402/. Acesso em: 30 dez. 2025. -
APA
Silva, W. Z. (2025). Analysis of variants of similarity retrieval operators in Metric Access Methods (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06082025-183402/ -
NLM
Silva WZ. Analysis of variants of similarity retrieval operators in Metric Access Methods [Internet]. 2025 ;[citado 2025 dez. 30 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06082025-183402/ -
Vancouver
Silva WZ. Analysis of variants of similarity retrieval operators in Metric Access Methods [Internet]. 2025 ;[citado 2025 dez. 30 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06082025-183402/ - Similarity-slim extension: reducing financial and computational costs of similarity queries in document collections in NoSQL databases
- A novel approach to reduce the financial and computational costs of similarity queries over document collections in NoSQL databases
- Analysis of expenses from Brazilian Federal Deputies between 2015 and 2018
- Cosim-Gres: towards similarity queries optimization inside RDBMS
Informações sobre o DOI: 10.11606/D.55.2025.tde-06082025-183402 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
