ORTree: Aumentando a eficiência de buscas por similaridade diversificadas por meio de particionamento de dados (2022)
- Authors:
- Autor USP: NOVAES, JOÃO VICTOR DE OLIVEIRA - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- DOI: 10.11606/D.55.2022.tde-09022023-114906
- Subjects: BANCO DE DADOS; ALGORITMOS GENÉTICOS; DADOS CINÉTICOS
- Keywords: Busca em espaços métricos; Busca por similaridade com diversidade; Buscas por similaridade; Métodos de acesso métrico; Metric access methods; Query in metric spaces; Similarity queries; Similarity with diversity queries
- Agências de fomento:
- Language: Português
- Abstract: A complexidade dos dados aumenta conforme as aplicações vão evoluindo, sendo sempre necessário desenvolver novas técnicas para o seu armazenamento e recuperação. Neste sentido, as buscas por similaridade têm se mostrado uma das melhores formas de se comparar/recuperar dados complexos. Contudo, ao serem aplicados em grandes conjuntos de dados, os operadores fundamentais de busca por similaridade têm sua expressividade reduzida, e os elementos recuperados tendem a ser muito similares entre si. Para solucionar este problema, vários pesquisadores têm considerado a inclusão de diversidade nas buscas por similaridade. O objetivo deste tipo de busca é encontrar um conjunto de elementos que sejam similares ao elemento de consulta ao mesmo tempo que sejam o mais diversos possível entre si. Enquanto uma busca por similaridade pode ser feita de forma simples, uma busca por similaridade com diversidade tende a ser mais complexa, pois se torna necessário comparar os elementos da resposta entre si e, portanto executar um número maior de comparações, o que torna a busca mais lenta e custosa. Na literatura são encontradas abordagens que visam reduzir os custo dessas buscas, uma delas é a de selecionar elementos candidatos. Neste caso, ao invés de utilizar todos elementos do conjunto de dados, apenas uma pequena amostra do conjunto é de fato utilizada pelos algoritmos de diversidade. O foco principal dessa dissertação é desenvolver abordagens de seleção de candidatos que sejam escaláveis eque permitam selecionar elementos candidatos de alta qualidade. Neste sentido, são apresentadas: uma nova estrutura de indexação baseada em particionamento hierárquico de dados; e três abordagens de seleção de elementos candidatos, que utilizam o particionamento gerado pela estrutura para encontrar de forma rápida elementos candidatos adequados.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2022
- Data da defesa: 25.11.2022
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
NOVAES, João Victor de Oliveira. ORTree: Aumentando a eficiência de buscas por similaridade diversificadas por meio de particionamento de dados. 2022. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2022. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-09022023-114906/. Acesso em: 25 jul. 2024. -
APA
Novaes, J. V. de O. (2022). ORTree: Aumentando a eficiência de buscas por similaridade diversificadas por meio de particionamento de dados (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-09022023-114906/ -
NLM
Novaes JV de O. ORTree: Aumentando a eficiência de buscas por similaridade diversificadas por meio de particionamento de dados [Internet]. 2022 ;[citado 2024 jul. 25 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-09022023-114906/ -
Vancouver
Novaes JV de O. ORTree: Aumentando a eficiência de buscas por similaridade diversificadas por meio de particionamento de dados [Internet]. 2022 ;[citado 2024 jul. 25 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-09022023-114906/ - ORTree: tuning diversified similarity queries by means of data partitioning
- J-EDA: a workbench for tuning similarity and diversity search parameters in content-based image retrieval
- J-EDA: a diversified similarity workbench for content-based image retrieval
- Analysis of ENEM's attendants between 2012 and 2017 using a clustering approach
Informações sobre o DOI: 10.11606/D.55.2022.tde-09022023-114906 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas