Indexação Eficiente de Múltiplos Espaços Métricos para Otimização de Consultas por Similaridade (2020)
- Authors:
- Autor USP: ZABOT, GUILHERME FELIPE - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- Subjects: RECUPERAÇÃO DA INFORMAÇÃO; ESPAÇOS MÉTRICOS; PROCESSAMENTO DE IMAGENS; ANÁLISE DE DADOS
- Keywords: Complex data; Correlação de espaços de características; Dados complexos; Feature space correlations; Index; Índices; Métodos de acesso métrico; Metric access method
- Agências de fomento:
- Language: Português
- Abstract: Com o crescente aumento na geração de dados ao longo dos últimos anos, tornou-se necessário a captura e armazenamento de grandes quantidades de dados complexos, como imagens, vídeos e áudios, que exigem ferramentas eficientes e flexíveis quando utilizados na recuperação de informações. Muitas abordagens da literatura para recuperar dados complexos seguem o paradigma de Consultas por similaridade, utilizando Métodos de Acesso Métrico (MAMs) para indexar os dados complexos e acelerar a recuperação de informações. Estes métodos indexam vetores de características, extraídos por meio da aplicação de Métodos de Extração de Características (FEMs), que representam o conteúdo intrínseco existente nos dados complexos, como cor, textura ou forma no caso de imagens. Os MAMs foram inicialmente projetados para indexar recursos de dados complexos usando apenas um FEM por vez, levando os usuários a criar vários índices quando mais de um FEM é utilizado nas consultas. Abordagens recentes que utilizam diferentes representações em uma única estrutura de índice, no geral sofrem com um grande número de cálculos de distância, causado principalmente pelo aumento no número de elementos candidatos gerados na recuperação de informações sobre os multiplos espaços métricos. De forma a solucionar este problema, neste trabalho de mestrado, propomos o MAM Spectra, que indexa dados complexos usando vários FEMs simultaneamente, e tem como objetivo principal, agilizar as consultas por similaridade sobremúltiplas representações de objetos complexos. Além disso, o MAM se baseia nas correlações existentes entre diferentes espaços para escolher os melhores FEMs para responder a cada busca, de forma a obter um espaço de indexação que reduza o número de cálculos de distância e consequentemente o tempo de execução de consultas. Nossos resultados utilizando o Spectra mostram que, para diferentes conjuntos de dados, os espaços métricos que apresentam baixa-correlação, resultam em uma redução significativa do número de elementos presentes no conjunto de elementos candidatos, enquanto preserva a qualidade da busca e reduz o tempo de consulta em até uma ordem de magnitude.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2020
- Data da defesa: 25.09.2020
-
ABNT
ZABOT, Guilherme Felipe. Indexação Eficiente de Múltiplos Espaços Métricos para Otimização de Consultas por Similaridade. 2020. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2020. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-09102020-153743/. Acesso em: 14 out. 2024. -
APA
Zabot, G. F. (2020). Indexação Eficiente de Múltiplos Espaços Métricos para Otimização de Consultas por Similaridade (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-09102020-153743/ -
NLM
Zabot GF. Indexação Eficiente de Múltiplos Espaços Métricos para Otimização de Consultas por Similaridade [Internet]. 2020 ;[citado 2024 out. 14 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-09102020-153743/ -
Vancouver
Zabot GF. Indexação Eficiente de Múltiplos Espaços Métricos para Otimização de Consultas por Similaridade [Internet]. 2020 ;[citado 2024 out. 14 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-09102020-153743/ - Efficient indexing of multiple metric spaces with spectra
- UCORM: indexing uncorrelated metric spaces for concise content-based retrieval of medical images
- FeatSet: a compilation of visual features extracted from public image datasets
- FeatSet+: visual features extracted from public image datasets
- A DBMS-based framework for content-based retrieval and analysis of skin ulcer Images in medical practice
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas