Exportar registro bibliográfico


Metrics:

Methods to improve the semantics of similarity search, diversity and data summarization based on the tourist walk concept (2019)

  • Authors:
  • Autor USP: OLIVA, SAMUEL ZANFERDINI - Interunidades em Bioengenharia
  • Unidade: Interunidades em Bioengenharia
  • Sigla do Departamento: Programa Interunidades em Bioengenharia: EESC/FMRP/IQSC-USP
  • DOI: 10.11606/T.82.2019.tde-29102021-174335
  • Subjects: RECUPERAÇÃO DA INFORMAÇÃO; AMOSTRAGEM; SEMÂNTICA; BASES DE DADOS
  • Keywords: Amostragem de dados; Buscas por similaridade; Caminhada do turista; Diversificação de resultados de consultas; Recuperação de imagens baseada em conteúdo; Sumarização de dados
  • Language: Inglês
  • Abstract: Devido ao grande aumento da quantidade e variedade de dados ocorrido recentemente, diversas abordagens buscando a eficiência para lidar com o armazenamento e a recuperação de dados têm sido propostas na literatura, dentre elas as que estudam recuperação baseada em similaridade e as que consideram a diversificação de resultados. Do mesmo modo, diferentes métodos têm sido propostos a fim de realizar a sumarização de dados, com a finalidade de selecionar amostras representativas das bases. Neste trabalho, métodos para buscas por similaridade, diversificação de consultas e sumarização de dados são propostos, implementados e avaliados. Esse desenvolvimento tem como referência a heurística da caminhada turista, a qual consiste de um caminhante percorrendo um conjunto de pontos dentro de um espaço multidimensional. Assim, são propostas três abordagens: a primeira consiste do método SimWalk, para realizar buscas por similaridade; a segunda proposta corresponde ao método DivWalk, cuja finalidade é construir conjuntos resultantes de buscas considerando elementos diversificados; a terceira apresenta o método SummarizationWalk, para realizar a sumarização de bases de dados, considerando o volume e a quantidade de elementos por agrupamentos de elementos de dados. As abordagens foram desenvolvidas e testadas com bases de dados artificiais e reais. Nos experimentos conduzidos, o SimWalk apresentou maior precisão, quando comparado com os métodos tradicionais de recuperação por similaridade.O DivWalk apresentou maiores variâncias nos resultados, demonstrando que este método produz uma melhor distribuição dos dados nas bases. O SummarizationWalk apresentou melhores resultados na recuperação de subconjuntos, considerando as métricas de elementos selecionados em relação ao volume e à quantidade de elementos por agrupamentos das bases. Os estudos aqui apresentados mostram que os métodos propostos para buscas por similaridade, diversificação de consultas e sumarização de dados representam uma otimização em relação ao estado da arte, consistindo, assim, de contribuições para a área de recuperação de dados
  • Imprenta:
  • Data da defesa: 13.11.2019
  • Acesso à fonteAcesso à fonteDOI
    Informações sobre o DOI: 10.11606/T.82.2019.tde-29102021-174335 (Fonte: oaDOI API)
    • Este periódico é de acesso aberto
    • Este artigo NÃO é de acesso aberto

    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      OLIVA, Samuel Zanferdini. Methods to improve the semantics of similarity search, diversity and data summarization based on the tourist walk concept. 2019. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2019. Disponível em: https://www.teses.usp.br/teses/disponiveis/82/82131/tde-29102021-174335/. Acesso em: 10 fev. 2026.
    • APA

      Oliva, S. Z. (2019). Methods to improve the semantics of similarity search, diversity and data summarization based on the tourist walk concept (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/82/82131/tde-29102021-174335/
    • NLM

      Oliva SZ. Methods to improve the semantics of similarity search, diversity and data summarization based on the tourist walk concept [Internet]. 2019 ;[citado 2026 fev. 10 ] Available from: https://www.teses.usp.br/teses/disponiveis/82/82131/tde-29102021-174335/
    • Vancouver

      Oliva SZ. Methods to improve the semantics of similarity search, diversity and data summarization based on the tourist walk concept [Internet]. 2019 ;[citado 2026 fev. 10 ] Available from: https://www.teses.usp.br/teses/disponiveis/82/82131/tde-29102021-174335/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2026