Exportar registro bibliográfico


Metrics:

Audio-based cold-start in music recommendation systems (2022)

  • Authors:
  • Autor USP: BORGES, RODRIGO CARVALHO - IME
  • Unidade: IME
  • Sigla do Departamento: MAC
  • DOI: 10.11606/T.45.2022.tde-14102022-124655
  • Subjects: MÚSICA; SISTEMAS DE RECOMENDAÇÃO; ÁUDIO (MULTIMÍDIA)
  • Keywords: Audio content; Audio-based music recommendation; Cold-start; Conteúdo de áudio; Music recommendation systems
  • Agências de fomento:
  • Language: Inglês
  • Abstract: Plataformas de streaming de música se tornaram populares nas últimas décadas devido ao crescente número de faixas disponíveis on-line. Os catálogos de faixas oferecidos por estas plataformas são, geralmente, muito grandes para serem pesquisados manualmente, e algoritmos de recomendação automática podem ser implementados para ajudar os usuários a navegar nestas plataformas. Mais especificamente, Sistemas de Recomendação Musical (MRS) são projetados para analisar os comportamentos de escuta dos usuários e para prever as músicas que serão tocadas em um futuro próximo por um usuário específico ou dentro de uma sessão de escuta. Mas quando novas faixas são adicionadas a uma plataforma, também conhecido como problema de cold-start, os dados de audição não estão disponíveis e o sistema precisa incorporar estas faixas em seus algoritmos de alguma forma. Neste trabalho, propomos métodos que utilizam o áudio associado às faixas que foram recentemente adicionadas às plataformas de streaming como uma alternativa para compensar a falta de dados de interação. Nossas propostas são elaboradas considerando sistemas de recomendação baseados em Filtragem Colaborativa (CF), em sequências de dados de escuta (SA) e em stream de dados de escuta (SB). Os arquivos de áudio são considerados representados como histogramas de palavra-chave, mel-spectrogramas e formas de onda puras. Em um primeira experimento, propomos um método que aplica Convolutional Neural Networks (CNN) para mapear conteúdo deáudio a um perfil contendo os usuários que ouviram a uma faixa. Em um segundo experimento, Redes Neurais Recorrentes (RNN) são treinadas para reproduzir os conteúdos de áudio associados às próximas faixas dentro de uma sessão de escuta, dado o conteúdo de áudio associado à faixa atual. Uma estrutura de índice invertido é usada para a recuperação de faixas, dado seu conteúdo de áudio de forma eficiente. Em um terceiro experimento, propomos um modelo que mapeia as transições de faixa/faixa para um domínio de áudio utilizando uma cadeia de Markov de vários níveis. O método permite atualizações dinâmicas, permitindo sua aplicação a cenários de intenso fluxo de dados. Os experimentos foram conduzidos utilizando o conjunto de dados de consumo de música LFM-1b, e previews de áudio baixados de Spotify. Nossos métodos apresentaram resultados de previsão competitivos em situações de cold-start no caso de sistemas de recomendação CF e SA. O novo método baseado em fluxo é capaz de recomendar faixas com uma precisão comparável à precisão medida para métodos convencionais baseados em dados de escuta, sendo baseado exclusivamente no conteúdo de áudio
  • Imprenta:
  • Data da defesa: 20.07.2022
  • Acesso à fonteAcesso à fonteDOI
    Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
    • Este artigo possui versão em acesso aberto
    • URL de acesso aberto
    • PDF de acesso aberto
    • Versão do Documento: Versão publicada (Published version)
    • gold Status: Artigo publicado em periódico de acesso aberto (Gold Open Access)

    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      BORGES, Rodrigo Carvalho. Audio-based cold-start in music recommendation systems. 2022. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2022. Disponível em: https://teses.usp.br/teses/disponiveis/45/45134/tde-14102022-124655/. Acesso em: 11 mar. 2026.
    • APA

      Borges, R. C. (2022). Audio-based cold-start in music recommendation systems (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/45/45134/tde-14102022-124655/
    • NLM

      Borges RC. Audio-based cold-start in music recommendation systems [Internet]. 2022 ;[citado 2026 mar. 11 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-14102022-124655/
    • Vancouver

      Borges RC. Audio-based cold-start in music recommendation systems [Internet]. 2022 ;[citado 2026 mar. 11 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-14102022-124655/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2026