Music representation learning based on heterogeneous graph (2024)
- Authors:
- Autor USP: SILVA, ANGELO CESAR MENDES DA - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- DOI: 10.11606/T.55.2024.tde-24012025-150432
- Subjects: APRENDIZADO COMPUTACIONAL; MÚSICA; MINERAÇÃO DE DADOS; INTELIGÊNCIA ARTIFICIAL
- Keywords: Graph neural networks; Heterogeneous network; Music information retrieval; Recuperação de informação musical; Redes heterogêneas; Redes neurais para grafos; Representation learning
- Agências de fomento:
- Language: Inglês
- Abstract: A música esteve presente em diversos momentos históricos desde a formação da sociedade, acompanhando tarefas de sobrevivência à tarefas de lazer. Em momentos atuais, o surgimento e popularização de mídias com recursos para armazenamento e reprodução musical introduziram ainda mais a presença da música no cotidiano das pessoas. Além do conteúdo artístico, as músicas também começaram a gerar volumes de dados e novos mercados interessados. Neste sentido, diversos métodos de mineração de dados musicais foram propostos nas últimas décadas com objetivo de extrair informações que apoiem tomadas de decisões. Para que possam ser utilizados em algoritmos de mineração de dados, é essencial definir uma representação para tais dados. Dados musicais são intrinsecamente multimodais e heterogêneos, de forma que, para representá-los, deve-se construir uma estrutura unificada que suporte características com diferentes composições semânticas e dispostas em espaços distintos. Algumas abordagens foram propostas na literatura visando explorar variações de processos de fusões de características. No entanto, devido à formação multimodal e heterogênea, as abordagens existentes baseadas em métodos de fusão possuem restrições em cenários em que há falta de características e podem ser reduzidas a representações unimodais, reduzindo a diversidade de conteúdo musical em sua formação. Assim, os desafios em definir representações musicais estão associados à falta de informações nos dados, por restrições deacesso ou modalidades incompletas, e a construção de um método que agregue informações heterogêneas em um espaço unificado. Esta tese se concentra tanto no desenvolvimento de representações heterogêneas para dados musicais que suportem a composição natural de dados musicais quanto métodos de aprendizado de representação capazes de lidar com tarefas relacionadas à área de recuperação de informação musical. Nós investigamos o uso de redes heterogêneas para estruturar dados musicais e sua introdução em métodos de aprendizado de representação baseados em grafos. Em especial, as contribuições desta tese estão relacionadas com as tarefas de anotação automática, reconhecimento de emoções em músicas, predição de similaridade entre artistas e uma aplicação multi-tarefa. Em resumo, as contribuições podem ser sintetizadas em: (i) uma metodologia para modelagem de dados musicais em redes heterogêneas; (ii) um algoritmo baseado em propagação de informação para lidar com o desafio falta de características nos dados; (iii) métodos baseados em redes neurais para grafos para lidar com as tarefas de recuperação de informação musical; (iv) análises relacionadas à complementaridade de informação entre múltiplas características musicais e também tarefas relacionadas.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2024
- Data da defesa: 30.09.2024
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
SILVA, Angelo Cesar Mendes da. Music representation learning based on heterogeneous graph. 2024. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2024. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-24012025-150432/. Acesso em: 31 dez. 2025. -
APA
Silva, A. C. M. da. (2024). Music representation learning based on heterogeneous graph (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-24012025-150432/ -
NLM
Silva ACM da. Music representation learning based on heterogeneous graph [Internet]. 2024 ;[citado 2025 dez. 31 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-24012025-150432/ -
Vancouver
Silva ACM da. Music representation learning based on heterogeneous graph [Internet]. 2024 ;[citado 2025 dez. 31 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-24012025-150432/ - On the use of Query by Committee for Human-in-the-Loop Named Entity Recognition
- Multimodal representation learning over heterogeneous networks for tag-based music retrieval
- 4MuLA: a multitask, multimodal, and multilingual dataset of music lyrics and audio features
- Heterogeneous graph neural network for music emotion recognition
- Artist similarity based on heterogeneous graph neural networks
- Unsupervised heterogeneous graph neural network for hit song prediction through one class learning
- Cluster fusion training: exploring cluster analysis to enhance cross-domain sentiment classification
- Influence of data stratification criteria on fairer classifications
- Unfairness in machine learning for web systems applications
- Data stratification analysis on the propagation of discriminatory effects in binary classification
Informações sobre o DOI: 10.11606/T.55.2024.tde-24012025-150432 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
