Classificação de áudio musical a partir dos coeficientes da Transformada Wavelet utilizando Redes Neurais Convolucionais (2022)
- Authors:
- Autor USP: SANTOS, MILTON DOS - EACH
- Unidade: EACH
- DOI: 10.11606/D.100.2022.tde-06032023-141417
- Subjects: PROCESSAMENTO DE SINAIS; REDES NEURAIS; TRANSFORMADA DE FOURIER
- Keywords: Coeficientes Wavelet; Convolutional Neural Network; MIR; Rede Neural Convolucional; Transformada Wavelet; Wavelet Coefficient; Wavelet Transform
- Language: Português
- Abstract: A identificação do estilo musical a que pertence uma música é uma tarefa relativamente simples para um humano, mesmo com pouco treinamento musical. Entretanto, é uma tarefa bastante difícil de ser realizada de forma automatizada. Neste trabalho utilizamos a Transformada Wavelet, que consegue representar uma música em suas componentes de frequência em função do tempo, gerando uma imagem denominada espectrograma. A partir do espectrograma, geramos imagens para treinar uma Rede Neural Convolucional com o objetivo de classificar os sinais de áudio em seus estilos musicais. Apenas os primeiros 15 segundos de cada música são utilizados para gerar o espectrograma, 6.075 músicas no conjunto de treinamento e 2.025 no conjunto de teste, pertencentes a 10 estilos musicais Blues, Clássico, Country, Disco, Hip Hop, Jazz, Metal, Pop, Reggae e Rock. O procedimento é repetido 10 vezes, com o conjunto de treinamento e teste escolhidos aleatoriamente. A média das taxas de acerto ficou entre 70% e 94%, bem acima dos 10% esperados se a classificação fosse por puro acaso
- Imprenta:
- Data da defesa: 21.12.2022
- Este periódico é de acesso aberto
- Este artigo NÃO é de acesso aberto
-
ABNT
SANTOS, Milton dos. Classificação de áudio musical a partir dos coeficientes da Transformada Wavelet utilizando Redes Neurais Convolucionais. 2022. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2022. Disponível em: https://www.teses.usp.br/teses/disponiveis/100/100132/tde-06032023-141417/. Acesso em: 28 fev. 2026. -
APA
Santos, M. dos. (2022). Classificação de áudio musical a partir dos coeficientes da Transformada Wavelet utilizando Redes Neurais Convolucionais (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/100/100132/tde-06032023-141417/ -
NLM
Santos M dos. Classificação de áudio musical a partir dos coeficientes da Transformada Wavelet utilizando Redes Neurais Convolucionais [Internet]. 2022 ;[citado 2026 fev. 28 ] Available from: https://www.teses.usp.br/teses/disponiveis/100/100132/tde-06032023-141417/ -
Vancouver
Santos M dos. Classificação de áudio musical a partir dos coeficientes da Transformada Wavelet utilizando Redes Neurais Convolucionais [Internet]. 2022 ;[citado 2026 fev. 28 ] Available from: https://www.teses.usp.br/teses/disponiveis/100/100132/tde-06032023-141417/
Informações sobre o DOI: 10.11606/D.100.2022.tde-06032023-141417 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
