Exportar registro bibliográfico


Metrics:

Classificação de áudio musical a partir dos coeficientes da Transformada Wavelet utilizando Redes Neurais Convolucionais (2022)

  • Authors:
  • Autor USP: SANTOS, MILTON DOS - EACH
  • Unidade: EACH
  • DOI: 10.11606/D.100.2022.tde-06032023-141417
  • Subjects: PROCESSAMENTO DE SINAIS; REDES NEURAIS; TRANSFORMADA DE FOURIER
  • Keywords: Coeficientes Wavelet; Convolutional Neural Network; MIR; Rede Neural Convolucional; Transformada Wavelet; Wavelet Coefficient; Wavelet Transform
  • Language: Português
  • Abstract: A identificação do estilo musical a que pertence uma música é uma tarefa relativamente simples para um humano, mesmo com pouco treinamento musical. Entretanto, é uma tarefa bastante difícil de ser realizada de forma automatizada. Neste trabalho utilizamos a Transformada Wavelet, que consegue representar uma música em suas componentes de frequência em função do tempo, gerando uma imagem denominada espectrograma. A partir do espectrograma, geramos imagens para treinar uma Rede Neural Convolucional com o objetivo de classificar os sinais de áudio em seus estilos musicais. Apenas os primeiros 15 segundos de cada música são utilizados para gerar o espectrograma, 6.075 músicas no conjunto de treinamento e 2.025 no conjunto de teste, pertencentes a 10 estilos musicais Blues, Clássico, Country, Disco, Hip Hop, Jazz, Metal, Pop, Reggae e Rock. O procedimento é repetido 10 vezes, com o conjunto de treinamento e teste escolhidos aleatoriamente. A média das taxas de acerto ficou entre 70% e 94%, bem acima dos 10% esperados se a classificação fosse por puro acaso
  • Imprenta:
  • Data da defesa: 21.12.2022
  • Acesso à fonteAcesso à fonteDOI
    Informações sobre o DOI: 10.11606/D.100.2022.tde-06032023-141417 (Fonte: oaDOI API)
    • Este periódico é de acesso aberto
    • Este artigo NÃO é de acesso aberto

    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      SANTOS, Milton dos. Classificação de áudio musical a partir dos coeficientes da Transformada Wavelet utilizando Redes Neurais Convolucionais. 2022. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2022. Disponível em: https://www.teses.usp.br/teses/disponiveis/100/100132/tde-06032023-141417/. Acesso em: 28 fev. 2026.
    • APA

      Santos, M. dos. (2022). Classificação de áudio musical a partir dos coeficientes da Transformada Wavelet utilizando Redes Neurais Convolucionais (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/100/100132/tde-06032023-141417/
    • NLM

      Santos M dos. Classificação de áudio musical a partir dos coeficientes da Transformada Wavelet utilizando Redes Neurais Convolucionais [Internet]. 2022 ;[citado 2026 fev. 28 ] Available from: https://www.teses.usp.br/teses/disponiveis/100/100132/tde-06032023-141417/
    • Vancouver

      Santos M dos. Classificação de áudio musical a partir dos coeficientes da Transformada Wavelet utilizando Redes Neurais Convolucionais [Internet]. 2022 ;[citado 2026 fev. 28 ] Available from: https://www.teses.usp.br/teses/disponiveis/100/100132/tde-06032023-141417/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2026