Detecção de voz cantada em sinais de áudio polifônicos (2020)
- Authors:
- Autor USP: CORRÊA, SHAYENNE LUZ MOURA - IME
- Unidade: IME
- Sigla do Departamento: MAC
- DOI: 10.11606/D.45.2020.tde-04112020-095115
- Subjects: APRENDIZADO COMPUTACIONAL; COMPUTAÇÃO MUSICAL
- Keywords: Computer music; Detecção de voz cantada; Machine learning; Music information retrieval; Recuperação de informação musical; Representações aprendidas automaticamente; Representation learning; Singing voice detection
- Agências de fomento:
- Language: Português
- Abstract: Detecção de voz cantada em sinais de áudio polifônicos é o problema que trata de determinar quais trechos de um sinal musical com diversas fontes sonoras contêm voz cantada. Este é um tópico de pesquisa ativo na área de Recuperação de Informação Musical (MIR) e possui muitas aplicações, incluindo reconhecimento automático de cantor, alinhamento de letra e música, separação de voz cantada e extração de melodias. Neste projeto, o problema de detecção de voz cantada é abordado através do levantamento das técnicas utilizadas na literatura, com o desenvolvimento de um sistema capaz de classificar os segmentos de sinais de áudio em duas classes (os trechos que contêm e os trechos que não contêm voz cantada) e também pela comparação dos resultados de detecção de voz cantada utilizando ferramentas baseadas em aprendizado profundo. Os objetivos gerais são: apresentar a revisão da literatura e construir experimentos a fim de analisar os métodos de classificação e descritores de áudio. Os objetivos específicos são: avaliar as restrições presentes na classificação dos trechos cantados, usar descritores de áudio baseados em aprendizado profundo ainda não aplicados na tarefa e comparar o uso de métodos tradicionais de aprendizado de máquina com as possibilidades apresentadas pelas representações aprendidas automaticamente. A partir de uma série de experimentos, enfrentamos a complexidade do tema e as limitações apresentadas por descritores comumente usados. Ao usar um descritor baseado emaprendizado profundo, observa-se espaço para melhorias na abordagem clássica de aprendizado de máquinas baseada na seleção e combinação de representações tradicionais dos dados musicais na entrada dos algoritmos de aprendizado
- Imprenta:
- Data da defesa: 01.10.2020
- Status:
- Artigo publicado em periódico de acesso aberto (Gold Open Access)
- Versão do Documento:
- Versão publicada (Published version)
- Acessar versão aberta:
-
ABNT
CORRÊA, Shayenne Luz Moura. Detecção de voz cantada em sinais de áudio polifônicos. 2020. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2020. Disponível em: https://teses.usp.br/teses/disponiveis/45/45134/tde-04112020-095115/. Acesso em: 02 abr. 2026. -
APA
Corrêa, S. L. M. (2020). Detecção de voz cantada em sinais de áudio polifônicos (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/45/45134/tde-04112020-095115/ -
NLM
Corrêa SLM. Detecção de voz cantada em sinais de áudio polifônicos [Internet]. 2020 ;[citado 2026 abr. 02 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-04112020-095115/ -
Vancouver
Corrêa SLM. Detecção de voz cantada em sinais de áudio polifônicos [Internet]. 2020 ;[citado 2026 abr. 02 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-04112020-095115/ - Instrumental sensibility of vocal detector based on spectral features
- Sensitivity to instrumentation of a singing voice detector based on spectral features
- Processamento e transcrição de voz em língua portuguesa voltado para assistente inteligente
- Toward development of A.D.A. - Advanced Distributed Assistant
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
