Detecção de voz cantada em sinais de áudio polifônicos (2020)
- Authors:
- Autor USP: CORRÊA, SHAYENNE LUZ MOURA - IME
- Unidade: IME
- Sigla do Departamento: MAC
- Subjects: APRENDIZADO COMPUTACIONAL; COMPUTAÇÃO MUSICAL
- Keywords: Computer music; Detecção de voz cantada; Machine learning; Music information retrieval; Recuperação de informação musical; Representações aprendidas automaticamente; Representation learning; Singing voice detection
- Agências de fomento:
- Language: Português
- Abstract: Detecção de voz cantada em sinais de áudio polifônicos é o problema que trata de determinar quais trechos de um sinal musical com diversas fontes sonoras contêm voz cantada. Este é um tópico de pesquisa ativo na área de Recuperação de Informação Musical (MIR) e possui muitas aplicações, incluindo reconhecimento automático de cantor, alinhamento de letra e música, separação de voz cantada e extração de melodias. Neste projeto, o problema de detecção de voz cantada é abordado através do levantamento das técnicas utilizadas na literatura, com o desenvolvimento de um sistema capaz de classificar os segmentos de sinais de áudio em duas classes (os trechos que contêm e os trechos que não contêm voz cantada) e também pela comparação dos resultados de detecção de voz cantada utilizando ferramentas baseadas em aprendizado profundo. Os objetivos gerais são: apresentar a revisão da literatura e construir experimentos a fim de analisar os métodos de classificação e descritores de áudio. Os objetivos específicos são: avaliar as restrições presentes na classificação dos trechos cantados, usar descritores de áudio baseados em aprendizado profundo ainda não aplicados na tarefa e comparar o uso de métodos tradicionais de aprendizado de máquina com as possibilidades apresentadas pelas representações aprendidas automaticamente. A partir de uma série de experimentos, enfrentamos a complexidade do tema e as limitações apresentadas por descritores comumente usados. Ao usar um descritor baseado emaprendizado profundo, observa-se espaço para melhorias na abordagem clássica de aprendizado de máquinas baseada na seleção e combinação de representações tradicionais dos dados musicais na entrada dos algoritmos de aprendizado
- Imprenta:
- Data da defesa: 01.10.2020
-
ABNT
CORRÊA, Shayenne Luz Moura. Detecção de voz cantada em sinais de áudio polifônicos. 2020. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2020. Disponível em: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-04112020-095115/. Acesso em: 07 maio 2025. -
APA
Corrêa, S. L. M. (2020). Detecção de voz cantada em sinais de áudio polifônicos (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/45/45134/tde-04112020-095115/ -
NLM
Corrêa SLM. Detecção de voz cantada em sinais de áudio polifônicos [Internet]. 2020 ;[citado 2025 maio 07 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-04112020-095115/ -
Vancouver
Corrêa SLM. Detecção de voz cantada em sinais de áudio polifônicos [Internet]. 2020 ;[citado 2025 maio 07 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-04112020-095115/ - Instrumental sensibility of vocal detector based on spectral features
- Sensitivity to instrumentation of a singing voice detector based on spectral features
- Processamento e transcrição de voz em língua portuguesa voltado para assistente inteligente
- Toward development of A.D.A. - Advanced Distributed Assistant
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas