Detecção de atividade vocal empregando máquinas de Boltzmann restritas (2016)
- Authors:
- Autor USP: BORIN, ROGÉRIO GUERRA - EP
- Unidade: EP
- Sigla do Departamento: PSI
- Subjects: INTELIGÊNCIA ARTIFICIAL; PROCESSAMENTO DE SOM; PROCESSAMENTO DE SINAIS; TELEFONIA
- Language: Português
- Abstract: Neste trabalho, uma versão de RBM (Restricted Boltzmann Machine) tendo uma camada de classificação é adaptada a fim de permitir o seu uso com dados definidos num domínio contínuo. Essa adaptação dá origem a uma variante do modelo para o qual são desenvolvidas as regras de atualização de parâmetros dos treinamentos discriminativo, generativo e híbrido. A aplicação da variante como classificador no problema de VAD (Voice Activity Detection) é então investigada. Por meio de simulações envolvendo o corpus NOIZEUS e empregando como entradas do classificador tanto MFCCs (Mel-Frequency Cepstral Coefficients) quanto FBEs (Filter-Bank Energies), são obtidos resultados comparáveis aos de detectores considerados como estado da arte, com um menor custo computacional. A variante de RBM é comparada também com as SVMs (Support Vector Machines) lineares e com núcleo gaussiano. Com treinamento discriminativo, a RBM fornece desempenhos intermediários entre as duas versões de SVM, porém um custo computacional que é consideravelmente inferior aos de ambas. Adicionalmente, um conjunto de medidas do áudio que tiveram seu uso em VAD proposto recentemente são avaliadas com o emprego da RBM com treinamento discriminativo. Embora os resultados não sejam conclusivos, os desempenhos conseguidos indicam que essas medidas não são vantajosas quando comparadas com os tradicionais MFCCs.
- Imprenta:
- Data da defesa: 06.12.2016
-
ABNT
BORIN, Rogério Guerra. Detecção de atividade vocal empregando máquinas de Boltzmann restritas. 2016. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2016. Disponível em: http://www.teses.usp.br/teses/disponiveis/3/3142/tde-23012017-141914/. Acesso em: 28 mar. 2024. -
APA
Borin, R. G. (2016). Detecção de atividade vocal empregando máquinas de Boltzmann restritas (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/3/3142/tde-23012017-141914/ -
NLM
Borin RG. Detecção de atividade vocal empregando máquinas de Boltzmann restritas [Internet]. 2016 ;[citado 2024 mar. 28 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3142/tde-23012017-141914/ -
Vancouver
Borin RG. Detecção de atividade vocal empregando máquinas de Boltzmann restritas [Internet]. 2016 ;[citado 2024 mar. 28 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3142/tde-23012017-141914/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas