Brazilian portuguese speech recognition using Wav2vec 2.0 (2022)
- Authors:
- Gris, Lucas Rafael Stefanel - Universidade Tecnológica Federal do Paraná (UTFPR)
- Casanova, Edresson
- Oliveira, Frederico Santos de - Universidade Federal de Mato Grosso (UFMT)
- Soares, Anderson da Silva - Universidade Federal de Goiás (UFG)
- Candido Junior, Arnaldo - Universidade Tecnológica Federal do Paraná (UTFPR)
- Gris, Lucas Rafael Stefanel - Universidade Tecnológica Federal do Paraná (UTFPR)
- Autor USP: CASANOVA, EDRESSON - ICMC
- Unidade: ICMC
- DOI: 10.1007/978-3-030-98305-5_31
- Subjects: RECONHECIMENTO DA FALA; APRENDIZADO COMPUTACIONAL; PORTUGUÊS DO BRASIL
- Keywords: Speech recognition; Wav2vec 2.0
- Agências de fomento:
- Language: Inglês
- Imprenta:
- Source:
- Título do periódico: Lecture Notes in Artificial Intelligence
- ISSN: 0302-9743
- Volume/Número/Paginação/Ano: v. 13208, p. 333-343, 2022
- Conference titles: International Conference on Computational Processing of the Portuguese Language - PROPOR
- Este periódico é de assinatura
- Este artigo NÃO é de acesso aberto
- Cor do Acesso Aberto: closed
-
ABNT
GRIS, Lucas Rafael Stefanel et al. Brazilian portuguese speech recognition using Wav2vec 2.0. Lecture Notes in Artificial Intelligence. Cham: Springer. Disponível em: https://doi.org/10.1007/978-3-030-98305-5_31. Acesso em: 01 jul. 2024. , 2022 -
APA
Gris, L. R. S., Casanova, E., Oliveira, F. S. de, Soares, A. da S., & Candido Junior, A. (2022). Brazilian portuguese speech recognition using Wav2vec 2.0. Lecture Notes in Artificial Intelligence. Cham: Springer. doi:10.1007/978-3-030-98305-5_31 -
NLM
Gris LRS, Casanova E, Oliveira FS de, Soares A da S, Candido Junior A. Brazilian portuguese speech recognition using Wav2vec 2.0 [Internet]. Lecture Notes in Artificial Intelligence. 2022 ; 13208 333-343.[citado 2024 jul. 01 ] Available from: https://doi.org/10.1007/978-3-030-98305-5_31 -
Vancouver
Gris LRS, Casanova E, Oliveira FS de, Soares A da S, Candido Junior A. Brazilian portuguese speech recognition using Wav2vec 2.0 [Internet]. Lecture Notes in Artificial Intelligence. 2022 ; 13208 333-343.[citado 2024 jul. 01 ] Available from: https://doi.org/10.1007/978-3-030-98305-5_31 - Síntese de fala aplicada à geração de conjunto de dados para reconhecimento automático de fala
- BibleTTS: a large, high-fidelity, multilingual, and uniquely African speech corpus
- Desenvolvimento de um modelo de reconhecimento de voz para o português brasileiro com poucos dados utilizando o Wav2vec 2.0
- Overview of the Automatic Speech Recognition for Spontaneous and Prepared Speech & Speech Emotion Recognition in Portuguese (SE&R) shared-tasks at PROPOR 2022
- Deep learning approaches for speech synthesis and speaker verification
- YourTTS: towards zero-shot multi-speaker TTS and zero-shot voice conversion for everyone
- Evaluating sentence segmentation in different datasets of neuropsychological language tests in brazilian portuguese
- SC-GlowTTS: an efficient zero-shot multi-speaker text-to-speech model
- ASR data augmentation in low-resource settings using cross-lingual multi-speaker TTS and cross-lingual voice conversion
- TTS applied to the generation of datasets for automatic speech recognition
Informações sobre o DOI: 10.1007/978-3-030-98305-5_31 (Fonte: oaDOI API)
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
3143873.pdf |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas