Desenvolvimento de um modelo de reconhecimento de voz para o português brasileiro com poucos dados utilizando o Wav2vec 2.0 (2021)
- Authors:
- Autor USP: CASANOVA, EDRESSON - ICMC
- Unidade: ICMC
- DOI: 10.5753/bresci.2021.15798
- Subjects: RECONHECIMENTO DA FALA; APRENDIZADO COMPUTACIONAL; REDES NEURAIS; PORTUGUÊS DO BRASIL
- Keywords: reconhecimento automático de voz; aprendizado profundo
- Language: Português
- Imprenta:
- Publisher: SBC
- Publisher place: Porto Alegre
- Date published: 2021
- Source:
- Conference titles: Congresso da Sociedade Brasileira de Computação - CSBC
- Este periódico é de assinatura
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: bronze
-
ABNT
GRIS, Lucas Rafael Stefanel et al. Desenvolvimento de um modelo de reconhecimento de voz para o português brasileiro com poucos dados utilizando o Wav2vec 2.0. 2021, Anais.. Porto Alegre: SBC, 2021. Disponível em: https://doi.org/10.5753/bresci.2021.15798. Acesso em: 29 dez. 2025. -
APA
Gris, L. R. S., Casanova, E., Oliveira, F. S. de, Soares, A. da S., & Candido Junior, A. (2021). Desenvolvimento de um modelo de reconhecimento de voz para o português brasileiro com poucos dados utilizando o Wav2vec 2.0. In Anais. Porto Alegre: SBC. doi:10.5753/bresci.2021.15798 -
NLM
Gris LRS, Casanova E, Oliveira FS de, Soares A da S, Candido Junior A. Desenvolvimento de um modelo de reconhecimento de voz para o português brasileiro com poucos dados utilizando o Wav2vec 2.0 [Internet]. Anais. 2021 ;[citado 2025 dez. 29 ] Available from: https://doi.org/10.5753/bresci.2021.15798 -
Vancouver
Gris LRS, Casanova E, Oliveira FS de, Soares A da S, Candido Junior A. Desenvolvimento de um modelo de reconhecimento de voz para o português brasileiro com poucos dados utilizando o Wav2vec 2.0 [Internet]. Anais. 2021 ;[citado 2025 dez. 29 ] Available from: https://doi.org/10.5753/bresci.2021.15798 - Brazilian portuguese speech recognition using Wav2vec 2.0
- Síntese de fala aplicada à geração de conjunto de dados para reconhecimento automático de fala
- BibleTTS: a large, high-fidelity, multilingual, and uniquely African speech corpus
- Overview of the Automatic Speech Recognition for Spontaneous and Prepared Speech & Speech Emotion Recognition in Portuguese (SE&R) shared-tasks at PROPOR 2022
- Deep learning approaches for speech synthesis and speaker verification
- YourTTS: towards zero-shot multi-speaker TTS and zero-shot voice conversion for everyone
- Evaluating sentence segmentation in different datasets of neuropsychological language tests in brazilian portuguese
- SC-GlowTTS: an efficient zero-shot multi-speaker text-to-speech model
- ASR data augmentation in low-resource settings using cross-lingual multi-speaker TTS and cross-lingual voice conversion
- Speech2Phone: a novel and efficient method for training speaker recognition models
Informações sobre o DOI: 10.5753/bresci.2021.15798 (Fonte: oaDOI API)
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| 3143859.pdf | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
