Desenvolvimento de um modelo de reconhecimento de voz para o português brasileiro com poucos dados utilizando o Wav2vec 2.0 (2021)
- Authors:
- Autor USP: CASANOVA, EDRESSON - ICMC
- Unidade: ICMC
- DOI: 10.5753/bresci.2021.15798
- Subjects: RECONHECIMENTO DA FALA; APRENDIZADO COMPUTACIONAL; REDES NEURAIS; PORTUGUÊS DO BRASIL
- Keywords: reconhecimento automático de voz; aprendizado profundo
- Language: Português
- Imprenta:
- Publisher: SBC
- Publisher place: Porto Alegre
- Date published: 2021
- Source:
- Conference titles: Congresso da Sociedade Brasileira de Computação - CSBC
- Status:
- Artigo publicado em periódico de acesso aberto (Gold Open Access)
- Versão do Documento:
- Versão publicada (Published version)
- Acessar versão aberta:
-
ABNT
GRIS, Lucas Rafael Stefanel et al. Desenvolvimento de um modelo de reconhecimento de voz para o português brasileiro com poucos dados utilizando o Wav2vec 2.0. 2021, Anais.. Porto Alegre: SBC, 2021. Disponível em: https://doi.org/10.5753/bresci.2021.15798. Acesso em: 30 mar. 2026. -
APA
Gris, L. R. S., Casanova, E., Oliveira, F. S. de, Soares, A. da S., & Candido Junior, A. (2021). Desenvolvimento de um modelo de reconhecimento de voz para o português brasileiro com poucos dados utilizando o Wav2vec 2.0. In Anais. Porto Alegre: SBC. doi:10.5753/bresci.2021.15798 -
NLM
Gris LRS, Casanova E, Oliveira FS de, Soares A da S, Candido Junior A. Desenvolvimento de um modelo de reconhecimento de voz para o português brasileiro com poucos dados utilizando o Wav2vec 2.0 [Internet]. Anais. 2021 ;[citado 2026 mar. 30 ] Available from: https://doi.org/10.5753/bresci.2021.15798 -
Vancouver
Gris LRS, Casanova E, Oliveira FS de, Soares A da S, Candido Junior A. Desenvolvimento de um modelo de reconhecimento de voz para o português brasileiro com poucos dados utilizando o Wav2vec 2.0 [Internet]. Anais. 2021 ;[citado 2026 mar. 30 ] Available from: https://doi.org/10.5753/bresci.2021.15798 - Brazilian portuguese speech recognition using Wav2vec 2.0
- BibleTTS: a large, high-fidelity, multilingual, and uniquely African speech corpus
- Síntese de fala aplicada à geração de conjunto de dados para reconhecimento automático de fala
- Evaluating sentence segmentation in different datasets of neuropsychological language tests in brazilian portuguese
- Deep learning approaches for speech synthesis and speaker verification
- YourTTS: towards zero-shot multi-speaker TTS and zero-shot voice conversion for everyone
- Overview of the Automatic Speech Recognition for Spontaneous and Prepared Speech & Speech Emotion Recognition in Portuguese (SE&R) shared-tasks at PROPOR 2022
- ASR data augmentation in low-resource settings using cross-lingual multi-speaker TTS and cross-lingual voice conversion
- TTS applied to the generation of datasets for automatic speech recognition
- Evaluating semantic similarity methods to build semantic predictability norms of reading data
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| 3143859.pdf | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
