SC-GlowTTS: an efficient zero-shot multi-speaker text-to-speech model (2021)
- Authors:
- USP affiliated authors: ALUISIO, SANDRA MARIA - ICMC ; PONTI, MOACIR ANTONELLI - ICMC ; CASANOVA, EDRESSON - ICMC
- Unidade: ICMC
- DOI: 10.21437/Interspeech.2021-1774
- Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; REDES NEURAIS; RECONHECIMENTO DE TEXTO; RECONHECIMENTO DE VOZ
- Keywords: zero-shot multi-speaker TTS; text-to-speech; multi-speaker modeling; zero-shot voice conversion
- Agências de fomento:
- Language: Inglês
- Imprenta:
- Source:
- Título: Proceedings
- Conference titles: Annual Conference of the International Speech Communication Association - INTERSPEECH
- Status:
- Artigo possui versão em acesso aberto em repositório (Green Open Access)
- Versão do Documento:
- Versão submetida (Pré-print)
- Acessar versão aberta:
-
ABNT
CASANOVA, Edresson et al. SC-GlowTTS: an efficient zero-shot multi-speaker text-to-speech model. 2021, Anais.. Baixas: ISCA, 2021. Disponível em: https://doi.org/10.21437/Interspeech.2021-1774. Acesso em: 01 abr. 2026. -
APA
Casanova, E., Shulby, C. D., Gölge, E., Müller, N. M., Oliveira, F. S. de, Candido Junior, A., et al. (2021). SC-GlowTTS: an efficient zero-shot multi-speaker text-to-speech model. In Proceedings. Baixas: ISCA. doi:10.21437/Interspeech.2021-1774 -
NLM
Casanova E, Shulby CD, Gölge E, Müller NM, Oliveira FS de, Candido Junior A, Soares A da S, Aluísio SM, Ponti MA. SC-GlowTTS: an efficient zero-shot multi-speaker text-to-speech model [Internet]. Proceedings. 2021 ;[citado 2026 abr. 01 ] Available from: https://doi.org/10.21437/Interspeech.2021-1774 -
Vancouver
Casanova E, Shulby CD, Gölge E, Müller NM, Oliveira FS de, Candido Junior A, Soares A da S, Aluísio SM, Ponti MA. SC-GlowTTS: an efficient zero-shot multi-speaker text-to-speech model [Internet]. Proceedings. 2021 ;[citado 2026 abr. 01 ] Available from: https://doi.org/10.21437/Interspeech.2021-1774 - ASR data augmentation in low-resource settings using cross-lingual multi-speaker TTS and cross-lingual voice conversion
- TTS applied to the generation of datasets for automatic speech recognition
- TTS-portuguese corpus: a corpus for speech synthesis in brazilian portuguese
- Speech2Phone: a novel and efficient method for training speaker recognition models
- YourTTS: towards zero-shot multi-speaker TTS and zero-shot voice conversion for everyone
- Evaluating sentence segmentation in different datasets of neuropsychological language tests in brazilian portuguese
- Deep learning approaches for speech synthesis and speaker verification
- Transfer learning and data augmentation techniques to the COVID-19 identification tasks in ComParE 2021
- Evaluating semantic similarity methods to build semantic predictability norms of reading data
- Desenvolvimento de um modelo de reconhecimento de voz para o português brasileiro com poucos dados utilizando o Wav2vec 2.0
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| 3057702.pdf |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
