Uma revisão de arquiteturas ponta a ponta para sintetização de voz (2020)
- Authors:
- USP affiliated authors: LEJBMAN, ALFREDO GOLDMAN VEL - IME ; EVANGELISTA, LUCY ANNE DE OMENA - IME ; NASCIMENTO, PATRÍCIA LENES DO - IME ; ELMADJIAN, CARLOS EDUARDO LEÃO - IME
- Unidade: IME
- Subjects: RECONHECIMENTO DE VOZ; SÍNTESE DE VOZ; PROCESSAMENTO DE LINGUAGEM NATURAL
- Agências de fomento:
- Language: Português
- Abstract: O objetivo deste artigo é realizar um estudo bibliográfico comparativo entre as arquiteturas para sínteze de voz (Char2Wav, ClariNet, Tacotron, Tacotron 2 e DeepVoice 3), sistematizando informações quanto a recursos e capacidade das arquiteturas. O estudo comparativo também contemplou os frameworks (TensorFlow, PyTorch, etc.) utilizados na implementação das arquiteturas. Ao final, são sugeridos alguns pontos informacionais que devem ser tomados como relevantes ao se comparar as arquiteturas disponíveis.
- Imprenta:
- Publisher: SBC
- Publisher place: Porto Alegre
- Date published: 2020
- Source:
- Título: Anais
- Conference titles: Escola Regional de Aprendizado de Máquina e Inteligência Artificial de São Paulo - ERAMIA-SP
-
ABNT
EVANGELISTA, Lucy Anne et al. Uma revisão de arquiteturas ponta a ponta para sintetização de voz. 2020, Anais.. Porto Alegre: SBC, 2020. Disponível em: https://sol.sbc.org.br/index.php/eramiasp/article/view/13608. Acesso em: 28 dez. 2025. -
APA
Evangelista, L. A., Nascimento, P. do, Elmadjian, C. E. L., & Goldman, A. (2020). Uma revisão de arquiteturas ponta a ponta para sintetização de voz. In Anais. Porto Alegre: SBC. Recuperado de https://sol.sbc.org.br/index.php/eramiasp/article/view/13608 -
NLM
Evangelista LA, Nascimento P do, Elmadjian CEL, Goldman A. Uma revisão de arquiteturas ponta a ponta para sintetização de voz [Internet]. Anais. 2020 ;[citado 2025 dez. 28 ] Available from: https://sol.sbc.org.br/index.php/eramiasp/article/view/13608 -
Vancouver
Evangelista LA, Nascimento P do, Elmadjian CEL, Goldman A. Uma revisão de arquiteturas ponta a ponta para sintetização de voz [Internet]. Anais. 2020 ;[citado 2025 dez. 28 ] Available from: https://sol.sbc.org.br/index.php/eramiasp/article/view/13608 - Towards wearable gaze interaction
- Approximating the discrete resource sharing scheduling problem
- Introdução à computação heterogênea
- Useful statistical methods for human factors research in software engineering: a discussion on validation with quantitative data
- Thematic series on service composition for the future internet
- A multithreaded resolution of the service selection problem based on domain decomposition and work stealing
- Improving the performance of actor model runtime environments on multicore and manycore platforms
- The tracer files: cracking the case of performance impact in tracing Linux file I/O for I/O-intensive applications
- Agile processes in software engineering and extreme programming: 25th International Conference, XP 2024
- Group-development psychology training: the perceived effects on agile software-development teams
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| 3064404.pdf | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
