Uma revisão de arquiteturas ponta a ponta para sintetização de voz (2020)
- Authors:
- USP affiliated authors: LEJBMAN, ALFREDO GOLDMAN VEL - IME ; EVANGELISTA, LUCY ANNE DE OMENA - IME ; NASCIMENTO, PATRÍCIA LENES DO - IME ; ELMADJIAN, CARLOS EDUARDO LEÃO - IME
- Unidade: IME
- Subjects: RECONHECIMENTO DE VOZ; SÍNTESE DE VOZ; PROCESSAMENTO DE LINGUAGEM NATURAL
- Agências de fomento:
- Language: Português
- Abstract: O objetivo deste artigo é realizar um estudo bibliográfico comparativo entre as arquiteturas para sínteze de voz (Char2Wav, ClariNet, Tacotron, Tacotron 2 e DeepVoice 3), sistematizando informações quanto a recursos e capacidade das arquiteturas. O estudo comparativo também contemplou os frameworks (TensorFlow, PyTorch, etc.) utilizados na implementação das arquiteturas. Ao final, são sugeridos alguns pontos informacionais que devem ser tomados como relevantes ao se comparar as arquiteturas disponíveis.
- Imprenta:
- Publisher: SBC
- Publisher place: Porto Alegre
- Date published: 2020
- Source:
- Título: Anais
- Conference titles: Escola Regional de Aprendizado de Máquina e Inteligência Artificial de São Paulo - ERAMIA-SP
-
ABNT
EVANGELISTA, Lucy Anne et al. Uma revisão de arquiteturas ponta a ponta para sintetização de voz. 2020, Anais.. Porto Alegre: SBC, 2020. Disponível em: https://sol.sbc.org.br/index.php/eramiasp/article/view/13608. Acesso em: 12 fev. 2026. -
APA
Evangelista, L. A., Nascimento, P. do, Elmadjian, C. E. L., & Goldman, A. (2020). Uma revisão de arquiteturas ponta a ponta para sintetização de voz. In Anais. Porto Alegre: SBC. Recuperado de https://sol.sbc.org.br/index.php/eramiasp/article/view/13608 -
NLM
Evangelista LA, Nascimento P do, Elmadjian CEL, Goldman A. Uma revisão de arquiteturas ponta a ponta para sintetização de voz [Internet]. Anais. 2020 ;[citado 2026 fev. 12 ] Available from: https://sol.sbc.org.br/index.php/eramiasp/article/view/13608 -
Vancouver
Evangelista LA, Nascimento P do, Elmadjian CEL, Goldman A. Uma revisão de arquiteturas ponta a ponta para sintetização de voz [Internet]. Anais. 2020 ;[citado 2026 fev. 12 ] Available from: https://sol.sbc.org.br/index.php/eramiasp/article/view/13608 - Towards wearable gaze interaction
- GazeBar: exploiting the Midas touch in gaze interaction
- Toward development of A.D.A. - Advanced Distributed Assistant
- The influence of organizational factors on inter-team knowledge sharing effectiveness in agile environments
- Improving the performance of actor model runtime environments on multicore and manycore platforms
- Towards automatic actor pinning on multi-core architectures
- A simple BSP-based model to predict execution time in GPU applications
- A comparison of GPU execution time prediction using machine learning and analytical modeling
- Message from the program committee co-chairs. [Apresentação]
- Useful statistical methods for human factors research in software engineering: a discussion on validation with quantitative data
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| 3064404.pdf | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
