Processamento de fala para triagem de distúrbios fonológicos (2020)
- Authors:
- Autor USP: YOSHIMURA, GUILHERME JUN - IME
- Unidade: IME
- Sigla do Departamento: MAC
- DOI: 10.11606/D.45.2020.tde-12052020-005232
- Assunto: CIENCIA DA COMPUTAÇÃO
- Keywords: Coeficientes Mel-Cepstrais; Distúrbio do som da fala; Dynamic Time Warping; Mel Frequency Cepstral Coefficients; Processamento de fala; Speech processing; Speech sound disorder
- Language: Português
- Abstract: Este trabalho apresenta dois classificadores originais para sinais de voz que objetivam auxiliar profissionais da fonoaudiologia no diagnóstico de pessoas com alterações de fala. Comparamos os classificadores propostos com três técnicas conhecidas: Modelos de Markov Escondidos (HMM), bag-of-words e classificador baseado em Earth Mover\'s Distance (EMD). Utilizamos três bases de dados, sendo duas disponibilizadas pelo Departamento de Fisioterapia, Fonoaudiologia e Terapia Ocupacional (FOFITO) da Faculdade de Medicina da Universidade de São Paulo (FMUSP) que contêm gravações de crianças que têm alterações de fala que ocorrem durante o desenvolvimento da fala, e a terceira é a base pública UA-Speech que contém gravações de indíviduos adultos com disartria. O intuito deste trabalho é criar classificadores de fala capazes de distinguir um áudio sem alteração de fala de um áudio com alteração de fala. Além de estudar as técnicas conhecidas citadas anteriormente, propusemos dois classificadores baseados em Coeficientes Mel-Cepstrais (MFCC). O primeiro utiliza uma reformulação da distância DTW entre registros de fala e conjuntos de gravações sem alteração de fala, enquanto o outro combina a informação de curvas de dissimilaridades construídas a partir da comparação do registro de fala a ser classificado com as gravações de referência (sem alterações de fala)
- Imprenta:
- Data da defesa: 05.02.2020
- Este artigo possui versão em acesso aberto
- URL de acesso aberto
- PDF de acesso aberto
- Versão do Documento: Versão publicada (Published version)
-
Status: Artigo publicado em periódico de acesso aberto (Gold Open Access) -
ABNT
YOSHIMURA, Guilherme Jun. Processamento de fala para triagem de distúrbios fonológicos. 2020. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2020. Disponível em: https://teses.usp.br/teses/disponiveis/45/45134/tde-12052020-005232/. Acesso em: 11 mar. 2026. -
APA
Yoshimura, G. J. (2020). Processamento de fala para triagem de distúrbios fonológicos (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/45/45134/tde-12052020-005232/ -
NLM
Yoshimura GJ. Processamento de fala para triagem de distúrbios fonológicos [Internet]. 2020 ;[citado 2026 mar. 11 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-12052020-005232/ -
Vancouver
Yoshimura GJ. Processamento de fala para triagem de distúrbios fonológicos [Internet]. 2020 ;[citado 2026 mar. 11 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-12052020-005232/
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
