Processamento de fala para triagem de distúrbios fonológicos

Yoshimura, Guilherme Jun; Queiroz, Marcelo Gomes de

Tese

Processamento de fala para triagem de distúrbios fonológicos (2020)

Authors:
- Yoshimura, Guilherme Jun
- Queiroz, Marcelo Gomes de (Orientador)
Autor USP: YOSHIMURA, GUILHERME JUN - IME
Unidade: IME
Sigla do Departamento: MAC
DOI: 10.11606/D.45.2020.tde-12052020-005232
Assunto: CIENCIA DA COMPUTAÇÃO
Keywords: Coeficientes Mel-Cepstrais; Distúrbio do som da fala; Dynamic Time Warping; Mel Frequency Cepstral Coefficients; Processamento de fala; Speech processing; Speech sound disorder
Language: Português
Abstract: Este trabalho apresenta dois classificadores originais para sinais de voz que objetivam auxiliar profissionais da fonoaudiologia no diagnóstico de pessoas com alterações de fala. Comparamos os classificadores propostos com três técnicas conhecidas: Modelos de Markov Escondidos (HMM), bag-of-words e classificador baseado em Earth Mover\'s Distance (EMD). Utilizamos três bases de dados, sendo duas disponibilizadas pelo Departamento de Fisioterapia, Fonoaudiologia e Terapia Ocupacional (FOFITO) da Faculdade de Medicina da Universidade de São Paulo (FMUSP) que contêm gravações de crianças que têm alterações de fala que ocorrem durante o desenvolvimento da fala, e a terceira é a base pública UA-Speech que contém gravações de indíviduos adultos com disartria. O intuito deste trabalho é criar classificadores de fala capazes de distinguir um áudio sem alteração de fala de um áudio com alteração de fala. Além de estudar as técnicas conhecidas citadas anteriormente, propusemos dois classificadores baseados em Coeficientes Mel-Cepstrais (MFCC). O primeiro utiliza uma reformulação da distância DTW entre registros de fala e conjuntos de gravações sem alteração de fala, enquanto o outro combina a informação de curvas de dissimilaridades construídas a partir da comparação do registro de fala a ser classificado com as gravações de referência (sem alterações de fala)
Imprenta:
- Publisher place: São Paulo
- Date published: 2020
Data da defesa: 05.02.2020

Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).

Este artigo possui versão em acesso aberto
URL de acesso aberto
PDF de acesso aberto
Versão do Documento: Versão publicada (Published version)
Status: Artigo publicado em periódico de acesso aberto (Gold Open Access)

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

YOSHIMURA, Guilherme Jun. Processamento de fala para triagem de distúrbios fonológicos. 2020. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2020. Disponível em: https://teses.usp.br/teses/disponiveis/45/45134/tde-12052020-005232/. Acesso em: 13 mar. 2026.
APA

Yoshimura, G. J. (2020). Processamento de fala para triagem de distúrbios fonológicos (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/45/45134/tde-12052020-005232/
NLM

Yoshimura GJ. Processamento de fala para triagem de distúrbios fonológicos [Internet]. 2020 ;[citado 2026 mar. 13 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-12052020-005232/
Vancouver

Yoshimura GJ. Processamento de fala para triagem de distúrbios fonológicos [Internet]. 2020 ;[citado 2026 mar. 13 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-12052020-005232/

ReP

Exportar registro bibliográfico

Processamento de fala para triagem de distúrbios fonológicos (2020)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

ReP

Exportar registro bibliográfico

Processamento de fala para triagem de distúrbios fonológicos (2020)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: