Modelamento e ajuste por regra sub-ótica de maximização da informação mútua de um sistema reconhecedor de palavras isoladas, independente do falante, para ambientes adversos com redundância de informação (1999)
- Authors:
- Autor USP: SANCHES, IVANDRO - EP
- Unidade: EP
- Assunto: ENGENHARIA DE SOFTWARE
- Language: Português
- Abstract: Implementamos um sistema reconhecedor de palavras isoladas, independente do falante, para ambientes adversos, com Modelos Ocultos de Markov (HMM’s) multiparamétricos, com distribuições discretas, múltiplos livros de códigos, e expoentes de ponderação nos parâmetros, que será detalhado ao longo do texto. Com base nesse sistema, propomos um modelamento via Maximização da Informação Mútua (MM) sub-ótima que possibilita a melhoria do desempenho do sistema. O modelamento, fundamentado em elementos da Teoria da Informação, permitiu que os ajustes propostos acompanhassem o fluxo do sinal, iniciando pela etapa de codificação (quantização) e chegando aos modelos HMM, sempre pelo critério de otimização por MMI. Para o ajuste dos modelos HMM formulamos expressões de reestimação, e propomos o uso da seqüência de estados fornecida pelo decodificador por Viterbi para um procedimento de MMI sub-ótimo. Os testes no sistema e a avaliação dos ajustes propostos foram realizadoscom dados de centenas de falantes, coletados da linha telefônica fixa comercial, num vocabulário de dígitos da Língua Portuguesa. Os resultados mostraram que o modelamento proposto melhora significativamente o desempenho do sistema, sem aumentar consideravelmente a carga computacional. O modelamento proposto pode ser aplicado a qualquer HMM discreto
- Imprenta:
- Source:
- Título: Boletim Técnico da Escola Politécnica da USP. Departamento de Engenharia Elétrica
- ISSN: 1413-2206
- Volume/Número/Paginação/Ano: n.03, 1999
-
ABNT
MINAMI, Mario e SANCHES, Ivandro. Modelamento e ajuste por regra sub-ótica de maximização da informação mútua de um sistema reconhecedor de palavras isoladas, independente do falante, para ambientes adversos com redundância de informação. Boletim Técnico da Escola Politécnica da USP. Departamento de Engenharia Elétrica, n. 03, 1999Tradução . . Disponível em: https://repositorio.usp.br/directbitstream/cb49371b-33e3-4985-b6e1-9dddc44b1d40/BT-PCS-99_03_250911_091230.pdf. Acesso em: 10 jan. 2026. -
APA
Minami, M., & Sanches, I. (1999). Modelamento e ajuste por regra sub-ótica de maximização da informação mútua de um sistema reconhecedor de palavras isoladas, independente do falante, para ambientes adversos com redundância de informação. Boletim Técnico da Escola Politécnica da USP. Departamento de Engenharia Elétrica, (03). Recuperado de https://repositorio.usp.br/directbitstream/cb49371b-33e3-4985-b6e1-9dddc44b1d40/BT-PCS-99_03_250911_091230.pdf -
NLM
Minami M, Sanches I. Modelamento e ajuste por regra sub-ótica de maximização da informação mútua de um sistema reconhecedor de palavras isoladas, independente do falante, para ambientes adversos com redundância de informação [Internet]. Boletim Técnico da Escola Politécnica da USP. Departamento de Engenharia Elétrica. 1999 ;(03):[citado 2026 jan. 10 ] Available from: https://repositorio.usp.br/directbitstream/cb49371b-33e3-4985-b6e1-9dddc44b1d40/BT-PCS-99_03_250911_091230.pdf -
Vancouver
Minami M, Sanches I. Modelamento e ajuste por regra sub-ótica de maximização da informação mútua de um sistema reconhecedor de palavras isoladas, independente do falante, para ambientes adversos com redundância de informação [Internet]. Boletim Técnico da Escola Politécnica da USP. Departamento de Engenharia Elétrica. 1999 ;(03):[citado 2026 jan. 10 ] Available from: https://repositorio.usp.br/directbitstream/cb49371b-33e3-4985-b6e1-9dddc44b1d40/BT-PCS-99_03_250911_091230.pdf - Estudo de técnicas de codificação de sinais de voz e treinamento de modelos para o reconhecimento automático de fala
- Reconhecedor de dígitos isolados independente do locutor
- Quantização espectral na codificação de voz
- Segmentação não uniforme de sinais de voz
- Segmentação não uniforme de sinais de voz. (também em CD-Rom)
- From LPC to normalised autocorrelation coefficients through a matrix
- Reconhecimento de dígitos isolados independentemente do locutor
- Processo de busca do vetor de excitação em codificadores de voz
- Estudo da influência do sexo e variedade regional no treinamento de modelos para o reconhecimento automático de fala
- Noise-compensated hidden Markov models
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| BT-PCS-99_03_250911_09123... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas