Processos de decisão Markovianos fatorados com probabilidades imprecisas (2010)
- Authors:
- Autor USP: DELGADO, KARINA VALDIVIA - IME
- Unidade: IME
- Sigla do Departamento: MAC
- DOI: 10.11606/T.45.2010.tde-28112010-095311
- Assunto: INTELIGÊNCIA ARTIFICIAL
- Agências de fomento:
- Language: Português
- Abstract: Em geral, quando modelamos problemas de planejamento probabilístico do mundo real, usando o arcabouço de Processos de Decisão Markovianos (MDPs), é difícil obter uma estimativa exata das probabilidades de transição. A incerteza surge naturalmente na especificação de um domínio, por exemplo, durante a aquisição das probabilidades de transição a partir de um especialista ou de dados observados através de técnicas de amostragem, ou ainda de distribuições de transição não estacionárias decorrentes do conhecimento insuficiente do domínio. Com o objetivo de se determinar uma política robusta, dada a incerteza nas transições de estado, Processos de Decisão Markovianos com Probabilidades Imprecisas (MDP-IPs) têm sido usados para modelar esses cenários. Infelizmente, apesar de existirem diversos algoritmos de solução para MDP-IPs, muitas vezes eles exigem chamadas externas de rotinas de otimização que podem ser extremamente custosas. Para resolver esta deficiência, nesta tese, introduzimos o MDP-IP fatorado e propomos métodos eficientes de programação matemática e programação dinâmica que permitem explorar a estrutura de um domínio de aplicação. O método baseado em programação matemática propõe soluções aproximadas eficientes para MDP-IPs fatorados, estendendo abordagens anteriores de programação linear para MDPs fatorados. Essa proposta, baseada numa formulação multilinear para aproximações robustas da função valor de estados, explora a representação fatorada de um MDP-IP, reduzindo em ordens de magnitude o tempo consumido em relação às abordagens não fatoradas previamente propostas. O segundo método proposto, baseado em programação dinâmica, resolve o gargalo computacional existente nas soluções de programação dinâmica para MDP-IPs propostas na literatura: a necessidade de resolver múltilos problemas de otimização não linear.
- Imprenta:
- Data da defesa: 19.01.2010
- Status:
- Artigo publicado em periódico de acesso aberto (Gold Open Access)
- Versão do Documento:
- Versão publicada (Published version)
- Acessar versão aberta:
-
ABNT
DELGADO, Karina Valdivia. Processos de decisão Markovianos fatorados com probabilidades imprecisas. 2010. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2010. Disponível em: https://teses.usp.br/teses/disponiveis/45/45134/tde-28112010-095311/. Acesso em: 07 abr. 2026. -
APA
Delgado, K. V. (2010). Processos de decisão Markovianos fatorados com probabilidades imprecisas (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/45/45134/tde-28112010-095311/ -
NLM
Delgado KV. Processos de decisão Markovianos fatorados com probabilidades imprecisas [Internet]. 2010 ;[citado 2026 abr. 07 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-28112010-095311/ -
Vancouver
Delgado KV. Processos de decisão Markovianos fatorados com probabilidades imprecisas [Internet]. 2010 ;[citado 2026 abr. 07 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-28112010-095311/ - Diagnóstico baseado em modelos num sistema tutor inteligente para programação com padrões pedagógicos
- Symbolic bounded real-time dynamic programming
- Processo de decisão Markoviano com transição valorada por conjunto modelado como um Jogo alternado de soma zero
- Especialização em EaD da Univesp: Contribuições para a Formação de Pós-Graduandos das Universidades Estaduais Paulistas
- Formação inicial de professores de matemática na modalidade à distância no Brasil: o que dizem as pesquisas dos últimos dez anos
- Monte Carlo tree search algorithm for SSPs under the GUBS criterion
- Symbolic dynamic programming for discrete and continuous state MDPs
- Occupation measure heuristics to solve stochastic shortest path with dead ends
- Diagnostic of programs for programming learning tools
- ALICAT: a customized approach to item selection process in computerized adaptive testing
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
