Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco

Borges, Igor Oliveira; Delgado, Karina Valdivia

Tese

Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco (2018)

Authors:
- Borges, Igor Oliveira
- Delgado, Karina Valdivia (Orientador)
Autor USP: BORGES, IGOR OLIVEIRA - EACH
Unidade: EACH
Subjects: INTELIGÊNCIA ARTIFICIAL; PROCESSOS DE MARKOV; PROCESSOS ESTOCÁSTICOS; PROGRAMAÇÃO DINÂMICA; HEURÍSTICA
Keywords: Planejamento Estocástico; Política Sensível a Risco; Processo de Decisão Markoviano Sensível a Risco; Risk Sensitive Markov Decision Process; Risk Sensitive Policy; Stochastic Planning
Language: Português
Abstract: Processos de decisão markovianos sensíveis a risco (Risk Sensitive Markov Decision Process - RS-MDP) permitem modelar atitudes de aversão e propensão ao risco no processo de tomada de decisão usando um fator de risco para representar a atitude ao risco. Para esse modelo, existem operadores que são baseados em funções de transformação linear por partes que incluem fator de risco e fator de desconto. Nesta dissertação são formulados dois algoritmos de Iteração de Valor Sensível a Risco baseados em um desses operadores, esses algoritmos são chamados de Iteração de Valor Sensível a Risco Síncrono (Risk Sensitive Value Iteration - RSVI) e Iteração de Valor Sensível a Risco Assíncrono (Asynchronous Risk Sensitive Value Iteration- A-RSVI)... (Continua)(Continuação) Também são propostas duas heurísticas que podem ser utilizadas para inicializar os valores dos algoritmos de forma a torná-los mais eficentes. Os resultados dos experimentos no domínio de Travessia do Rio em dois cenários de recompensas distintos mostram que: (i) o custo de processamento de políticas extremas a risco, tanto de aversão quanto de propensão, é elevado; (ii) um desconto elevado aumenta o tempo de convergência do algoritmo e reforça a sensibilidade ao risco adotada; (iii) políticas com valores para o fator de risco intermediários possuem custo computacional baixo e já possuem certa sensibilidade ao risco dependendo do fator de desconto utilizado; e (iv) o algoritmo A-RSVI com a heurística baseada no fator de risco pode reduzir o tempo para o algoritmo convergir, especialmente para valores extremos do fator de risco
Imprenta:
- Publisher place: São Paulo
- Date published: 2018
Data da defesa: 11.10.2018

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

BORGES, Igor Oliveira. Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco. 2018. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2018. Disponível em: http://www.teses.usp.br/teses/disponiveis/100/100131/tde-09012019-103826/. Acesso em: 23 abr. 2024.
APA

Borges, I. O. (2018). Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/100/100131/tde-09012019-103826/
NLM

Borges IO. Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco [Internet]. 2018 ;[citado 2024 abr. 23 ] Available from: http://www.teses.usp.br/teses/disponiveis/100/100131/tde-09012019-103826/
Vancouver

Borges IO. Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco [Internet]. 2018 ;[citado 2024 abr. 23 ] Available from: http://www.teses.usp.br/teses/disponiveis/100/100131/tde-09012019-103826/

ReP

Exportar registro bibliográfico

Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco (2018)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

ReP

Exportar registro bibliográfico

Estratégias para otimização do algoritmo de Iteração de Valor Sensível a Risco (2018)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: