Uso de heurísticas para a aceleração do aprendizado por reforço (2004)
- Authors:
- Autor USP: BIANCHI, REINALDO AUGUSTO DA COSTA - EP
- Unidade: EP
- Sigla do Departamento: PCS
- Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL; ROBÔS
- Language: Português
- Abstract: Este trabalho propõe uma nova classe de algoritmos que permite o uso de heurísticas para aceleração do aprendizado por reforço. Esta classe de algoritmos, denominada "Aprendizado Acelerado por Heurísticas" ("Heuristically Accelerated Learning" - HAL), é formalizada por Processos Markovianos de Decisão, introduzindo uma função heurística H para influenciar o agente na escolha de suas ações, durante o aprendizado. A heurística é usada somente para a escolha da ação a ser tomada, não modificando o funcionamento do algoritmo de AR e preservando muitas de suas propriedades. As heurísticas utilizadas nos HALs podem ser definidas a partir de conhecimento prévio sobre o domínio ou extraídas, em tempo de execução, de indícios que existem no próprio processo de aprendizagem. No primeiro caso, a heurística é definida a partir de casos previamente aprendidos ou definida 'ad hoc'. No segundo caso são utilizados métodos automáticos de extração da função heurística H chamados "Heurística a partir de X" ("Heuristic from X"). Para validar este trabalho, é proposto o algoritmo "Q-Learning Acelerado por Heurísticas" (Heuristically Accelerated Q-Learning - HAQL), que implementa um HAL estendendo o conhecido algoritmo Q-Learning, e métodos de extração da função heurística que podem ser usados por ele. São apresentados experimentos utilizando os algoritmos acelerados por heurísticas para solucionar problemas em diversos domínios, sendo o mais importante o denavegação robótica. Os resultados experimentais permitem concluir que mesmo uma heurística muito simples resulta em um aumento significativo do desempenho do algoritmo de aprendizado de reforço utilizado
- Imprenta:
- Data da defesa: 05.04.2004
-
ABNT
BIANCHI, Reinaldo Augusto da Costa. Uso de heurísticas para a aceleração do aprendizado por reforço. 2004. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2004. Disponível em: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-28062005-191041/. Acesso em: 15 out. 2024. -
APA
Bianchi, R. A. da C. (2004). Uso de heurísticas para a aceleração do aprendizado por reforço (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/3/3141/tde-28062005-191041/ -
NLM
Bianchi RA da C. Uso de heurísticas para a aceleração do aprendizado por reforço [Internet]. 2004 ;[citado 2024 out. 15 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-28062005-191041/ -
Vancouver
Bianchi RA da C. Uso de heurísticas para a aceleração do aprendizado por reforço [Internet]. 2004 ;[citado 2024 out. 15 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-28062005-191041/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas