Uso de heurísticas para a aceleração do aprendizado por reforço

Bianchi, Reinaldo Augusto da Costa; Reali Costa, Anna Helena

Tese

Uso de heurísticas para a aceleração do aprendizado por reforço (2004)

Authors:
- Bianchi, Reinaldo Augusto da Costa
- Reali Costa, Anna Helena (Orientador)
Autor USP: BIANCHI, REINALDO AUGUSTO DA COSTA - EP
Unidade: EP
Sigla do Departamento: PCS
Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL; ROBÔS
Language: Português
Abstract: Este trabalho propõe uma nova classe de algoritmos que permite o uso de heurísticas para aceleração do aprendizado por reforço. Esta classe de algoritmos, denominada "Aprendizado Acelerado por Heurísticas" ("Heuristically Accelerated Learning" - HAL), é formalizada por Processos Markovianos de Decisão, introduzindo uma função heurística H para influenciar o agente na escolha de suas ações, durante o aprendizado. A heurística é usada somente para a escolha da ação a ser tomada, não modificando o funcionamento do algoritmo de AR e preservando muitas de suas propriedades. As heurísticas utilizadas nos HALs podem ser definidas a partir de conhecimento prévio sobre o domínio ou extraídas, em tempo de execução, de indícios que existem no próprio processo de aprendizagem. No primeiro caso, a heurística é definida a partir de casos previamente aprendidos ou definida 'ad hoc'. No segundo caso são utilizados métodos automáticos de extração da função heurística H chamados "Heurística a partir de X" ("Heuristic from X"). Para validar este trabalho, é proposto o algoritmo "Q-Learning Acelerado por Heurísticas" (Heuristically Accelerated Q-Learning - HAQL), que implementa um HAL estendendo o conhecido algoritmo Q-Learning, e métodos de extração da função heurística que podem ser usados por ele. São apresentados experimentos utilizando os algoritmos acelerados por heurísticas para solucionar problemas em diversos domínios, sendo o mais importante o denavegação robótica. Os resultados experimentais permitem concluir que mesmo uma heurística muito simples resulta em um aumento significativo do desempenho do algoritmo de aprendizado de reforço utilizado
Imprenta:
- Publisher place: São Paulo
- Date published: 2004
Data da defesa: 05.04.2004

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

BIANCHI, Reinaldo Augusto da Costa. Uso de heurísticas para a aceleração do aprendizado por reforço. 2004. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2004. Disponível em: https://teses.usp.br/teses/disponiveis/3/3141/tde-28062005-191041/. Acesso em: 07 maio 2026.
APA

Bianchi, R. A. da C. (2004). Uso de heurísticas para a aceleração do aprendizado por reforço (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/3/3141/tde-28062005-191041/
NLM

Bianchi RA da C. Uso de heurísticas para a aceleração do aprendizado por reforço [Internet]. 2004 ;[citado 2026 maio 07 ] Available from: https://teses.usp.br/teses/disponiveis/3/3141/tde-28062005-191041/
Vancouver

Bianchi RA da C. Uso de heurísticas para a aceleração do aprendizado por reforço [Internet]. 2004 ;[citado 2026 maio 07 ] Available from: https://teses.usp.br/teses/disponiveis/3/3141/tde-28062005-191041/

ReP

Exportar registro bibliográfico

Uso de heurísticas para a aceleração do aprendizado por reforço (2004)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

ReP

Exportar registro bibliográfico

Uso de heurísticas para a aceleração do aprendizado por reforço (2004)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: