Exportar registro bibliográfico

Uso de heurísticas para a aceleração do aprendizado por reforço (2004)

  • Authors:
  • Autor USP: BIANCHI, REINALDO AUGUSTO DA COSTA - EP
  • Unidade: EP
  • Sigla do Departamento: PCS
  • Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL; ROBÔS
  • Language: Português
  • Abstract: Este trabalho propõe uma nova classe de algoritmos que permite o uso de heurísticas para aceleração do aprendizado por reforço. Esta classe de algoritmos, denominada "Aprendizado Acelerado por Heurísticas" ("Heuristically Accelerated Learning" - HAL), é formalizada por Processos Markovianos de Decisão, introduzindo uma função heurística H para influenciar o agente na escolha de suas ações, durante o aprendizado. A heurística é usada somente para a escolha da ação a ser tomada, não modificando o funcionamento do algoritmo de AR e preservando muitas de suas propriedades. As heurísticas utilizadas nos HALs podem ser definidas a partir de conhecimento prévio sobre o domínio ou extraídas, em tempo de execução, de indícios que existem no próprio processo de aprendizagem. No primeiro caso, a heurística é definida a partir de casos previamente aprendidos ou definida 'ad hoc'. No segundo caso são utilizados métodos automáticos de extração da função heurística H chamados "Heurística a partir de X" ("Heuristic from X"). Para validar este trabalho, é proposto o algoritmo "Q-Learning Acelerado por Heurísticas" (Heuristically Accelerated Q-Learning - HAQL), que implementa um HAL estendendo o conhecido algoritmo Q-Learning, e métodos de extração da função heurística que podem ser usados por ele. São apresentados experimentos utilizando os algoritmos acelerados por heurísticas para solucionar problemas em diversos domínios, sendo o mais importante o denavegação robótica. Os resultados experimentais permitem concluir que mesmo uma heurística muito simples resulta em um aumento significativo do desempenho do algoritmo de aprendizado de reforço utilizado
  • Imprenta:
  • Data da defesa: 05.04.2004
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      BIANCHI, Reinaldo Augusto da Costa. Uso de heurísticas para a aceleração do aprendizado por reforço. 2004. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2004. Disponível em: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-28062005-191041/. Acesso em: 15 out. 2024.
    • APA

      Bianchi, R. A. da C. (2004). Uso de heurísticas para a aceleração do aprendizado por reforço (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/3/3141/tde-28062005-191041/
    • NLM

      Bianchi RA da C. Uso de heurísticas para a aceleração do aprendizado por reforço [Internet]. 2004 ;[citado 2024 out. 15 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-28062005-191041/
    • Vancouver

      Bianchi RA da C. Uso de heurísticas para a aceleração do aprendizado por reforço [Internet]. 2004 ;[citado 2024 out. 15 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-28062005-191041/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024