Exportar registro bibliográfico

Agilizando aprendizagem por reforço em robótica móvel através do uso de conhecimento sobre o domínio (2001)

  • Authors:
  • Autor USP: PEGORARO, RENÊ - EP
  • Unidade: EP
  • Sigla do Departamento: PCS
  • Subjects: ROBÓTICA; ALGORITMOS E ESTRUTURAS DE DADOS
  • Language: Português
  • Abstract: Diversos algoritmos de Aprendizado por Reforço (AR) foram propostos para solucionar os Processos de Decisão de Markov. Em AR, a prendizagem é conduzida através de repetidas interações do agente com o ambiente, por tentativa e erro. Encontrar políticas ótimas usando os algoritmos de AR pode ser bastante demorado. Visando acelerar a aprendizagem, muitos algoritmos foram desenvolvidos. Um destes algoritmos é o QS-Learning, no qual uma única experiência pode atualizar mais do que um valor da ação, através do uso de uma função de espalhamento. Com o intuito de melhorar o algoritmo QS, considera-se o uso de similaridades entre pares estado-ação, definidos em um espaço de similaridades, e a aplicação destas similaridades para acelerar alguns algoritmos AR. Esta Tese propõe o algoritmo QSx-Learning, que é o algoritmo QS-Learning com identificação explícita de similaridades entre pares estado-ação, e o algoritmo Minimax-QSx, o qual combina o algoritmo Minimax-Q com o algoritmo QSx-Learning. Diversas simulações foram desenvolvidas no domínio de robótica móvel, incluindo o futebol de robôs, que é um domínio multiagentes. Pode-se observar que, definindo funções de espalhamento muito simples, dependentes do domínio, consegue-se melhorias significativas no desempenho dos algoritmos de aprendizado por reforço
  • Imprenta:
  • Data da defesa: 14.09.2001

  • How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      PEGORARO, Renê. Agilizando aprendizagem por reforço em robótica móvel através do uso de conhecimento sobre o domínio. 2001. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2001. . Acesso em: 14 out. 2024.
    • APA

      Pegoraro, R. (2001). Agilizando aprendizagem por reforço em robótica móvel através do uso de conhecimento sobre o domínio (Tese (Doutorado). Universidade de São Paulo, São Paulo.
    • NLM

      Pegoraro R. Agilizando aprendizagem por reforço em robótica móvel através do uso de conhecimento sobre o domínio. 2001 ;[citado 2024 out. 14 ]
    • Vancouver

      Pegoraro R. Agilizando aprendizagem por reforço em robótica móvel através do uso de conhecimento sobre o domínio. 2001 ;[citado 2024 out. 14 ]

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024