Exportar registro bibliográfico

Descoberta e reuso de polí­ticas parciais probabilísticas no aprendizado por reforço (2018)

  • Authors:
  • Autor USP: BONINI, RODRIGO CESAR - EP
  • Unidade: EP
  • Sigla do Departamento: PCS
  • Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL
  • Agências de fomento:
  • Language: Português
  • Abstract: O aprendizado por reforço é uma técnica bem sucedida, porém lenta, para treinar agentes autônomos. Algumas soluções baseadas em políticas parciais podem ser usadas para acelerar o aprendizado e para transferir comportamentos aprendidos entre tarefas encapsulando uma política parcial. No entanto, geralmente essas políticas parciais são específicas para uma única tarefa, não levam em consideração recursos semelhantes entre tarefas e podem não corresponder exatamente a um comportamento ideal quando transferidas para outra tarefa diferente. A transferência descuidada pode fornecer más soluções para o agente, dificultando o processo de aprendizagem. Sendo assim, este trabalho propõe uma maneira de descobrir e reutilizar de modo probabilístico políticas parciais orientadas a objetos aprendidas, a fim de permitir melhores escolhas de atuação para o agente em múltiplas tarefas diferentes. A avaliação experimental mostra que a proposta é capaz de aprender e reutilizar com sucesso políticas parciais em diferentes tarefas.
  • Imprenta:
  • Data da defesa: 21.11.2018
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      BONINI, Rodrigo Cesar. Descoberta e reuso de polí­ticas parciais probabilísticas no aprendizado por reforço. 2018. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2018. Disponível em: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-18072019-143338/. Acesso em: 15 out. 2024.
    • APA

      Bonini, R. C. (2018). Descoberta e reuso de polí­ticas parciais probabilísticas no aprendizado por reforço (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/3/3141/tde-18072019-143338/
    • NLM

      Bonini RC. Descoberta e reuso de polí­ticas parciais probabilísticas no aprendizado por reforço [Internet]. 2018 ;[citado 2024 out. 15 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-18072019-143338/
    • Vancouver

      Bonini RC. Descoberta e reuso de polí­ticas parciais probabilísticas no aprendizado por reforço [Internet]. 2018 ;[citado 2024 out. 15 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-18072019-143338/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024