Descoberta e reuso de políticas parciais probabilísticas no aprendizado por reforço (2018)
- Authors:
- Autor USP: BONINI, RODRIGO CESAR - EP
- Unidade: EP
- Sigla do Departamento: PCS
- Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL
- Agências de fomento:
- Language: Português
- Abstract: O aprendizado por reforço é uma técnica bem sucedida, porém lenta, para treinar agentes autônomos. Algumas soluções baseadas em políticas parciais podem ser usadas para acelerar o aprendizado e para transferir comportamentos aprendidos entre tarefas encapsulando uma política parcial. No entanto, geralmente essas políticas parciais são específicas para uma única tarefa, não levam em consideração recursos semelhantes entre tarefas e podem não corresponder exatamente a um comportamento ideal quando transferidas para outra tarefa diferente. A transferência descuidada pode fornecer más soluções para o agente, dificultando o processo de aprendizagem. Sendo assim, este trabalho propõe uma maneira de descobrir e reutilizar de modo probabilístico políticas parciais orientadas a objetos aprendidas, a fim de permitir melhores escolhas de atuação para o agente em múltiplas tarefas diferentes. A avaliação experimental mostra que a proposta é capaz de aprender e reutilizar com sucesso políticas parciais em diferentes tarefas.
- Imprenta:
- Data da defesa: 21.11.2018
-
ABNT
BONINI, Rodrigo Cesar. Descoberta e reuso de políticas parciais probabilísticas no aprendizado por reforço. 2018. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2018. Disponível em: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-18072019-143338/. Acesso em: 15 out. 2024. -
APA
Bonini, R. C. (2018). Descoberta e reuso de políticas parciais probabilísticas no aprendizado por reforço (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/3/3141/tde-18072019-143338/ -
NLM
Bonini RC. Descoberta e reuso de políticas parciais probabilísticas no aprendizado por reforço [Internet]. 2018 ;[citado 2024 out. 15 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-18072019-143338/ -
Vancouver
Bonini RC. Descoberta e reuso de políticas parciais probabilísticas no aprendizado por reforço [Internet]. 2018 ;[citado 2024 out. 15 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-18072019-143338/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas