Descoberta e reuso de polí­ticas parciais probabilísticas no aprendizado por reforço

Descoberta e reuso de políticas parciais probabilísticas no aprendizado por reforço (2018)

Authors:
- Bonini, Rodrigo Cesar
- Reali Costa, Anna Helena (Orientador)
Autor USP: BONINI, RODRIGO CESAR - EP
Unidade: EP
Sigla do Departamento: PCS
Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL
Agências de fomento:
- Financiado pela FUSP
Language: Português
Abstract: O aprendizado por reforço é uma técnica bem sucedida, porém lenta, para treinar agentes autônomos. Algumas soluções baseadas em políticas parciais podem ser usadas para acelerar o aprendizado e para transferir comportamentos aprendidos entre tarefas encapsulando uma política parcial. No entanto, geralmente essas políticas parciais são específicas para uma única tarefa, não levam em consideração recursos semelhantes entre tarefas e podem não corresponder exatamente a um comportamento ideal quando transferidas para outra tarefa diferente. A transferência descuidada pode fornecer más soluções para o agente, dificultando o processo de aprendizagem. Sendo assim, este trabalho propõe uma maneira de descobrir e reutilizar de modo probabilístico políticas parciais orientadas a objetos aprendidas, a fim de permitir melhores escolhas de atuação para o agente em múltiplas tarefas diferentes. A avaliação experimental mostra que a proposta é capaz de aprender e reutilizar com sucesso políticas parciais em diferentes tarefas.
Imprenta:
- Publisher place: São Paulo
- Date published: 2018
Data da defesa: 21.11.2018

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

BONINI, Rodrigo Cesar. Descoberta e reuso de políticas parciais probabilísticas no aprendizado por reforço. 2018. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2018. Disponível em: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-18072019-143338/. Acesso em: 20 fev. 2026.
APA

Bonini, R. C. (2018). Descoberta e reuso de políticas parciais probabilísticas no aprendizado por reforço (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/3/3141/tde-18072019-143338/
NLM

Bonini RC. Descoberta e reuso de políticas parciais probabilísticas no aprendizado por reforço [Internet]. 2018 ;[citado 2026 fev. 20 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-18072019-143338/
Vancouver

Bonini RC. Descoberta e reuso de políticas parciais probabilísticas no aprendizado por reforço [Internet]. 2018 ;[citado 2026 fev. 20 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-18072019-143338/