Agilizando aprendizagem por reforço em robótica móvel através do uso de conhecimento sobre o domínio

Pegoraro, Renê; Reali Costa, Anna Helena

Tese

Agilizando aprendizagem por reforço em robótica móvel através do uso de conhecimento sobre o domínio (2001)

Authors:
- Pegoraro, Renê
- Reali Costa, Anna Helena (Orientador)
Autor USP: PEGORARO, RENÊ - EP
Unidade: EP
Sigla do Departamento: PCS
Subjects: ROBÓTICA; ALGORITMOS E ESTRUTURAS DE DADOS
Language: Português
Abstract: Diversos algoritmos de Aprendizado por Reforço (AR) foram propostos para solucionar os Processos de Decisão de Markov. Em AR, a prendizagem é conduzida através de repetidas interações do agente com o ambiente, por tentativa e erro. Encontrar políticas ótimas usando os algoritmos de AR pode ser bastante demorado. Visando acelerar a aprendizagem, muitos algoritmos foram desenvolvidos. Um destes algoritmos é o QS-Learning, no qual uma única experiência pode atualizar mais do que um valor da ação, através do uso de uma função de espalhamento. Com o intuito de melhorar o algoritmo QS, considera-se o uso de similaridades entre pares estado-ação, definidos em um espaço de similaridades, e a aplicação destas similaridades para acelerar alguns algoritmos AR. Esta Tese propõe o algoritmo QSx-Learning, que é o algoritmo QS-Learning com identificação explícita de similaridades entre pares estado-ação, e o algoritmo Minimax-QSx, o qual combina o algoritmo Minimax-Q com o algoritmo QSx-Learning. Diversas simulações foram desenvolvidas no domínio de robótica móvel, incluindo o futebol de robôs, que é um domínio multiagentes. Pode-se observar que, definindo funções de espalhamento muito simples, dependentes do domínio, consegue-se melhorias significativas no desempenho dos algoritmos de aprendizado por reforço
Imprenta:
- Publisher place: São Paulo
- Date published: 2001
Data da defesa: 14.09.2001

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

PEGORARO, Renê. Agilizando aprendizagem por reforço em robótica móvel através do uso de conhecimento sobre o domínio. 2001. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2001. . Acesso em: 14 out. 2024.
APA

Pegoraro, R. (2001). Agilizando aprendizagem por reforço em robótica móvel através do uso de conhecimento sobre o domínio (Tese (Doutorado). Universidade de São Paulo, São Paulo.
NLM

Pegoraro R. Agilizando aprendizagem por reforço em robótica móvel através do uso de conhecimento sobre o domínio. 2001 ;[citado 2024 out. 14 ]
Vancouver

Pegoraro R. Agilizando aprendizagem por reforço em robótica móvel através do uso de conhecimento sobre o domínio. 2001 ;[citado 2024 out. 14 ]

ReP

Exportar registro bibliográfico

Agilizando aprendizagem por reforço em robótica móvel através do uso de conhecimento sobre o domínio (2001)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

ReP

Exportar registro bibliográfico

Agilizando aprendizagem por reforço em robótica móvel através do uso de conhecimento sobre o domínio (2001)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: