Avaliação de Políticas Abstratas na Transferência de Conhecimento em Navegação Robótica (2012)
- Authors:
- Autor USP: COSTA, ANNA HELENA REALI - EP
- Unidade: EP
- Sigla do Departamento: PCS
- Assunto: ENGENHARIA ELÉTRICA
- Language: Português
- Abstract: Este trabalho apresenta uma análise comparativa do desempenho de políticas abstratas na reutilização de conhecimento no domínio de navegação robótica. O algoritmo Qab-Learning é proposto para a obtenção dessas políticas, que são então comparadas a poíticas abstratas geradas por um algoritmo presente na literatura, o ND-TILDE, na solução de diferentes tarefas de navegação robótica. O presente trabalho demonstra que essas políticas, mesmo após o processo de abstração, apresentam um impacto positivo no desempenho do agente.
- Imprenta:
- Source:
- Título do periódico: Revista de Sistemas e Computação
- Volume/Número/Paginação/Ano: vol. 2, n. 2, jul./dez. 2012, p. 17-25
-
ABNT
REALI COSTA, Anna Helena et al. Avaliação de Políticas Abstratas na Transferência de Conhecimento em Navegação Robótica. Revista de Sistemas e Computação, n. 2, p. 17-25, 2012Tradução . . Acesso em: 27 abr. 2024. -
APA
Reali Costa, A. H., Beirigo, R. L., Pareira, F. A., Koga, M. L., Matos, T., & Silva, V. F. da. (2012). Avaliação de Políticas Abstratas na Transferência de Conhecimento em Navegação Robótica. Revista de Sistemas e Computação, ( 2), 17-25. -
NLM
Reali Costa AH, Beirigo RL, Pareira FA, Koga ML, Matos T, Silva VF da. Avaliação de Políticas Abstratas na Transferência de Conhecimento em Navegação Robótica. Revista de Sistemas e Computação. 2012 ;( 2): 17-25.[citado 2024 abr. 27 ] -
Vancouver
Reali Costa AH, Beirigo RL, Pareira FA, Koga ML, Matos T, Silva VF da. Avaliação de Políticas Abstratas na Transferência de Conhecimento em Navegação Robótica. Revista de Sistemas e Computação. 2012 ;( 2): 17-25.[citado 2024 abr. 27 ] - Localização de robôs móveis utilizando observações parciais
- Aprendizado da coordenação de comportamentos primitivos para robôs móveis
- Obstacle avoidance using time-to-contact information
- Relaxação do modelo oculto de Markov para o problema de mapeamento e localização simultâneos
- Rastreamento visual de múltiplos objetos baseado em contornos aplicado ao futebol de robôs
- A hybrid adaptive architecture for mobile robots based on reactive behaviors
- Classificação de objetos em imagens onidirecionais com uso de retificação de imagens e de múltiplos núclos em máquinas de vetor de suporte
- The VIBRA multi-agent architecture: integrating purposive vision with deliberative and reactive planning
- Visão robótica
- Distributed control architecture for a purposive computer vision system
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas