Heuristically accelerated Q–learning: a new approach to speed up reinforcement learning (2004)
- Authors:
- USP affiliated authors: COSTA, ANNA HELENA REALI - EP ; BIANCHI, REINALDO AUGUSTO DA COSTA - EP
- Unidade: EP
- DOI: 10.1007/b100195
- Assunto: ROBÓTICA
- Keywords: APRENDIZADO POR REFORÇO
- Language: Inglês
- Imprenta:
- Source:
- Conference titles: Brazilian Symposium on Artificial Intelligence-SBIA 2004
- Este periódico é de acesso aberto
- Este artigo NÃO é de acesso aberto
-
ABNT
BIANCHI, Reinaldo A C e RIBEIRO, Carlos H. C e REALI COSTA, Anna Helena. Heuristically accelerated Q–learning: a new approach to speed up reinforcement learning. 2004, Anais.. Cham: Springer, 2004. Disponível em: https://doi.org/10.1007/b100195. Acesso em: 20 fev. 2026. -
APA
Bianchi, R. A. C., Ribeiro, C. H. C., & Reali Costa, A. H. (2004). Heuristically accelerated Q–learning: a new approach to speed up reinforcement learning. In Advances in artificial intelligence: proceedings. Cham: Springer. doi:10.1007/b100195 -
NLM
Bianchi RAC, Ribeiro CHC, Reali Costa AH. Heuristically accelerated Q–learning: a new approach to speed up reinforcement learning [Internet]. Advances in artificial intelligence: proceedings. 2004 ;[citado 2026 fev. 20 ] Available from: https://doi.org/10.1007/b100195 -
Vancouver
Bianchi RAC, Ribeiro CHC, Reali Costa AH. Heuristically accelerated Q–learning: a new approach to speed up reinforcement learning [Internet]. Advances in artificial intelligence: proceedings. 2004 ;[citado 2026 fev. 20 ] Available from: https://doi.org/10.1007/b100195 - L-VIBRA: learning in the VIBRA architecture
- The use heuristics to speedup reinforcement learning
- Implementing computer vision algorithms in hardware: An FPGA/VHDL-Based vision system for a mobile robo
- Integrating purposive vision with deliberative and reactive planning: engineering support for robotic applications
- Uso de heurísticas para a aceleração do aprendizado por reforço
- Uma arquitetura de controle distribuída para um sistema de visão computacional propositada
- Operation of a robotic manipulator through the WWW
- RECTRI: um sistema de reconhecimento tridimensional a partir de uma única imagem de intensidade luminosa
- Extração de preferências sobre comportamentos observados
- Building object-based maps for robot navigation
Informações sobre o DOI: 10.1007/b100195 (Fonte: oaDOI API)
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| 3285165.pdf |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
