Stochastic abstract policies: generalizing knowledge to improve reinforcement learning (2015)
- Authors:
- USP affiliated authors: SILVA, VALDINEI FREIRE DA - EACH ; COSTA, ANNA HELENA REALI - EP
- Unidades: EACH; EP
- DOI: 10.1109/TCYB.2014.2319733
- Subjects: DINÂMICA ESTOCÁSTICA; ANÁLISE ESTOCÁSTICA; APRENDIZADO COMPUTACIONAL; INTELIGÊNCIA ARTIFICIAL
- Language: Inglês
- Imprenta:
- Publisher place: Piscataway
- Date published: 2015
- Source:
- Título: IEEE Transactions on Cybernetics
- ISSN: 2168-2267
- Volume/Número/Paginação/Ano: v. 45, n. 1, p. 77-88, jan. 2015
- Este periódico é de assinatura
- Este artigo NÃO é de acesso aberto
- Cor do Acesso Aberto: closed
-
ABNT
KOGA, Marcelo Li e SILVA, Valdinei Freire da e REALI COSTA, Anna Helena. Stochastic abstract policies: generalizing knowledge to improve reinforcement learning. IEEE Transactions on Cybernetics, v. 45, n. ja 2015, p. 77-88, 2015Tradução . . Disponível em: https://doi.org/10.1109/TCYB.2014.2319733. Acesso em: 21 out. 2024. -
APA
Koga, M. L., Silva, V. F. da, & Reali Costa, A. H. (2015). Stochastic abstract policies: generalizing knowledge to improve reinforcement learning. IEEE Transactions on Cybernetics, 45( ja 2015), 77-88. doi:10.1109/TCYB.2014.2319733 -
NLM
Koga ML, Silva VF da, Reali Costa AH. Stochastic abstract policies: generalizing knowledge to improve reinforcement learning [Internet]. IEEE Transactions on Cybernetics. 2015 ; 45( ja 2015): 77-88.[citado 2024 out. 21 ] Available from: https://doi.org/10.1109/TCYB.2014.2319733 -
Vancouver
Koga ML, Silva VF da, Reali Costa AH. Stochastic abstract policies: generalizing knowledge to improve reinforcement learning [Internet]. IEEE Transactions on Cybernetics. 2015 ; 45( ja 2015): 77-88.[citado 2024 out. 21 ] Available from: https://doi.org/10.1109/TCYB.2014.2319733 - Descoberta automática de atributos salientes para obtenção de macro-ações
- Speeding-up reinforcement learning through abstraction and transfer learning
- Evaluation of linear relaxations in Ad Network optimization for online marketing
- Ad network optimization: evaluating linear relaxations
- Reusing risk-aware stochastic abstract policies in robotic navigation learning
- Extração de preferências por meio de avaliações de comportamentos observados
- Processos Markovianos de Decisão com heurísticas, junção de abordagens backward e forward para transferência de conhecimento baseados em políticas
- Challenging situations for background subtraction algorithms
- Automatic generation of difficulty maps for datasets using neural network
- Localização de robôs móveis utilizando observações parciais
Informações sobre o DOI: 10.1109/TCYB.2014.2319733 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas