Reinforcement learning with utility-based semantic for goals (2025)
- Authors:
- USP affiliated authors: DELGADO, KARINA VALDIVIA - EACH ; SILVA, VALDINEI FREIRE DA - EACH ; POLAR, CHRISTIAN JORGE DELGADO - IME
- Unidades: EACH; IME
- DOI: 10.1007/978-3-031-79032-4_25
- Subjects: PROCESSOS ESTOCÁSTICOS; PROCESSOS DE MARKOV; INTELIGÊNCIA ARTIFICIAL; ALGORITMOS
- Keywords: Reinforcement learning; Dead-end; Q-learning; GUBS
- Agências de fomento:
- Language: Inglês
- Imprenta:
- Publisher: Springer Nature
- Publisher place: Cham
- Date published: 2025
- Source:
- Título: Lecture Notes in Computer Science
- ISSN: 0302-9743
- Volume/Número/Paginação/Ano: v. 15413, p. 354-369, 2025
- Conference titles: Brazilian Conference on Intelligent Systems - BRACIS
- Status:
- Nenhuma versão em acesso aberto identificada
-
ABNT
POLAR, Christian Jorge Delgado e DELGADO, Karina Valdivia e SILVA, Valdinei Freire da. Reinforcement learning with utility-based semantic for goals. Lecture Notes in Computer Science. Cham: Springer Nature. Disponível em: https://doi.org/10.1007/978-3-031-79032-4_25. Acesso em: 30 mar. 2026. , 2025 -
APA
Polar, C. J. D., Delgado, K. V., & Silva, V. F. da. (2025). Reinforcement learning with utility-based semantic for goals. Lecture Notes in Computer Science. Cham: Springer Nature. doi:10.1007/978-3-031-79032-4_25 -
NLM
Polar CJD, Delgado KV, Silva VF da. Reinforcement learning with utility-based semantic for goals [Internet]. Lecture Notes in Computer Science. 2025 ; 15413 354-369.[citado 2026 mar. 30 ] Available from: https://doi.org/10.1007/978-3-031-79032-4_25 -
Vancouver
Polar CJD, Delgado KV, Silva VF da. Reinforcement learning with utility-based semantic for goals [Internet]. Lecture Notes in Computer Science. 2025 ; 15413 354-369.[citado 2026 mar. 30 ] Available from: https://doi.org/10.1007/978-3-031-79032-4_25 - Dead-end discovery and secure exploration via large language models
- ALICAT: a customized approach to item selection process in computerized adaptive testing
- A unified framework for average reward criterion and risk
- Algoritmo Exato de Avaliação de uma Política Estacionária para CVaR MDP
- GUBS criterion: arbitrary trade-offs between cost and probability-to-goal in stochastic planning based on expected utility theory
- Processos Markovianos de Decisão com heurísticas, junção de abordagens backward e forward para transferência de conhecimento baseados em políticas
- Automatic generation of difficulty maps for datasets using neural network
- Challenging situations for background subtraction algorithms
- Extração de preferências por meio de avaliações de comportamentos observados
- Risk-sensitive piecewise-linear policy iteration for stochastic shortest path Markov decision processes
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| 3251949.pdf |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
