Reinforcement learning with utility-based semantic for goals (2025)
- Authors:
- USP affiliated authors: DELGADO, KARINA VALDIVIA - EACH ; SILVA, VALDINEI FREIRE DA - EACH ; POLAR, CHRISTIAN JORGE DELGADO - IME
- Unidades: EACH; IME
- DOI: 10.1007/978-3-031-79032-4_25
- Subjects: PROCESSOS ESTOCÁSTICOS; PROCESSOS DE MARKOV; INTELIGÊNCIA ARTIFICIAL; ALGORITMOS
- Keywords: Reinforcement learning; Dead-end; Q-learning; GUBS
- Agências de fomento:
- Language: Inglês
- Imprenta:
- Publisher: Springer Nature
- Publisher place: Cham
- Date published: 2025
- Source:
- Título: Lecture Notes in Computer Science
- ISSN: 0302-9743
- Volume/Número/Paginação/Ano: v. 15413, p. 354-369, 2025
- Conference titles: Brazilian Conference on Intelligent Systems - BRACIS
- Este periódico é de acesso aberto
- Este artigo NÃO é de acesso aberto
-
ABNT
POLAR, Christian Jorge Delgado e DELGADO, Karina Valdivia e SILVA, Valdinei Freire da. Reinforcement learning with utility-based semantic for goals. Lecture Notes in Computer Science. Cham: Springer Nature. Disponível em: https://doi.org/10.1007/978-3-031-79032-4_25. Acesso em: 08 fev. 2026. , 2025 -
APA
Polar, C. J. D., Delgado, K. V., & Silva, V. F. da. (2025). Reinforcement learning with utility-based semantic for goals. Lecture Notes in Computer Science. Cham: Springer Nature. doi:10.1007/978-3-031-79032-4_25 -
NLM
Polar CJD, Delgado KV, Silva VF da. Reinforcement learning with utility-based semantic for goals [Internet]. Lecture Notes in Computer Science. 2025 ; 15413 354-369.[citado 2026 fev. 08 ] Available from: https://doi.org/10.1007/978-3-031-79032-4_25 -
Vancouver
Polar CJD, Delgado KV, Silva VF da. Reinforcement learning with utility-based semantic for goals [Internet]. Lecture Notes in Computer Science. 2025 ; 15413 354-369.[citado 2026 fev. 08 ] Available from: https://doi.org/10.1007/978-3-031-79032-4_25 - ALICAT: a customized approach to item selection process in computerized adaptive testing
- GUBS criterion: arbitrary trade-offs between cost and probability-to-goal in stochastic planning based on expected utility theory
- Algoritmo Exato de Avaliação de uma Política Estacionária para CVaR MDP
- A unified framework for average reward criterion and risk
- Risk-sensitive piecewise-linear policy iteration for stochastic shortest path Markov decision processes
- Políticas sensíveis ao risco para o controle da propagação de doenças infecciosas
- Políticas aproximadas e parciais sensíveis a risco para o controle da propagação de doenças infecciosas
- Processos Markovianos de Decisão com heurísticas, junção de abordagens backward e forward para transferência de conhecimento baseados em políticas
- Automatic generation of difficulty maps for datasets using neural network
- Challenging situations for background subtraction algorithms
Informações sobre o DOI: 10.1007/978-3-031-79032-4_25 (Fonte: oaDOI API)
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| 3251949.pdf |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
