Dead-end discovery and secure exploration via large language models (2026)
- Authors:
- USP affiliated authors: BARROS, LELIANE NUNES DE - IME ; DELGADO, KARINA VALDIVIA - EACH ; SILVA, VALDINEI FREIRE DA - FFLCH ; POLAR, CHRISTIAN JORGE DELGADO - IME
- Unidades: IME; EACH; FFLCH
- DOI: 10.1007/978-3-032-15987-8_22
- Subjects: APRENDIZADO COMPUTACIONAL; PROCESSOS ESTOCÁSTICOS
- Keywords: Reinforcement Learning; Stocastic Shortest Path; Dead-End Discovery; Secure Exploration; LLMs
- Agências de fomento:
- Language: Inglês
- Imprenta:
- Source:
- Título: Intelligent Systems 2025. Lecture Notes in Computer Science (LNAI)
- ISSN: 0302-9743
- Volume/Número/Paginação/Ano: v. 16179, p. 331–346, 2026
- Conference titles: Brazilian Conference on Intelligent Systems - BRACIS
- Este periódico é de acesso aberto
- Este artigo NÃO é de acesso aberto
-
ABNT
POLAR, Christian Jorge Delgado et al. Dead-end discovery and secure exploration via large language models. 2026, Anais.. Cham: Instituto de Matemática e Estatística, Universidade de São Paulo, 2026. p. 331–346. Disponível em: https://doi.org/10.1007/978-3-032-15987-8_22. Acesso em: 24 fev. 2026. -
APA
Polar, C. J. D., Barros, L. N. de, Freire, V., & Delgado, K. V. (2026). Dead-end discovery and secure exploration via large language models. In Intelligent Systems 2025. Lecture Notes in Computer Science (LNAI) (Vol. 16179, p. 331–346). Cham: Instituto de Matemática e Estatística, Universidade de São Paulo. doi:10.1007/978-3-032-15987-8_22 -
NLM
Polar CJD, Barros LN de, Freire V, Delgado KV. Dead-end discovery and secure exploration via large language models [Internet]. Intelligent Systems 2025. Lecture Notes in Computer Science (LNAI). 2026 ; 16179 331–346.[citado 2026 fev. 24 ] Available from: https://doi.org/10.1007/978-3-032-15987-8_22 -
Vancouver
Polar CJD, Barros LN de, Freire V, Delgado KV. Dead-end discovery and secure exploration via large language models [Internet]. Intelligent Systems 2025. Lecture Notes in Computer Science (LNAI). 2026 ; 16179 331–346.[citado 2026 fev. 24 ] Available from: https://doi.org/10.1007/978-3-032-15987-8_22 - Reinforcement learning with utility-based semantic for goals
- ALICAT: a customized approach to item selection process in computerized adaptive testing
- Risk-sensitive piecewise-linear policy iteration for stochastic shortest path Markov decision processes
- Políticas aproximadas e parciais sensíveis a risco para o controle da propagação de doenças infecciosas
- Políticas sensíveis ao risco para o controle da propagação de doenças infecciosas
- Robust optimization for hybrid MDPs with state-dependent noise
- Symbolic bounded real-time dynamic programming
- Processo de decisão Markoviano com transição valorada por conjunto modelado como um Jogo alternado de soma zero
- B^2RTDP: an efficient solution for bounded-parameter Markov decision process
- Symbolic dynamic programming for discrete and continuous state MDPs
Informações sobre o DOI: 10.1007/978-3-032-15987-8_22 (Fonte: oaDOI API)
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| 3290652_-_Dead-end_discov... |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
