Dead-end discovery and secure exploration via large language models (2026)
- Authors:
- USP affiliated authors: BARROS, LELIANE NUNES DE - IME ; DELGADO, KARINA VALDIVIA - EACH ; SILVA, VALDINEI FREIRE DA - FFLCH ; POLAR, CHRISTIAN JORGE DELGADO - IME
- Unidades: IME; EACH; FFLCH
- DOI: 10.1007/978-3-032-15987-8_22
- Subjects: APRENDIZADO COMPUTACIONAL; PROCESSOS ESTOCÁSTICOS
- Keywords: Reinforcement Learning; Stocastic Shortest Path; Dead-End Discovery; Secure Exploration; LLMs
- Agências de fomento:
- Language: Inglês
- Imprenta:
- Source:
- Título: Lecture Notes in Computer Science
- ISSN: 0302-9743
- Volume/Número/Paginação/Ano: v. 16179 LNCS, p. 331-346, 2026
- Conference titles: Brazilian Conference on Intelligent Systems - BRACIS
- Status:
- Nenhuma versão em acesso aberto identificada
-
ABNT
POLAR, Christian Jorge Delgado et al. Dead-end discovery and secure exploration via large language models. Lecture Notes in Computer Science. Cham: Instituto de Matemática e Estatística, Universidade de São Paulo. Disponível em: https://doi.org/10.1007/978-3-032-15987-8_22. Acesso em: 14 abr. 2026. , 2026 -
APA
Polar, C. J. D., Barros, L. N. de, Freire, V., & Delgado, K. V. (2026). Dead-end discovery and secure exploration via large language models. Lecture Notes in Computer Science. Cham: Instituto de Matemática e Estatística, Universidade de São Paulo. doi:10.1007/978-3-032-15987-8_22 -
NLM
Polar CJD, Barros LN de, Freire V, Delgado KV. Dead-end discovery and secure exploration via large language models [Internet]. Lecture Notes in Computer Science. 2026 ; 16179 LNCS 331-346.[citado 2026 abr. 14 ] Available from: https://doi.org/10.1007/978-3-032-15987-8_22 -
Vancouver
Polar CJD, Barros LN de, Freire V, Delgado KV. Dead-end discovery and secure exploration via large language models [Internet]. Lecture Notes in Computer Science. 2026 ; 16179 LNCS 331-346.[citado 2026 abr. 14 ] Available from: https://doi.org/10.1007/978-3-032-15987-8_22 - Reinforcement learning with utility-based semantic for goals
- ALICAT: a customized approach to item selection process in computerized adaptive testing
- Políticas aproximadas e parciais sensíveis a risco para o controle da propagação de doenças infecciosas
- Políticas sensíveis ao risco para o controle da propagação de doenças infecciosas
- Risk-sensitive piecewise-linear policy iteration for stochastic shortest path Markov decision processes
- Symbolic bounded real-time dynamic programming
- Processo de decisão Markoviano com transição valorada por conjunto modelado como um Jogo alternado de soma zero
- Symbolic dynamic programming for discrete and continuous state MDPs
- Occupation measure heuristics to solve stochastic shortest path with dead ends
- Risk-sensitive Markov decision process with limited budget
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| 3290652_-_Dead-end_discov... |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
