Reward tuning for self-adaptive policy in MDP based distributed decision-making to ensure a safe mission planning (2020)
- Authors:
- Autor USP: BRANCO, KALINKA REGINA LUCAS JAQUIE CASTELO - ICMC
- Unidade: ICMC
- DOI: 10.1109/DSN-W50199.2020.00025
- Subjects: PROCESSOS DE MARKOV; SISTEMAS DISTRIBUÍDOS; AERONAVES NÃO TRIPULADAS
- Keywords: Markov Decision Process; Concurrent Actions; Reward Tuning; Behavior Conflicts; Constraints on MDPs
- Language: Inglês
- Imprenta:
- Publisher: IEEE
- Publisher place: Los Alamitos
- Date published: 2020
- Source:
- Título do periódico: Proceedings
- Conference titles: Annual IEEE/IFIP International Conference on Dependable Systems and Networks Workshops - DSN-W
- Este periódico é de assinatura
- Este artigo NÃO é de acesso aberto
- Cor do Acesso Aberto: closed
-
ABNT
HAMADOUCHE, Mohand e DEZAN, Catherine e BRANCO, Kalinka Regina Lucas Jaquie Castelo. Reward tuning for self-adaptive policy in MDP based distributed decision-making to ensure a safe mission planning. 2020, Anais.. Los Alamitos: IEEE, 2020. Disponível em: https://doi.org/10.1109/DSN-W50199.2020.00025. Acesso em: 19 set. 2024. -
APA
Hamadouche, M., Dezan, C., & Branco, K. R. L. J. C. (2020). Reward tuning for self-adaptive policy in MDP based distributed decision-making to ensure a safe mission planning. In Proceedings. Los Alamitos: IEEE. doi:10.1109/DSN-W50199.2020.00025 -
NLM
Hamadouche M, Dezan C, Branco KRLJC. Reward tuning for self-adaptive policy in MDP based distributed decision-making to ensure a safe mission planning [Internet]. Proceedings. 2020 ;[citado 2024 set. 19 ] Available from: https://doi.org/10.1109/DSN-W50199.2020.00025 -
Vancouver
Hamadouche M, Dezan C, Branco KRLJC. Reward tuning for self-adaptive policy in MDP based distributed decision-making to ensure a safe mission planning [Internet]. Proceedings. 2020 ;[citado 2024 set. 19 ] Available from: https://doi.org/10.1109/DSN-W50199.2020.00025 - Contribuições na área de Sistemas Distribuídos e Redes de Computadores e suas aplicações em Sistemas Embarcados Críticos
- Modelo de organização para redes de sensores sem fio móveis inspirada em colônia de abelhas
- Knowledge-based framework: its specification and new related discussions
- Sphere: a novel platform for increasing safety & security on unmanned systems
- Performance evaluation of the extended Kalman filter and unscented Kalman filter
- Mosaicagem automática e em tempo real de imagens obtidas a partir de VANTs de asa rotativa
- Evaluation of cryptography applied to broadcast storm mitigation algorithms in FANETs
- Local data fusion algorithm for fire detection through mobile robot
- Comparison of path-following algorithms for loiter paths of unmanned aerial vehicles
- Comparison of value iteration, policy iteration and Q-Learning for solving decision-making problems
Informações sobre o DOI: 10.1109/DSN-W50199.2020.00025 (Fonte: oaDOI API)
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
3018402.pdf |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas