ReP USP - Resultado da busca

Trabalho de evento
Gradient estimation in model-based reinforcement learning: a study on linear quadratic environments (2021)
Lovatto, Ângelo Gregório ; Bueno, Thiago Pereira ; Barros, Leliane Nunes de
Source: Proceedings. Conference titles: Brazilian Conference on Intelligent Systems - BRACIS. Unidade: IME
Subjects: MODELOS PARA PROCESSOS ESTOCÁSTICOS, APRENDIZADO COMPUTACIONAL
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
ABNT
LOVATTO, Ângelo Gregório e BUENO, Thiago Pereira e BARROS, Leliane Nunes de. Gradient estimation in model-based reinforcement learning: a study on linear quadratic environments. 2021, Anais.. Cham: Springer, 2021. Disponível em: https://doi.org/10.1007/978-3-030-91702-9_3. Acesso em: 06 nov. 2024.
APA
Lovatto, Â. G., Bueno, T. P., & Barros, L. N. de. (2021). Gradient estimation in model-based reinforcement learning: a study on linear quadratic environments. In Proceedings. Cham: Springer. doi:10.1007/978-3-030-91702-9_3
NLM
Lovatto ÂG, Bueno TP, Barros LN de. Gradient estimation in model-based reinforcement learning: a study on linear quadratic environments [Internet]. Proceedings. 2021 ;[citado 2024 nov. 06 ] Available from: https://doi.org/10.1007/978-3-030-91702-9_3
Vancouver
Lovatto ÂG, Bueno TP, Barros LN de. Gradient estimation in model-based reinforcement learning: a study on linear quadratic environments [Internet]. Proceedings. 2021 ;[citado 2024 nov. 06 ] Available from: https://doi.org/10.1007/978-3-030-91702-9_3
Tese (Doutorado)
Planning in stochastic computation graphs: solving stochastic nonlinear problems with backpropagation (2021)
Bueno, Thiago Pereira; Barros, Leliane Nunes de (Orientador) ; Mauá, Denis Deratani (Orientador)
Unidade: IME
Subjects: INTELIGÊNCIA ARTIFICIAL, APRENDIZADO COMPUTACIONAL, REDES NEURAIS, MODELOS PARA PROCESSOS ESTOCÁSTICOS
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
ABNT
BUENO, Thiago Pereira. Planning in stochastic computation graphs: solving stochastic nonlinear problems with backpropagation. 2021. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2021. Disponível em: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-29102021-133418/. Acesso em: 06 nov. 2024.
APA
Bueno, T. P. (2021). Planning in stochastic computation graphs: solving stochastic nonlinear problems with backpropagation (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/45/45134/tde-29102021-133418/
NLM
Bueno TP. Planning in stochastic computation graphs: solving stochastic nonlinear problems with backpropagation [Internet]. 2021 ;[citado 2024 nov. 06 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-29102021-133418/
Vancouver
Bueno TP. Planning in stochastic computation graphs: solving stochastic nonlinear problems with backpropagation [Internet]. 2021 ;[citado 2024 nov. 06 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-29102021-133418/
Trabalho de evento
On the performance of planning through backpropagation (2020)
Scaroni, Renato; Bueno, Thiago Pereira; Barros, Leliane Nunes de ; Mauá, Denis Deratani
Source: Proceedings. Conference titles: Brazilian Conference on Intelligent Systems - BRACIS. Unidade: IME
Subjects: APRENDIZAGEM PROFUNDA, COMPUTAÇÃO APLICADA, METODOLOGIA E TÉCNICAS DE COMPUTAÇÃO
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
ABNT
SCARONI, Renato et al. On the performance of planning through backpropagation. 2020, Anais.. Cham: Springer, 2020. Disponível em: https://doi.org/10.1007/978-3-030-61380-8_8. Acesso em: 06 nov. 2024.
APA
Scaroni, R., Bueno, T. P., Barros, L. N. de, & Mauá, D. D. (2020). On the performance of planning through backpropagation. In Proceedings. Cham: Springer. doi:10.1007/978-3-030-61380-8_8
NLM
Scaroni R, Bueno TP, Barros LN de, Mauá DD. On the performance of planning through backpropagation [Internet]. Proceedings. 2020 ;[citado 2024 nov. 06 ] Available from: https://doi.org/10.1007/978-3-030-61380-8_8
Vancouver
Scaroni R, Bueno TP, Barros LN de, Mauá DD. On the performance of planning through backpropagation [Internet]. Proceedings. 2020 ;[citado 2024 nov. 06 ] Available from: https://doi.org/10.1007/978-3-030-61380-8_8
Trabalho de evento
Decision-aware model learning for actor-critic methods: when theory does not meet practice (2020)
Lovatto, Ângelo Gregório ; Bueno, Thiago Pereira ; Mauá, Denis Deratani ; Barros, Leliane Nunes de
Source: Proceedings. Conference titles: Conference on Neural Information Processing Systems - NeurIPS. Unidade: IME
Subjects: APRENDIZADO COMPUTACIONAL, MODELOS DE APRENDIZAGEM
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
ABNT
LOVATTO, Ângelo Gregório et al. Decision-aware model learning for actor-critic methods: when theory does not meet practice. 2020, Anais.. San Diego: NeurIPS, 2020. Disponível em: https://openreview.net/pdf?id=a9lwn6v40C4. Acesso em: 06 nov. 2024.
APA
Lovatto, Â. G., Bueno, T. P., Mauá, D. D., & Barros, L. N. de. (2020). Decision-aware model learning for actor-critic methods: when theory does not meet practice. In Proceedings. San Diego: NeurIPS. Recuperado de https://openreview.net/pdf?id=a9lwn6v40C4
NLM
Lovatto ÂG, Bueno TP, Mauá DD, Barros LN de. Decision-aware model learning for actor-critic methods: when theory does not meet practice [Internet]. Proceedings. 2020 ;[citado 2024 nov. 06 ] Available from: https://openreview.net/pdf?id=a9lwn6v40C4
Vancouver
Lovatto ÂG, Bueno TP, Mauá DD, Barros LN de. Decision-aware model learning for actor-critic methods: when theory does not meet practice [Internet]. Proceedings. 2020 ;[citado 2024 nov. 06 ] Available from: https://openreview.net/pdf?id=a9lwn6v40C4
Trabalho de evento
Deep reactive policies for planning in stochastic nonlinear domains (2019)
Bueno, Thiago Pereira; Barros, Leliane Nunes de ; Mauá, Denis Deratani ; Sanner, Scott
Source: Proceedings. Conference titles: AAAI Conference on Artificial Intelligence. Unidade: IME
Assunto: APRENDIZADO COMPUTACIONAL
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
ABNT
BUENO, Thiago Pereira et al. Deep reactive policies for planning in stochastic nonlinear domains. 2019, Anais.. Palo Alto: AAAI, 2019. Disponível em: https://doi.org/10.1609/aaai.v33i01.33017530. Acesso em: 06 nov. 2024.
APA
Bueno, T. P., Barros, L. N. de, Mauá, D. D., & Sanner, S. (2019). Deep reactive policies for planning in stochastic nonlinear domains. In Proceedings. Palo Alto: AAAI. doi:10.1609/aaai.v33i01.33017530
NLM
Bueno TP, Barros LN de, Mauá DD, Sanner S. Deep reactive policies for planning in stochastic nonlinear domains [Internet]. Proceedings. 2019 ;[citado 2024 nov. 06 ] Available from: https://doi.org/10.1609/aaai.v33i01.33017530
Vancouver
Bueno TP, Barros LN de, Mauá DD, Sanner S. Deep reactive policies for planning in stochastic nonlinear domains [Internet]. Proceedings. 2019 ;[citado 2024 nov. 06 ] Available from: https://doi.org/10.1609/aaai.v33i01.33017530
Trabalho de evento
Analyzing the effect of stochastic transitions in policy gradients in deep reinforcement learning (2019)
Lovatto, Ângelo Gregório ; Bueno, Thiago Pereira; Barros, Leliane Nunes de
Source: Proceedings. Conference titles: Brazilian Conference on Intelligent Systems (BRACIS). Unidade: IME
Subjects: APRENDIZADO COMPUTACIONAL, PROCESSOS ESTOCÁSTICOS
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
ABNT
LOVATTO, Ângelo Gregório e BUENO, Thiago Pereira e BARROS, Leliane Nunes de. Analyzing the effect of stochastic transitions in policy gradients in deep reinforcement learning. 2019, Anais.. Piscataway: IEEE, 2019. Disponível em: https://doi.org/10.1109/BRACIS.2019.00079. Acesso em: 06 nov. 2024.
APA
Lovatto, Â. G., Bueno, T. P., & Barros, L. N. de. (2019). Analyzing the effect of stochastic transitions in policy gradients in deep reinforcement learning. In Proceedings. Piscataway: IEEE. doi:10.1109/BRACIS.2019.00079
NLM
Lovatto ÂG, Bueno TP, Barros LN de. Analyzing the effect of stochastic transitions in policy gradients in deep reinforcement learning [Internet]. Proceedings. 2019 ;[citado 2024 nov. 06 ] Available from: https://doi.org/10.1109/BRACIS.2019.00079
Vancouver
Lovatto ÂG, Bueno TP, Barros LN de. Analyzing the effect of stochastic transitions in policy gradients in deep reinforcement learning [Internet]. Proceedings. 2019 ;[citado 2024 nov. 06 ] Available from: https://doi.org/10.1109/BRACIS.2019.00079
Trabalho de evento
Markov decision processes specified by probabilistic logic programming: representation and solution (2017)
Bueno, Thiago Pereira; Mauá, Denis Deratani ; Barros, Leliane Nunes de ; Cozman, Fabio Gagliardi
Source: Proceedings. Conference titles: Brazilian Conference on Intelligent Systems - BRACIS. Unidades: IME, EP
Subjects: PROCESSOS DE MARKOV, PROGRAMAÇÃO LÓGICA, TOMADA DE DECISÃO
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
ABNT
BUENO, Thiago Pereira et al. Markov decision processes specified by probabilistic logic programming: representation and solution. 2017, Anais.. Piscataway: IEEE, 2017. Disponível em: https://doi.org/10.1109/BRACIS.2016.068. Acesso em: 06 nov. 2024.
APA
Bueno, T. P., Mauá, D. D., Barros, L. N. de, & Cozman, F. G. (2017). Markov decision processes specified by probabilistic logic programming: representation and solution. In Proceedings. Piscataway: IEEE. doi:10.1109/BRACIS.2016.068
NLM
Bueno TP, Mauá DD, Barros LN de, Cozman FG. Markov decision processes specified by probabilistic logic programming: representation and solution [Internet]. Proceedings. 2017 ;[citado 2024 nov. 06 ] Available from: https://doi.org/10.1109/BRACIS.2016.068
Vancouver
Bueno TP, Mauá DD, Barros LN de, Cozman FG. Markov decision processes specified by probabilistic logic programming: representation and solution [Internet]. Proceedings. 2017 ;[citado 2024 nov. 06 ] Available from: https://doi.org/10.1109/BRACIS.2016.068
Trabalho de evento-anais periodico
Modeling Markov decision processes with imprecise probabilities using probabilistic logic programming (2017)
Bueno, Thiago Pereira; Mauá, Denis Deratani ; Barros, Leliane Nunes de ; Cozman, Fabio Gagliardi
Source: PMLR: Proceedings of Machine Learning Research. Conference titles: International Symposium on Imprecise Probability: Theories and Applications - ISIPTA. Unidades: IME, EP
Subjects: PROCESSOS DE MARKOV, PROGRAMAÇÃO LÓGICA, MODELOS PARA PROCESSOS ESTOCÁSTICOS
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
ABNT
BUENO, Thiago Pereira et al. Modeling Markov decision processes with imprecise probabilities using probabilistic logic programming. PMLR: Proceedings of Machine Learning Research. Brookline: Instituto de Matemática e Estatística, Universidade de São Paulo. Disponível em: http://proceedings.mlr.press/v62/bueno17a.html. Acesso em: 06 nov. 2024. , 2017
APA
Bueno, T. P., Mauá, D. D., Barros, L. N. de, & Cozman, F. G. (2017). Modeling Markov decision processes with imprecise probabilities using probabilistic logic programming. PMLR: Proceedings of Machine Learning Research. Brookline: Instituto de Matemática e Estatística, Universidade de São Paulo. Recuperado de http://proceedings.mlr.press/v62/bueno17a.html
NLM
Bueno TP, Mauá DD, Barros LN de, Cozman FG. Modeling Markov decision processes with imprecise probabilities using probabilistic logic programming [Internet]. PMLR: Proceedings of Machine Learning Research. 2017 ;( 62): 49-60.[citado 2024 nov. 06 ] Available from: http://proceedings.mlr.press/v62/bueno17a.html
Vancouver
Bueno TP, Mauá DD, Barros LN de, Cozman FG. Modeling Markov decision processes with imprecise probabilities using probabilistic logic programming [Internet]. PMLR: Proceedings of Machine Learning Research. 2017 ;( 62): 49-60.[citado 2024 nov. 06 ] Available from: http://proceedings.mlr.press/v62/bueno17a.html
Trabalho de evento-resumo
Um software de comunicação entre um PC e uma rede ISO11783 (2004)
Bueno, Thiago Pereira; Rocha, Ricardo Moura; Hiroki, Marcelo; Fiedler, Eduardo dos Santos; Arasanz, Fabrizio Bongiorno; Saraiva, Antonio Mauro ; Guimarães, Alexandre de Almeida
Source: SIICUSP 2004: resumos. Conference titles: Simpósio Internacional de Iniciação Científica da Universidade de São Paulo. Unidade: EP
Subjects: PROTOCOLOS DE COMUNICAÇÃO, INTERFACE HOMEM-COMPUTADOR
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
ABNT
BUENO, Thiago Pereira et al. Um software de comunicação entre um PC e uma rede ISO11783. 2004, Anais.. São Paulo: USP, 2004. Disponível em: http://www.usp.br/siicusp/12osiicusp/index_2004.htm. Acesso em: 06 nov. 2024.
APA
Bueno, T. P., Rocha, R. M., Hiroki, M., Fiedler, E. dos S., Arasanz, F. B., Saraiva, A. M., & Guimarães, A. de A. (2004). Um software de comunicação entre um PC e uma rede ISO11783. In SIICUSP 2004: resumos. São Paulo: USP. Recuperado de http://www.usp.br/siicusp/12osiicusp/index_2004.htm
NLM
Bueno TP, Rocha RM, Hiroki M, Fiedler E dos S, Arasanz FB, Saraiva AM, Guimarães A de A. Um software de comunicação entre um PC e uma rede ISO11783 [Internet]. SIICUSP 2004: resumos. 2004 ;[citado 2024 nov. 06 ] Available from: http://www.usp.br/siicusp/12osiicusp/index_2004.htm
Vancouver
Bueno TP, Rocha RM, Hiroki M, Fiedler E dos S, Arasanz FB, Saraiva AM, Guimarães A de A. Um software de comunicação entre um PC e uma rede ISO11783 [Internet]. SIICUSP 2004: resumos. 2004 ;[citado 2024 nov. 06 ] Available from: http://www.usp.br/siicusp/12osiicusp/index_2004.htm

USP Schools

ReP

Filtros

Authors

USP affiliated authors

Subjects

Publisher

Conference titles

Funding Agencies