Filtros : "Reinforcement Learning" Removido: "2017" Limpar

Filtros



Refine with date range


  • Source: Lecture Notes in Computer Science. Conference titles: Brazilian Conference on Intelligent Systems - BRACIS. Unidades: IME, EACH, FFLCH

    Subjects: APRENDIZADO COMPUTACIONAL, PROCESSOS ESTOCÁSTICOS

    PrivadoAcesso à fonteDOIHow to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
    • ABNT

      POLAR, Christian Jorge Delgado et al. Dead-end discovery and secure exploration via large language models. Lecture Notes in Computer Science. Cham: Instituto de Matemática e Estatística, Universidade de São Paulo. Disponível em: https://doi.org/10.1007/978-3-032-15987-8_22. Acesso em: 28 abr. 2026. , 2026
    • APA

      Polar, C. J. D., Barros, L. N. de, Freire, V., & Delgado, K. V. (2026). Dead-end discovery and secure exploration via large language models. Lecture Notes in Computer Science. Cham: Instituto de Matemática e Estatística, Universidade de São Paulo. doi:10.1007/978-3-032-15987-8_22
    • NLM

      Polar CJD, Barros LN de, Freire V, Delgado KV. Dead-end discovery and secure exploration via large language models [Internet]. Lecture Notes in Computer Science. 2026 ; 16179 LNCS 331-346.[citado 2026 abr. 28 ] Available from: https://doi.org/10.1007/978-3-032-15987-8_22
    • Vancouver

      Polar CJD, Barros LN de, Freire V, Delgado KV. Dead-end discovery and secure exploration via large language models [Internet]. Lecture Notes in Computer Science. 2026 ; 16179 LNCS 331-346.[citado 2026 abr. 28 ] Available from: https://doi.org/10.1007/978-3-032-15987-8_22
  • Unidade: IME

    Subjects: PROCESSOS DE MARKOV, PROCESSOS ESTOCÁSTICOS

    Acesso à fonteAcesso à fonteDOIHow to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
    • ABNT

      PEREIRA NETO, Eduardo Lopes. Risk Sensitivity with exponential functions in reinforcement learning: an empirical analysis. 2023. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2023. Disponível em: https://teses.usp.br/teses/disponiveis/45/45134/tde-06122023-173644/. Acesso em: 28 abr. 2026.
    • APA

      Pereira Neto, E. L. (2023). Risk Sensitivity with exponential functions in reinforcement learning: an empirical analysis (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/45/45134/tde-06122023-173644/
    • NLM

      Pereira Neto EL. Risk Sensitivity with exponential functions in reinforcement learning: an empirical analysis [Internet]. 2023 ;[citado 2026 abr. 28 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-06122023-173644/
    • Vancouver

      Pereira Neto EL. Risk Sensitivity with exponential functions in reinforcement learning: an empirical analysis [Internet]. 2023 ;[citado 2026 abr. 28 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-06122023-173644/
  • Unidade: EACH

    Subjects: APRENDIZADO COMPUTACIONAL, JOGOS DE COMPUTADOR

    Acesso à fonteAcesso à fonteDOIHow to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
    • ABNT

      GOMES, Eric Muszalska Claro. Descoberta de Options Multi-tarefas: um estudo em StarCraft II. 2023. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2023. Disponível em: https://teses.usp.br/teses/disponiveis/100/100131/tde-01062023-160931/. Acesso em: 28 abr. 2026.
    • APA

      Gomes, E. M. C. (2023). Descoberta de Options Multi-tarefas: um estudo em StarCraft II (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/100/100131/tde-01062023-160931/
    • NLM

      Gomes EMC. Descoberta de Options Multi-tarefas: um estudo em StarCraft II [Internet]. 2023 ;[citado 2026 abr. 28 ] Available from: https://teses.usp.br/teses/disponiveis/100/100131/tde-01062023-160931/
    • Vancouver

      Gomes EMC. Descoberta de Options Multi-tarefas: um estudo em StarCraft II [Internet]. 2023 ;[citado 2026 abr. 28 ] Available from: https://teses.usp.br/teses/disponiveis/100/100131/tde-01062023-160931/
  • Unidade: EACH

    Subjects: APRENDIZADO COMPUTACIONAL, MERCADO FINANCEIRO, REDES COMPLEXAS

    Acesso à fonteAcesso à fonteDOIHow to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
    • ABNT

      MELO, Fernando Danilo de. Otimização de portfólio: uma análise através de técnicas de Reinforcement Learning e Autoencoders. 2022. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2022. Disponível em: https://teses.usp.br/teses/disponiveis/100/100132/tde-25112022-170424/. Acesso em: 28 abr. 2026.
    • APA

      Melo, F. D. de. (2022). Otimização de portfólio: uma análise através de técnicas de Reinforcement Learning e Autoencoders (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/100/100132/tde-25112022-170424/
    • NLM

      Melo FD de. Otimização de portfólio: uma análise através de técnicas de Reinforcement Learning e Autoencoders [Internet]. 2022 ;[citado 2026 abr. 28 ] Available from: https://teses.usp.br/teses/disponiveis/100/100132/tde-25112022-170424/
    • Vancouver

      Melo FD de. Otimização de portfólio: uma análise através de técnicas de Reinforcement Learning e Autoencoders [Internet]. 2022 ;[citado 2026 abr. 28 ] Available from: https://teses.usp.br/teses/disponiveis/100/100132/tde-25112022-170424/

Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2026