Exportar registro bibliográfico

Uso de política abstrata estocástica na navegação robótica (2011)

  • Authors:
  • USP affiliated author: MATOS, TIAGO - EP
  • School: EP
  • Sigla do Departamento: PCS
  • Subjects: INTELIGÊNCIA ARTIFICIAL; ROBÓTICA; APRENDIZADO COMPUTACIONAL RELACIONAL
  • Language: Português
  • Abstract: A maioria das propostas de planejamento de rotas para robôs móveis não leva em conta a existência de soluções para problemas similares ao aprender a política para resolver um novo problema; e devido a isto, o problema de navegação corrente deve ser resolvido a partir do zero, o que pode ser excessivamente custoso em relação ao tempo. Neste trabalho é realizado o acoplamento do conhecimento prévio obtido de soluções similares, representado por uma política abstrata, a um processo de aprendizado por reforço. Além disto, este trabalho apresenta uma arquitetura para o aprendizado por reforço simultâneo, de nome ASAR, onde a política abstrata auxilia na inicialização da política para o problema concreto, e ambas as políticas são refinadas através da exploração. Para a construção da política abstrata é proposto um algoritmo, nomeado X-TILDE, que constrói uma política abstrata estocástica, a fim de reduzir a perda de informação. A arquitetura proposta é comparada com um algoritmo de aprendizado padrão e os resultados demonstram que ela é eficaz em acelerar a construção da política para problemas práticos.
  • Imprenta:
  • Data da defesa: 06.09.2011
  • Online source access
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      MATOS, Tiago. Uso de política abstrata estocástica na navegação robótica. 2011. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2011. Disponível em: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-12122011-152445/pt-br.php. Acesso em: 25 jun. 2022.
    • APA

      Matos, T. (2011). Uso de política abstrata estocástica na navegação robótica (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/3/3141/tde-12122011-152445/pt-br.php
    • NLM

      Matos T. Uso de política abstrata estocástica na navegação robótica [Internet]. 2011 ;[citado 2022 jun. 25 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-12122011-152445/pt-br.php
    • Vancouver

      Matos T. Uso de política abstrata estocástica na navegação robótica [Internet]. 2011 ;[citado 2022 jun. 25 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-12122011-152445/pt-br.php

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2022