Exportar registro bibliográfico

Agente topológico de aprendizado por reforço (2004)

  • Authors:
  • Autor USP: BRAGA, ARTHUR PLÍNIO DE SOUZA - EESC
  • Unidade: EESC
  • Sigla do Departamento: SEL
  • Subjects: APRENDIZAGEM; REFORÇO; MAPAS COGNITIVOS; ROBÔS
  • Language: Português
  • Abstract: Os métodos de Aprendizagem por Reforço (AR) se mostram adequados para problemas de tomadas de decisões em diversos domínios por sua estrutura flexível e adaptável. Apesar de promissores, os métodos AR frequentemente tem seu campo de atuação prático restrito a problemas com espaço de estados de pequeno ou médio porte devido em muito à forma com que realizam a estimativa da função de avaliação. Nesta tese, uma nova abordagem de AR, denominada de Agente Topológico de Aprendizagem por Reforço (ATAR), inspirada em aprendizagem latente, é proposta para acelerar a aprendizagem por reforço através de um mecanismo alternativo de seleção dos pares estado-ação para atualização da estimativa da função de avaliação. A aprendizagem latente refere-se à aprendizagem animal que ocorre na ausência de reforço e que não é aparente até que um sinal de reforço seja percebido pelo agente. Este aprendizado faz com que um agente aprenda parcialmente uma tarefa mesmo antes que este receba qualquer sinal de reforço. Mapas Cognitivos são usualmente empregados para codificar a informação do ambiente em que o agente está imerso. Desta forma, o ATAR usa um mapa topológico, baseado em Mapas Auto-Organizáveis, para realizar as funções do mapa cognitivo e permitir um mecanismo simples de propagação das atualizações. O ATAR foi testado, em simulação, para planejamento de navegação de um robô móvel em ambientes inicialmente desconhecidos e não-estruturados. Comparações com outros seis algoritmos AR avaliaram comparativamente o desempenho do agente proposto na navegação. Os resultados obtidos são promissores e comparáveis com os algoritmos AR mais rápidos testados, alcançando em alguns ensaios desempenho superior aos dos demais algoritmos -principalmente nas simulações que consideram situações observadas em ambientes não-estruturados. Três características do ATAR original foram alteradas para tornar ainda mais viável sua aplicação prática: (i) mudanças no mapa topológico para reduzir o número de vértices, (ii) mudança na heurística usada na seleção das ações do agente e (iii) variações na estratégia de exploração do ATAR. Do ponto (i), foi proposto e implementado um novo mapa topológico, o Mapa Topológico Incremental Classificador – MTIC, que a partir da classificação dos estados do ambiente gera os vértices de uma triangularização de Watson. O ponto (ii) criou um método aplicável a outros problemas de planejamento de trajetória em grafos denominado de Melhoria das trajetórias por detecção de ponto interior. O terceiro estudou estratégias direcionadas de exploração como uma opção para acelerar o aprendizado do ATAR
  • Imprenta:
  • Data da defesa: 07.04.2004
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      BRAGA, Arthur Plínio de Souza; ARAÚJO, Aluízio Fausto Ribeiro. Agente topológico de aprendizado por reforço. 2004.Universidade de São Paulo, São Carlos, 2004. Disponível em: < http://www.teses.usp.br/teses/disponiveis/18/18133/tde-21102011-081848/pt-br.php >.
    • APA

      Braga, A. P. de S., & Araújo, A. F. R. (2004). Agente topológico de aprendizado por reforço. Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/18/18133/tde-21102011-081848/pt-br.php
    • NLM

      Braga AP de S, Araújo AFR. Agente topológico de aprendizado por reforço [Internet]. 2004 ;Available from: http://www.teses.usp.br/teses/disponiveis/18/18133/tde-21102011-081848/pt-br.php
    • Vancouver

      Braga AP de S, Araújo AFR. Agente topológico de aprendizado por reforço [Internet]. 2004 ;Available from: http://www.teses.usp.br/teses/disponiveis/18/18133/tde-21102011-081848/pt-br.php

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2021