Aprendizado por reforço profundo para navegação visual semântica com memória (2020)
- Authors:
- Autor USP: SANTOS, IURY BATISTA DE ANDRADE - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- Subjects: ROBÓTICA; ROBÔS; VISÃO COMPUTACIONAL; APRENDIZADO COMPUTACIONAL; REDES NEURAIS; INTERAÇÃO HOMEM-MÁQUINA
- Keywords: Aprendizado por reforço profundo; Aprendizagem profunda; Deep learning; Deep reinforcement learning; Navegação semântica; Navegação visual; Robotics; Semantic navigation; Visual navigation
- Agências de fomento:
- Language: Português
- Abstract: A navegação de robôs móveis é um tema amplamente estudado ao longo de décadas, sendo esta uma atividade crucial para a inserção de robôs em diversos cenários. Contudo, ambientes complexos e mutáveis, como interiores de residências, ainda apresentam desafios a serem superados, sendo objetos de estudo em diversos trabalhos que adotam abordagens com visão computacional sem usar mapas topológicos ou métricos. Este trabalho propõe uma arquitetura para navegação de robôs móveis visando a busca objeto-direcionada em ambientes internos de residências, utilizando métodos de visão computacional e informações semânticas com memória. A arquitetura proposta tem capacidade de generalizar por meio de conhecimento a priori dos objetos detectados em cenas e também reforçar relacionamentos por meio de experiências passadas, em uma abordagem de navegação baseada em aprendizado. Para tanto, são adotados os seguintes modelos de aprendizado de máquina: redes neurais convolucionais, redes neurais de grafos, redes neurais recorrentes e aprendizado por reforço profundo, em uma abordagem objeto-direcionada. Esta arquitetura foi treinada em diversos ambientes domésticos, adotando-se um ambiente simulado fotorrealista. Esta arquitetura foi avaliada por meio de análise qualitativa, com execuções de episódios do agente no ambiente simulado de maneira visual, e análise quantitativa, usando medidas como taxas de sucesso e taxas de sucesso ponderadas pela trajetória. Políticas aprendidas por meio daarquitetura proposta foram comparadas com agentes de política randômica, com agentes utilizando apenas aprendizado por reforço e, por fim, com agentes com políticas de navegação semântica sem memória. Os experimentos realizados mostraram um comportamento mais exploratório da arquitetura proposta em relação a outros sem memória, obtendo maiores taxas de êxito nas tarefas em ambas as métricas. Quando exposto a cenários mais restritos, e por conseguinte de maior dificuldade, as políticas aprendidas por estes modelos apresentaram os melhores resultados, com menor queda no desempenho quando comparados as execuções menos restritivas e com os demais modelos. Desta forma, o modelo proposto apresentou resultados consistentes de melhoria nas políticas aprendidas pelos agentes, resultando em comportamentos bem sucedidos para tarefas de busca objeto-direcionada em ambientes internos de residências.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2020
- Data da defesa: 27.11.2020
-
ABNT
SANTOS, Iury Batista de Andrade. Aprendizado por reforço profundo para navegação visual semântica com memória. 2020. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2020. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-16122020-164714/. Acesso em: 08 jun. 2025. -
APA
Santos, I. B. de A. (2020). Aprendizado por reforço profundo para navegação visual semântica com memória (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-16122020-164714/ -
NLM
Santos IB de A. Aprendizado por reforço profundo para navegação visual semântica com memória [Internet]. 2020 ;[citado 2025 jun. 08 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-16122020-164714/ -
Vancouver
Santos IB de A. Aprendizado por reforço profundo para navegação visual semântica com memória [Internet]. 2020 ;[citado 2025 jun. 08 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-16122020-164714/ - Deep reinforcement learning for visual semantic navigation with memory
- A deep reinforcement learning approach with visual semantic navigation with memory for mobile robots in indoor home context
- ProtoAL: interpretable deep active learning with prototypes for medical imaging
- Neural architecture search with interpretable meta-features and fast predictors
- Explainable machine learning for breast cancer diagnosis
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas