Exportar registro bibliográfico

Aprendizagem profunda aplicada a estimação monocular de profundidade: uma abordagem baseada em atenção e complementação (2021)

  • Authors:
  • Autor USP: MENDES, RAUL DE QUEIROZ - EESC
  • Unidade: EESC
  • Sigla do Departamento: SEL
  • Subjects: VISÃO COMPUTACIONAL; IMAGEM
  • Keywords: Aprendizagem profunda
  • Agências de fomento:
  • Language: Português
  • Abstract: Medir a profundidade de imagens é um problema inverso fundamental dentro do campo da Visão Computacional, uma vez que as informações de profundidade são obtidas por meio de imagens 2D, as quais podem ser geradas a partir de infinitas possibilidades de cenas reais observadas. Ademais, tal problema é não bem-posto, pois os valores estimados de profundidade são fortemente dependentes das imagens de espaços do mundo real adquiridas. Outras importantes tarefas da área de Robótica recorrem a medidas de profundidade, como a Localização e Mapeamento Simultâneos (SLAM) e Structure from Motion (SfM). Beneficiando-se do progresso de Redes Neurais Convolucionais Profundas (DCNNs) para explorar características estruturais e informações espaciais de imagens, a Estimação de Profundidade a partir de Uma Única Imagem (SIDE) é frequentemente destacada em meios de inovação científica e tecnológica, já que este conceito proporciona vantagens relacionadas ao seu baixo custo de implementação, menores restrições de uso e robustez a condições ambientais. No contexto de veículos autônomos, as DCNNs otimizam a tarefa de SIDE através da predição de mapas com dados precisos de profundidade, os quais são indispensáveis durante o processo de navegação autônoma em locais distintos. No entanto, essas redes geralmente são treinadas em mapas de profundidade esparsos e ruidosos, gerados por varreduras de Light Detection and Ranging laser (LiDAR) ou structured-light e time-of-flight devices (Kinect), e sãoexecutadas com alto custo computacional, exigindo Unidades de Processamento Gráfico (GPUs) de alto desempenho. Sendo assim, este trabalho propõe uma nova arquitetura de DCNN supervisionada e funções de custo baseadas em atenção para solucionar problemas de SIDE. Inova-se também ao incorporar múltiplas técnicas de Visão Computacional, como a utilização de algoritmos de densificação e informações adicionais de semântica, de profundidade e de normais de superfície ao treinamento de tal DCNN. O método introduzido neste trabalho tem foco em aplicações de veículos autônomos em ambientes internos e externos
  • Imprenta:
  • Data da defesa: 30.07.2021
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      MENDES, Raul de Queiroz. Aprendizagem profunda aplicada a estimação monocular de profundidade: uma abordagem baseada em atenção e complementação. 2021. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2021. Disponível em: https://www.teses.usp.br/teses/disponiveis/18/18153/tde-02092021-110320/. Acesso em: 23 abr. 2024.
    • APA

      Mendes, R. de Q. (2021). Aprendizagem profunda aplicada a estimação monocular de profundidade: uma abordagem baseada em atenção e complementação (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/18/18153/tde-02092021-110320/
    • NLM

      Mendes R de Q. Aprendizagem profunda aplicada a estimação monocular de profundidade: uma abordagem baseada em atenção e complementação [Internet]. 2021 ;[citado 2024 abr. 23 ] Available from: https://www.teses.usp.br/teses/disponiveis/18/18153/tde-02092021-110320/
    • Vancouver

      Mendes R de Q. Aprendizagem profunda aplicada a estimação monocular de profundidade: uma abordagem baseada em atenção e complementação [Internet]. 2021 ;[citado 2024 abr. 23 ] Available from: https://www.teses.usp.br/teses/disponiveis/18/18153/tde-02092021-110320/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024