TCDA: Temporally-Consistent Depth-Aware Unsupervised Domain Adaptation for Semantic Segmentation in Urban Scenes (2025)
- Authors:
- Autor USP: BARBOSA, FELIPE MANFIO - ICMC
- Unidade: ICMC
- Sigla do Departamento: SSC
- DOI: 10.11606/D.55.2025.tde-07082025-113420
- Subjects: APRENDIZADO COMPUTACIONAL; VEÍCULOS AUTÔNOMOS; REDES NEURAIS
- Keywords: Adaptação de domínio não supervisionada; ADAS; Aprendizado auto-supervisionado; Aprendizado profundo; Autonomous vehicles; Consistência temporal; Deep learning; Depth; Multimodal perception; Percepção multimodal; Profundidade; Segmentação semântica; Self-supervised learning; Semantic segmentation; Temporal consistency; Unsupervised domain adaptation
- Agências de fomento:
- Language: Inglês
- Abstract: A percepção visual desempenha um papel fundamental na localização e navegação de veículos autônomos em ambientes urbanos. Neste cenário, a Segmentação Semântica é uma técnica que permite a identificação e classificação de elementos, assim como a compreensão de suas relações na cena sob análise. Com o advento das Redes Neurais Convolucionais, os métodos de Segmentação Semântica alcançaram um novo nível de precisão (90% em bases como Cityscapes). No entanto, tal nível de performance é obtido por arquiteturas complexas de Redes Neurais, as quais requerem hardwares de processamento com alto custo monetário. Adicionalmente, adaptar tais modelos a novos domínios de aplicação permanece um desafio, principalmente devido à impossibilidade de ajuste fino para todos os possíveis domínios-alvo, dado o alto custo de anotação de dados. Apesar de engines de simulação permitirem a geração de um grande número de dados rotulados, a Divergência de Domínio entre dados sintéticos e reais ainda compromete o uso direto de modelos pré-treinados (em dados sintéticos) em cenários de aplicação. Diante disso, a Adaptação de Domínio Não Supervisionada surgiu como uma alternativa para exploração dados não rotulados e aprendizado Auto-supervisionado como ferramentas auxiliares na Adaptação de Domínio. No entanto, a maioria da literatura adota métodos baseados em dados RGB, com processamento quadro a quadro. Diante disso, argumentamos que o uso de dados temporais e de profundidade como fontes auxiliares desupervisão permanece sub explorado. Enquanto dados de profundidade têm forte valor geométrico/estrutural e tendem a ser mais robustos às mudanças de domínio, dados temporais podem fornecer grandes quantidades de dados não rotulados e pistas temporais para apoiar o processo de adaptação. Diante dos pontos previamente apresentados, neste trabalho propomos um método de adaptação de domínio sintético-para-real não supervisionado, construído a partir de três pilares centrais: eficiência, consciência geométrica e temporal. Os resultados demonstram que o método proposto contribui para a melhoria da qualidade da segmentação, assim como da consistência temporal no domínio-alvo. Especificamente, obtém-se um ganho de aproximadamente 250% no valor médio da Intersecção sobre União (mIoU) para classes críticasrua, calçada, carro e pessoaem comparação com o modelo de referência (não adaptado).
- Imprenta:
- Publisher place: São Carlos
- Date published: 2025
- Data da defesa: 02.06.2025
- Status:
- Artigo publicado em periódico de acesso aberto (Gold Open Access)
- Versão do Documento:
- Versão publicada (Published version)
- Acessar versão aberta:
-
ABNT
BARBOSA, Felipe Manfio. TCDA: Temporally-Consistent Depth-Aware Unsupervised Domain Adaptation for Semantic Segmentation in Urban Scenes. 2025. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2025. Disponível em: https://teses.usp.br/teses/disponiveis/55/55134/tde-07082025-113420/. Acesso em: 07 abr. 2026. -
APA
Barbosa, F. M. (2025). TCDA: Temporally-Consistent Depth-Aware Unsupervised Domain Adaptation for Semantic Segmentation in Urban Scenes (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de https://teses.usp.br/teses/disponiveis/55/55134/tde-07082025-113420/ -
NLM
Barbosa FM. TCDA: Temporally-Consistent Depth-Aware Unsupervised Domain Adaptation for Semantic Segmentation in Urban Scenes [Internet]. 2025 ;[citado 2026 abr. 07 ] Available from: https://teses.usp.br/teses/disponiveis/55/55134/tde-07082025-113420/ -
Vancouver
Barbosa FM. TCDA: Temporally-Consistent Depth-Aware Unsupervised Domain Adaptation for Semantic Segmentation in Urban Scenes [Internet]. 2025 ;[citado 2026 abr. 07 ] Available from: https://teses.usp.br/teses/disponiveis/55/55134/tde-07082025-113420/ - Estudo de estratégia de aprendizado auto-supervisionado para aprimoramento da consistência temporal em modelo de segmentação semântica baseado em deep learning
- In defense of multimodal and temporal data for unsupervised domain adaptation
- Temporal consistency as pretext task in unsupervised domain adaptation for semantic segmentation
- Self-supervised temporal consistency applied to domain adaptation in semantic segmentation of urban scenes
- Um estudo comparativo de métodos de deep learning aplicados à segmentação semântica de obstáculos, zonas seguras e não seguras para navegação a partir de dados RGB-D
- 3D perception for autonomous mobile robots navigation using deep learning for safe zones detection: a comparative study
- CARINA Project: visual perception systems applied for autonomous vehicles and advanced driver assistance systems (ADAS)
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
