Análise comparativa de abordagens para aprendizado de transformações imagem-a-imagem (2020)
- Authors:
- Autor USP: SILVA, AUGUSTO CESAR MONTEIRO - IME
- Unidade: IME
- Sigla do Departamento: MAC
- DOI: 10.11606/D.45.2020.tde-19022021-142206
- Subjects: PROCESSAMENTO DE IMAGENS; APRENDIZADO COMPUTACIONAL
- Keywords: Binarização de imagens; Convolutional neural networks; Image binarization; Image segmentation; Image-to-image transformations; Machine learning; Predição de estrutura; Redes neurais convolucionais; Segmentação de imagens; Structure prediction; Transformação imagem-a-imagem
- Agências de fomento:
- Language: Português
- Abstract: Criar manualmente um operador de imagem para performar uma transformação imagem-a-imagem específica é uma tarefa árdua e dificil. O problema do aprendizado automático de operadores de imagens tem sido estudado através dos anos. Métodos que atacam ese problema podem ser divididos em três tipos: as abordagens tradicionais pixel-a-pixel ou janelas deslizantes, abordagens patch-a-patch que foram possibilitadas por modelos de aprendizado profundo, e abordagens orientadas a estrutura que são baseadas em técnicas gerativas. Cada abordagem possui suas vantagens e desvantagens próprias. O objetivo dessa dissertação é estudar as similaridades e diferenças dessas abordagens, tanto conceptualmente quanto experimentalmente. Particularmente, estamos interessados em entender o quanto de informação estrutural da imagem, como conectividade de linhas, é preservado. A primeira contribuição desse trabalho é um método que une as vantagens das abordagens pixel-a-pixel e patch-a-patch, que chamamos de SConvNet. A segunda contribuição é um estudo que mostra que a métrica baseada em similaridades de esqueletos é válida para avaliar binarização de documentos manuscritos de forma complementar a métricas pixel-a-pixel tradicionais. Por fim, apresentamos uma comparação experimental entre métodos representativos de cada uma das três abordagens, calculando métricas pixel-a-pixel e as métricas de similaridade de esqueletos em dois problemas de processamento de imagens (segmentação de vasos sanguineos deretina e binarização de documentos manuscritos). As melhores métricas pixel-a-pixel foram obtidas por métodos patch-a-patch, enquanto os métodos estruturais obtiveram vantagens nas métricas de similaridade de esqueletos, de forma consistente com uma inspeção visual, que mostra que as abordagens estruturais melhor preservam a estrutura geral enquanto os métodos patch-a-patch geram contornos mais precisos
- Imprenta:
- Data da defesa: 09.12.2020
- Status:
- Artigo publicado em periódico de acesso aberto (Gold Open Access)
- Versão do Documento:
- Versão publicada (Published version)
- Acessar versão aberta:
-
ABNT
SILVA, Augusto Cesar Monteiro. Análise comparativa de abordagens para aprendizado de transformações imagem-a-imagem. 2020. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2020. Disponível em: https://teses.usp.br/teses/disponiveis/45/45134/tde-19022021-142206/. Acesso em: 07 abr. 2026. -
APA
Silva, A. C. M. (2020). Análise comparativa de abordagens para aprendizado de transformações imagem-a-imagem (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/45/45134/tde-19022021-142206/ -
NLM
Silva ACM. Análise comparativa de abordagens para aprendizado de transformações imagem-a-imagem [Internet]. 2020 ;[citado 2026 abr. 07 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-19022021-142206/ -
Vancouver
Silva ACM. Análise comparativa de abordagens para aprendizado de transformações imagem-a-imagem [Internet]. 2020 ;[citado 2026 abr. 07 ] Available from: https://teses.usp.br/teses/disponiveis/45/45134/tde-19022021-142206/
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
