Image classification with Fisher Vectors computed with multilevel features extracted from deep filter banks (2024)
- Authors:
- Autor USP: LYRA, LUCAS DE OLIVEIRA - IME
- Unidade: IME
- Sigla do Departamento: MAP
- DOI: 10.11606/T.45.2024.tde-18062025-191437
- Subjects: IMAGEM DIGITAL; RECONHECIMENTO DE IMAGEM; VISÃO COMPUTACIONAL; REDES NEURAIS; VETORES
- Keywords: Classificação de imagens médicas; Convolutional Neural Networks; Fisher Vectors; Medical image classification; Reconhecimento de textura; Redes Neurais Convolucionais; Texture recognition; Transformadores visuais; Vetores de Fisher; Visual transformers
- Agências de fomento:
- Language: Inglês
- Abstract: Nesta tese, investigamos o uso de Vetores de Fisher (FV) para codificar descritores de vários níveis extraídos de redes neurais profundas na classificação de imagens. Mais especificamente, empregamos Redes Neurais Convolucionais (CNNs) e modelos híbridos CNN + Transformador Visual (ViT) para extração de descritores. Embora as CNNs sejam eficazes na extração de descritores generalistas, elas apresentam um viés de localidade, o qual endereçamos usando arquiteturas híbridas. A codificação por FV busca resolver problemas relacionados a codificadores sensíveis à ordem, como camadas totalmente conectadas, no reconhecimento de texturas visuais e campos relacionados (por exemplo, classificação de imagens médicas). Nossos resultados demonstram que a abordagem proposta melhora significativamente a precisão das CNNs no reconhecimento de texturas visuais. Apesar de sua utilidade no contexto de disponibilidade limitada de dados, a escalabilidade para conjuntos de dados maiores ainda é um desafio. Para mitigar isso, propomos um método para reduzir os custos computacionais da codificação por FV. Avaliamos rigorosamente a robustez desse método e o aplicamos a conjuntos de dados maiores no contexto da classificação de imagens médicas. Além disso, exploramos o impacto do ajuste fino no desempenho do modelo. Finalmente, nossa abordagem se mostra adequada para conjuntos de dados pequenos e grandes, demonstrando competitividade quando comparada à literatura existente
- Imprenta:
- Data da defesa: 23.08.2024
- Este periódico é de acesso aberto
- Este artigo NÃO é de acesso aberto
-
ABNT
LYRA, Lucas de Oliveira. Image classification with Fisher Vectors computed with multilevel features extracted from deep filter banks. 2024. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2024. Disponível em: https://www.teses.usp.br/teses/disponiveis/45/45132/tde-18062025-191437/. Acesso em: 21 jan. 2026. -
APA
Lyra, L. de O. (2024). Image classification with Fisher Vectors computed with multilevel features extracted from deep filter banks (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/45/45132/tde-18062025-191437/ -
NLM
Lyra L de O. Image classification with Fisher Vectors computed with multilevel features extracted from deep filter banks [Internet]. 2024 ;[citado 2026 jan. 21 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45132/tde-18062025-191437/ -
Vancouver
Lyra L de O. Image classification with Fisher Vectors computed with multilevel features extracted from deep filter banks [Internet]. 2024 ;[citado 2026 jan. 21 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45132/tde-18062025-191437/
Informações sobre o DOI: 10.11606/T.45.2024.tde-18062025-191437 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
