Multi-Representation Learning for Domain Adaptation in Machine Learning Applications (2025)
- Authors:
- Autor USP: TOMITA, VICTOR AKIHITO KAMADA - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- DOI: 10.11606/T.55.2025.tde-07082025-100853
- Subjects: APRENDIZADO COMPUTACIONAL; PROCESSAMENTO DE LINGUAGEM NATURAL; VISÃO COMPUTACIONAL
- Keywords: Adaptação de domínio; Análise de sentimentos; Domain adaptation; Question and answering; Sentiment analysis; Sistemas de pergunta e resposta
- Language: Inglês
- Abstract: O crescimento contínuo dos métodos de aprendizado de máquina tem impulsionado avanços significativos em áreas como processamento de linguagem natural e visão computacional. Contudo, a performance desses modelos depende fortemente da quantidade e qualidade dos dados rotulados disponíveis para treinamento, os quais muitas vezes são escassos ou caros de produzir, especialmente em domínios especializados. Esse desafio torna-se ainda mais crítico diante do fenômeno de domain shift, caracterizado pela diferença entre a distribuição dos dados de treinamento e a distribuição dos dados onde o modelo será aplicado. Essas limitações representam barreiras significativas para a aplicação de modelos de estado da arte em cenários reais. A adaptação de domínio surge como uma solução para mitigar os impactos do domain shift, otimizando a transferência de aprendizado entre diferentes domínios. Esse campo busca criar representações invariantes de domínio que preservem informações relevantes para uma tarefa específica, reduzindo, assim, o desvio entre as distribuições de dados. Apesar dos avanços notáveis, a área ainda enfrenta desafios como o balanceamento entre especificidade e generalização das representações geradas, além de problemas relacionados à alta dimensionalidade das projeções em espaços latentes, que resultam em custos computacionais elevados e baixa interpretabilidade. Nesta tese, propomos novas abordagens para enfrentar os desafios da adaptação de domínio, com foco em balanceargeneralização e especificidade, aumentar a interpretabilidade e eficiência computacional, e melhorar a usabilidade de modelos. As contribuições incluem avanços aplicados a tarefas como análise de sentimentos, classificação de imagens e sistemas de perguntas e respostas. Apresentamos o método Cluster Fusion Domain Adaptation (CFDA) que combina técnicas de agrupamento e fusão de representações para gerar múltiplas representações que asseguram tanto o alinhamento interno de domínios quanto a generalização entre eles. Para abordar os problemas de eficiência computacional e interpretabilidade, desenvolvemos o método Pseudo-labeling Domain Adaptation (PDA), que utiliza projeções em espaços de baixa dimensionalidade e redes neurais de grafos para modelar relações entre domínios. Além disso, para aumentar a usabilidade em análise de sentimentos baseada em aspectos, introduzimos um novo método de perguntas e respostas que possibilita interações mais flexíveis entre usuário e aplicação. Os resultados experimentais desta tese validam os métodos propostos, demonstrando melhorias em acurácia, eficiência computacional e capacidade de generalização em diferentes bases de dados. Assim, esta tese apresenta contribuições significativas para a área de adaptação de domínio, oferecendo métodos mais versáteis, interpretáveis e precisos para desafios existentes.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2025
- Data da defesa: 03.06.2025
- Status:
- Artigo publicado em periódico de acesso aberto (Gold Open Access)
- Versão do Documento:
- Versão publicada (Published version)
- Acessar versão aberta:
-
ABNT
TOMITA, Victor Akihito Kamada. Multi-Representation Learning for Domain Adaptation in Machine Learning Applications. 2025. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2025. Disponível em: https://teses.usp.br/teses/disponiveis/55/55134/tde-07082025-100853/. Acesso em: 16 abr. 2026. -
APA
Tomita, V. A. K. (2025). Multi-Representation Learning for Domain Adaptation in Machine Learning Applications (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://teses.usp.br/teses/disponiveis/55/55134/tde-07082025-100853/ -
NLM
Tomita VAK. Multi-Representation Learning for Domain Adaptation in Machine Learning Applications [Internet]. 2025 ;[citado 2026 abr. 16 ] Available from: https://teses.usp.br/teses/disponiveis/55/55134/tde-07082025-100853/ -
Vancouver
Tomita VAK. Multi-Representation Learning for Domain Adaptation in Machine Learning Applications [Internet]. 2025 ;[citado 2026 abr. 16 ] Available from: https://teses.usp.br/teses/disponiveis/55/55134/tde-07082025-100853/
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
