Multi-Representation Learning for Domain Adaptation in Machine Learning Applications (2025)
- Authors:
- Autor USP: TOMITA, VICTOR AKIHITO KAMADA - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- DOI: 10.11606/T.55.2025.tde-07082025-100853
- Subjects: APRENDIZADO COMPUTACIONAL; PROCESSAMENTO DE LINGUAGEM NATURAL; VISÃO COMPUTACIONAL
- Keywords: Adaptação de domínio; Análise de sentimentos; Domain adaptation; Question and answering; Sentiment analysis; Sistemas de pergunta e resposta
- Language: Inglês
- Abstract: O crescimento contínuo dos métodos de aprendizado de máquina tem impulsionado avanços significativos em áreas como processamento de linguagem natural e visão computacional. Contudo, a performance desses modelos depende fortemente da quantidade e qualidade dos dados rotulados disponíveis para treinamento, os quais muitas vezes são escassos ou caros de produzir, especialmente em domínios especializados. Esse desafio torna-se ainda mais crítico diante do fenômeno de domain shift, caracterizado pela diferença entre a distribuição dos dados de treinamento e a distribuição dos dados onde o modelo será aplicado. Essas limitações representam barreiras significativas para a aplicação de modelos de estado da arte em cenários reais. A adaptação de domínio surge como uma solução para mitigar os impactos do domain shift, otimizando a transferência de aprendizado entre diferentes domínios. Esse campo busca criar representações invariantes de domínio que preservem informações relevantes para uma tarefa específica, reduzindo, assim, o desvio entre as distribuições de dados. Apesar dos avanços notáveis, a área ainda enfrenta desafios como o balanceamento entre especificidade e generalização das representações geradas, além de problemas relacionados à alta dimensionalidade das projeções em espaços latentes, que resultam em custos computacionais elevados e baixa interpretabilidade. Nesta tese, propomos novas abordagens para enfrentar os desafios da adaptação de domínio, com foco em balanceargeneralização e especificidade, aumentar a interpretabilidade e eficiência computacional, e melhorar a usabilidade de modelos. As contribuições incluem avanços aplicados a tarefas como análise de sentimentos, classificação de imagens e sistemas de perguntas e respostas. Apresentamos o método Cluster Fusion Domain Adaptation (CFDA) que combina técnicas de agrupamento e fusão de representações para gerar múltiplas representações que asseguram tanto o alinhamento interno de domínios quanto a generalização entre eles. Para abordar os problemas de eficiência computacional e interpretabilidade, desenvolvemos o método Pseudo-labeling Domain Adaptation (PDA), que utiliza projeções em espaços de baixa dimensionalidade e redes neurais de grafos para modelar relações entre domínios. Além disso, para aumentar a usabilidade em análise de sentimentos baseada em aspectos, introduzimos um novo método de perguntas e respostas que possibilita interações mais flexíveis entre usuário e aplicação. Os resultados experimentais desta tese validam os métodos propostos, demonstrando melhorias em acurácia, eficiência computacional e capacidade de generalização em diferentes bases de dados. Assim, esta tese apresenta contribuições significativas para a área de adaptação de domínio, oferecendo métodos mais versáteis, interpretáveis e precisos para desafios existentes.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2025
- Data da defesa: 03.06.2025
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
TOMITA, Victor Akihito Kamada. Multi-Representation Learning for Domain Adaptation in Machine Learning Applications. 2025. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2025. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-07082025-100853/. Acesso em: 01 jan. 2026. -
APA
Tomita, V. A. K. (2025). Multi-Representation Learning for Domain Adaptation in Machine Learning Applications (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-07082025-100853/ -
NLM
Tomita VAK. Multi-Representation Learning for Domain Adaptation in Machine Learning Applications [Internet]. 2025 ;[citado 2026 jan. 01 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-07082025-100853/ -
Vancouver
Tomita VAK. Multi-Representation Learning for Domain Adaptation in Machine Learning Applications [Internet]. 2025 ;[citado 2026 jan. 01 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-07082025-100853/
Informações sobre o DOI: 10.11606/T.55.2025.tde-07082025-100853 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
