Uso de aprendizado federado em amostras multicêntricas de hospitais para a predição de óbitos de pacientes hospitalizados com COVID-19 (2025)
- Authors:
- Autor USP: BIGOTO, MURILO AFONSO ROBIATI - Interunidades em Bioinformática
- Unidade: Interunidades em Bioinformática
- DOI: 10.11606/D.95.2025.tde-22112025-113709
- Subjects: BIOINFORMÁTICA; APRENDIZADO COMPUTACIONAL; INTELIGÊNCIA ARTIFICIAL; DOENÇAS
- Keywords: Aprendizado de máquina; Aprendizado federado; Artificial intelligence; Bioinformática; Bioinformatics; Federated learning; Health prediction; Inteligência artificial; Machine learning; Predição em saúde
- Language: Português
- Abstract: O crescente volume de dados em saúde tem impulsionado o uso de inteligência artificial (IA) para o desenvolvimento de modelos preditivos. Contudo, a natureza sensível e fragmentada dos dados clínicos, protegida por legislações como a Lei Geral de Proteção de Dados Pessoais (LGPD) no Brasil, impõe barreiras significativas à centralização necessária para o treinamento dos algoritmos. Neste contexto, o aprendizado federado emerge como um paradigma que permite a colaboração entre instituições para treinar modelos robustos sem o compartilhamento de dados brutos, preservando a privacidade e a governança local. Esta dissertação teve como objetivo avaliar a viabilidade e a performance de diferentes arquiteturas de aprendizado federado na tarefa de predição de mortalidade por COVID-19 em um cenário real e heterogêneo. A abordagem metodológica foi fundamentada em uma coorte multicêntrica de 17.022 pacientes de 21 hospitais da rede IACOV-BR, abrangendo as cinco regiões do Brasil. Foram desenhados e comparados dois cenários experimentais: o Cenário I, baseado na agregação de parâmetros (FedAvg) de modelos de Regressão Logística (RL) e Perceptron de Múltiplas Camadas (MLP); e o Cenário II, focado na agregação de árvores de decisão, com uma implementação proprietária para Floresta Aleatória (RF) e o uso da estratégia FedXgbBagging para o XGBoost.Os resultados demonstraram relativa superioridade da abordagem federada, com os modelos globais alcançando AUC-ROC médias mais elevadas nos cenários explorados. Para a Floresta Aleatória, a performance média subiu de 0,7626 nos modelos locais para 0,7996 no modelo federado. De forma similar, a Regressão Logística teve sua AUC média elevada de 0,7638 para 0,7935. O MLP, partindo da maior base local (0,8147), alcançou a maior performance federada absoluta (0,8403), enquanto o XGBoost também apresentou um aumento, de 0,7446 para 0,7740. Adicionalmente, a análise revelou que estes benefícios foram mais pronunciados em hospitais com menor volume de dados e que a convergência da rede ocorreu de forma eficiente em poucas rodadas (t ≈ 5). A dissertação traz resultados de como o aprendizado federado pode ajudar hospitais a predizerem contextos de dados externos, no qual os modelos federados exibiram uma performance superior à dos modelos locais, mostrando-se uma abordagem viável e de alto impacto para o desenvolvimento de modelos de IA em um sistema de saúde heterogêneo como o brasileiro. A sua principal contribuição não reside apenas no ganho de performance em dados locais, mas na criação de modelos estáveis e com capacidade de atuar em diversas populações de pacientes, que é uma característica indispensável para a aplicação clínica confiável. Este trabalho, portanto, coloca o aprendizado federado como uma tecnologia importante para o futuro da saúde preditiva, promovendo um avanço que é simultaneamente equitativo e respeitoso à privacidade.
- Imprenta:
- Data da defesa: 10.11.2025
- Este periódico é de acesso aberto
- Este artigo NÃO é de acesso aberto
-
ABNT
BIGOTO, Murilo Afonso Robiati. Uso de aprendizado federado em amostras multicêntricas de hospitais para a predição de óbitos de pacientes hospitalizados com COVID-19. 2025. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2025. Disponível em: https://www.teses.usp.br/teses/disponiveis/95/95131/tde-22112025-113709/. Acesso em: 03 mar. 2026. -
APA
Bigoto, M. A. R. (2025). Uso de aprendizado federado em amostras multicêntricas de hospitais para a predição de óbitos de pacientes hospitalizados com COVID-19 (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/95/95131/tde-22112025-113709/ -
NLM
Bigoto MAR. Uso de aprendizado federado em amostras multicêntricas de hospitais para a predição de óbitos de pacientes hospitalizados com COVID-19 [Internet]. 2025 ;[citado 2026 mar. 03 ] Available from: https://www.teses.usp.br/teses/disponiveis/95/95131/tde-22112025-113709/ -
Vancouver
Bigoto MAR. Uso de aprendizado federado em amostras multicêntricas de hospitais para a predição de óbitos de pacientes hospitalizados com COVID-19 [Internet]. 2025 ;[citado 2026 mar. 03 ] Available from: https://www.teses.usp.br/teses/disponiveis/95/95131/tde-22112025-113709/
Informações sobre o DOI: 10.11606/D.95.2025.tde-22112025-113709 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
