Uso de aprendizado federado em amostras multicêntricas de hospitais para a predição de óbitos de pacientes hospitalizados com COVID-19 (2025)
- Authors:
- Autor USP: BIGOTO, MURILO AFONSO ROBIATI - Interunidades em Bioinformática
- Unidade: Interunidades em Bioinformática
- DOI: 10.11606/D.95.2025.tde-22112025-113709
- Subjects: BIOINFORMÁTICA; APRENDIZADO COMPUTACIONAL; INTELIGÊNCIA ARTIFICIAL; DOENÇAS
- Keywords: Aprendizado de máquina; Aprendizado federado; Artificial intelligence; Bioinformática; Bioinformatics; Federated learning; Health prediction; Inteligência artificial; Machine learning; Predição em saúde
- Language: Português
- Abstract: O crescente volume de dados em saúde tem impulsionado o uso de inteligência artificial (IA) para o desenvolvimento de modelos preditivos. Contudo, a natureza sensível e fragmentada dos dados clínicos, protegida por legislações como a Lei Geral de Proteção de Dados Pessoais (LGPD) no Brasil, impõe barreiras significativas à centralização necessária para o treinamento dos algoritmos. Neste contexto, o aprendizado federado emerge como um paradigma que permite a colaboração entre instituições para treinar modelos robustos sem o compartilhamento de dados brutos, preservando a privacidade e a governança local. Esta dissertação teve como objetivo avaliar a viabilidade e a performance de diferentes arquiteturas de aprendizado federado na tarefa de predição de mortalidade por COVID-19 em um cenário real e heterogêneo. A abordagem metodológica foi fundamentada em uma coorte multicêntrica de 17.022 pacientes de 21 hospitais da rede IACOV-BR, abrangendo as cinco regiões do Brasil. Foram desenhados e comparados dois cenários experimentais: o Cenário I, baseado na agregação de parâmetros (FedAvg) de modelos de Regressão Logística (RL) e Perceptron de Múltiplas Camadas (MLP); e o Cenário II, focado na agregação de árvores de decisão, com uma implementação proprietária para Floresta Aleatória (RF) e o uso da estratégia FedXgbBagging para o XGBoost.Os resultados demonstraram relativa superioridade da abordagem federada, com os modelos globais alcançando AUC-ROC médias mais elevadas nos cenários explorados. Para a Floresta Aleatória, a performance média subiu de 0,7626 nos modelos locais para 0,7996 no modelo federado. De forma similar, a Regressão Logística teve sua AUC média elevada de 0,7638 para 0,7935. O MLP, partindo da maior base local (0,8147), alcançou a maior performance federada absoluta (0,8403), enquanto o XGBoost também apresentou um aumento, de 0,7446 para 0,7740. Adicionalmente, a análise revelou que estes benefícios foram mais pronunciados em hospitais com menor volume de dados e que a convergência da rede ocorreu de forma eficiente em poucas rodadas (t ≈ 5). A dissertação traz resultados de como o aprendizado federado pode ajudar hospitais a predizerem contextos de dados externos, no qual os modelos federados exibiram uma performance superior à dos modelos locais, mostrando-se uma abordagem viável e de alto impacto para o desenvolvimento de modelos de IA em um sistema de saúde heterogêneo como o brasileiro. A sua principal contribuição não reside apenas no ganho de performance em dados locais, mas na criação de modelos estáveis e com capacidade de atuar em diversas populações de pacientes, que é uma característica indispensável para a aplicação clínica confiável. Este trabalho, portanto, coloca o aprendizado federado como uma tecnologia importante para o futuro da saúde preditiva, promovendo um avanço que é simultaneamente equitativo e respeitoso à privacidade.
- Imprenta:
- Data da defesa: 10.11.2025
- Status:
- Artigo publicado em periódico de acesso aberto (Gold Open Access)
- Versão do Documento:
- Versão publicada (Published version)
- Acessar versão aberta:
-
ABNT
BIGOTO, Murilo Afonso Robiati. Uso de aprendizado federado em amostras multicêntricas de hospitais para a predição de óbitos de pacientes hospitalizados com COVID-19. 2025. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2025. Disponível em: https://teses.usp.br/teses/disponiveis/95/95131/tde-22112025-113709/. Acesso em: 05 maio 2026. -
APA
Bigoto, M. A. R. (2025). Uso de aprendizado federado em amostras multicêntricas de hospitais para a predição de óbitos de pacientes hospitalizados com COVID-19 (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/95/95131/tde-22112025-113709/ -
NLM
Bigoto MAR. Uso de aprendizado federado em amostras multicêntricas de hospitais para a predição de óbitos de pacientes hospitalizados com COVID-19 [Internet]. 2025 ;[citado 2026 maio 05 ] Available from: https://teses.usp.br/teses/disponiveis/95/95131/tde-22112025-113709/ -
Vancouver
Bigoto MAR. Uso de aprendizado federado em amostras multicêntricas de hospitais para a predição de óbitos de pacientes hospitalizados com COVID-19 [Internet]. 2025 ;[citado 2026 maio 05 ] Available from: https://teses.usp.br/teses/disponiveis/95/95131/tde-22112025-113709/
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
