Segmentação e especialização de modelos de machine learning para a predição de mortalidade neonatal (2024)
- Authors:
- Autor USP: CRISTOFALO, RENAN MARTELLO - FSP
- Unidade: FSP
- Sigla do Departamento: HEP
- DOI: 10.11606/D.6.2024.tde-04022025-182958
- Subjects: MORTALIDADE NEONATAL; APRENDIZADO COMPUTACIONAL; SAÚDE PÚBLICA
- Keywords: Machine Learning; Otimização de Modelos
- Language: Português
- Abstract: O crescente volume de dados gerados na área da saúde oferece oportunidades sem precedentes para melhorar a qualidade dos cuidados por meio da análise adequada dessas informações. Algoritmos de machine learning surgem como uma ferramenta poderosa, capaz de extrair padrões complexos nos dados, e com isso auxiliar na tomada de decisões clínicas, na personalização de tratamentos e na detecção precoce de doenças. Este estudo teve como objetivo desenvolver e avaliar modelos de machine learning para a predição de mortalidade neonatal, com um foco em explorar e testar diferentes estratégias de segmentação e especialização dos modelos, utilizando dados coletados pelo Maternal Newborn Health Registry (MNHR), abrangendo diversos países em desenvolvimento. Entre os 692 modelos avaliados, o LGBMClassifier destacou-se, apresentando a melhor performance global com uma ROC AUC de 0,8609, evidenciando sua alta capacidade de discriminação entre casos de mortalidade e sobrevivência neonatal. Embora o modelo global tenha demonstrado superioridade, a segmentação dos dados por variáveis contextuais, como local de parto e via de parto, mostrou-se promissora para a especialização dos modelos, resultando em melhorias de desempenho em contextos específicos.No entanto, a eficácia dessas estratégias depende da quantidade de dados disponíveis em cada segmento, como ficou evidenciado pela segmentação por localização geográfica que não apresentou os ganhos esperados devido à variação significativa na composição dos dados entre as bases de treino e teste, apontando para a necessidade de um volume adequado de amostras para treinar os modelos segmentados de forma eficaz. A segmentação por variáveis tradicionalmente consideradas importantes, como peso ao nascer, não trouxe os ganhos esperados nos modelos especializados, principalmente devido à baixa presença de casos extremos nas bases de dados. A análise de explicabilidade utilizando valores de Shapley revelou que variáveis como contato pele a pele e peso ao nascer foram consistentemente identificadas como os principais preditores, influenciando diretamente as decisões do modelo. Assim, este estudo destaca a importância de um equilíbrio entre a robustez dos modelos globais e a especialização proporcionada pela segmentação, sugerindo que a escolha da estratégia ideal depende do contexto e da disponibilidade de dados
- Imprenta:
- Data da defesa: 19.11.2024
- Status:
- Artigo publicado em periódico de acesso aberto (Gold Open Access)
- Versão do Documento:
- Versão publicada (Published version)
- Acessar versão aberta:
-
ABNT
CRISTOFALO, Renan Martello. Segmentação e especialização de modelos de machine learning para a predição de mortalidade neonatal. 2024. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2024. Disponível em: https://teses.usp.br/teses/disponiveis/6/6143/tde-04022025-182958/. Acesso em: 08 abr. 2026. -
APA
Cristofalo, R. M. (2024). Segmentação e especialização de modelos de machine learning para a predição de mortalidade neonatal (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/6/6143/tde-04022025-182958/ -
NLM
Cristofalo RM. Segmentação e especialização de modelos de machine learning para a predição de mortalidade neonatal [Internet]. 2024 ;[citado 2026 abr. 08 ] Available from: https://teses.usp.br/teses/disponiveis/6/6143/tde-04022025-182958/ -
Vancouver
Cristofalo RM. Segmentação e especialização de modelos de machine learning para a predição de mortalidade neonatal [Internet]. 2024 ;[citado 2026 abr. 08 ] Available from: https://teses.usp.br/teses/disponiveis/6/6143/tde-04022025-182958/
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
