Machine learning para análises preditivas em saúde: exemplo de aplicação para predizer óbito em idosos de São Paulo, Brasil (2019)
- Authors:
- USP affiliated authors: DUARTE, YEDA APARECIDA DE OLIVEIRA - EE ; CHIAVEGATTO FILHO, ALEXANDRE DIAS PORTO - FSP ; SANTOS, HELLEN GEREMIAS DOS - FSP ; NASCIMENTO, CARLA FERREIRA DO - FSP
- Unidades: EE; FSP
- DOI: 10.1590/0102-311x00050818
- Subjects: MORTALIDADE; IDOSOS; ALGORITMOS; SAÚDE DO IDOSO; REGRESSÃO LOGÍSTICA; SÃO PAULO
- Agências de fomento:
- Language: Português
- Abstract: El objetivo de este estudio fue presentar las etapas relacionadas con la utilización de algoritmos de machine learning para análisis predictivos en salud. Para tal fin, se realizó una aplicación en base a datos de ancianos residentes en el Munici- pio de São Paulo, Brasil, participantes en el estu- dio Salud Bienestar y Envejecimiento (SABE) (n = 2.808). La variable respuesta se representó mediante la ocurrencia de óbito en hasta 5 años tras la inclusión del anciano en el estudio (n = 423), y los predictores fueron representados por 37 va- riables relacionadas con el perfil demográfico, so- cioeconómico y de salud del anciano. El aplicación se organizó según las siguientes etapas: división de los datos en formación (70%) y test (30%), pre- procesamiento de los predictores, aprendizaje y evaluación de modelos. En la etapa de aprendiza- je, se utilizaron cinco algoritmos para el ajuste de modelos: regresión logística con y sin penalización, redes neuronales, gradient boosted trees y random forest. Los hiperparámetros de los algoritmos se optimizaron mediante una validación cruzada 10-fold, para seleccionar aquellos correspondien- tes a los mejores modelos. Para cada algoritmo, el mejor modelo se evaluó con datos de la prueba del área debajo de la curva (AUC) ROC y medidas relacionadas. Todos los modelos presentaron AUC ROC superior a 0,70. Para los tres modelos con mayor AUC ROC (redes neuronales y regresión logística con penalización de Lasso y sin penaliza- ción, respectivamente) también se evaluaron medi- das de calidad de la probabilidad pronosticada. Se espera que, con el aumento de la disponibilidad de datos y de capital humano capacitado, sea posible desarrollar modelos predictivos de machine lear- ning con potencial para ayudar a profesionales de salud en la toma de mejores decisionesEste estudo objetiva apresentar as etapas relacionadas à utilização de algo- ritmos de machine learning para análises preditivas em saúde. Para isso, foi realizada uma aplicação com base em dados de idosos residentes no Mu- nicípio de São Paulo, Brasil, participantes do estudo Saúde Bem-estar e Envelhecimento (SABE) (n = 2.808). A variável resposta foi representada pela ocorrência de óbito em até cinco anos após o ingresso do idoso no estudo (n = 423), e os preditores, por 37 variáveis relacionadas ao perfil demográfico, socioeconômico e de saúde do idoso. A aplicação foi organizada de acordo com as seguintes etapas: divisão dos dados em treinamento (70%) e teste (30%), pré- -processamento dos preditores, aprendizado e avaliação de modelos. Na etapa de aprendizado, foram utilizados cinco algoritmos para o ajuste de modelos: regressão logística com e sem penalização, redes neurais, gradient boosted trees e random forest. Os hiperparâmetros dos algoritmos foram otimiza- dos por validação cruzada 10-fold, para selecionar aqueles correspondentes aos melhores modelos. Para cada algoritmo, o melhor modelo foi avaliado em dados de teste por meio da área abaixo da curva (AUC) ROC e medidas re- lacionadas. Todos os modelos apresentaram AUC ROC superior a 0,70. Para os três modelos com maior AUC ROC (redes neurais e regressão logística com penalização de lasso e sem penalização, respectivamente), foram também ava- liadas medidas de qualidade da probabilidade predita. Espera-se que, com o aumento da disponibilidade de dados e de capital humano capacitado, seja possível desenvolver modelos preditivos de machine learning com potencial para auxiliar profissionais de saúde na tomada de melhores decisões
- Imprenta:
- Publisher place: Rio de Janeiro
- Date published: 2019
- Source:
- Título: Cadernos de Saúde Pública
- ISSN: 1678-4464
- Volume/Número/Paginação/Ano: v.37, n.7, art. e00050818 [19p.], 2019
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by
-
ABNT
SANTOS, Hellen Geremias dos et al. Machine learning para análises preditivas em saúde: exemplo de aplicação para predizer óbito em idosos de São Paulo, Brasil. Cadernos de Saúde Pública, v. 37, n. 7, p. art. e00050818 [19], 2019Tradução . . Disponível em: https://doi.org/10.1590/0102-311x00050818. Acesso em: 27 dez. 2025. -
APA
Santos, H. G. dos, Nascimento, C. F. do, Izbicki, R., Duarte, Y. A. de O., & Chiavegatto Filho, A. D. P. (2019). Machine learning para análises preditivas em saúde: exemplo de aplicação para predizer óbito em idosos de São Paulo, Brasil. Cadernos de Saúde Pública, 37( 7), art. e00050818 [19]. doi:10.1590/0102-311x00050818 -
NLM
Santos HG dos, Nascimento CF do, Izbicki R, Duarte YA de O, Chiavegatto Filho ADP. Machine learning para análises preditivas em saúde: exemplo de aplicação para predizer óbito em idosos de São Paulo, Brasil [Internet]. Cadernos de Saúde Pública. 2019 ;37( 7): art. e00050818 [19].[citado 2025 dez. 27 ] Available from: https://doi.org/10.1590/0102-311x00050818 -
Vancouver
Santos HG dos, Nascimento CF do, Izbicki R, Duarte YA de O, Chiavegatto Filho ADP. Machine learning para análises preditivas em saúde: exemplo de aplicação para predizer óbito em idosos de São Paulo, Brasil [Internet]. Cadernos de Saúde Pública. 2019 ;37( 7): art. e00050818 [19].[citado 2025 dez. 27 ] Available from: https://doi.org/10.1590/0102-311x00050818 - Cause-specific mortality prediction in older residents of São Paulo, Brazil: a machine learning approach
- Blurred lines: racial misclassification in death certificates in Brazil
- Functional mobility and 10-year all-cause and cause-specific mortality in older people from São Paulo, Brazil
- Reproductive factors and age at natural menopause: A systematic review and meta-analysis
- Individual and neighborhood factors associated with functional mobility and falls in elderly residents of São Paulo, Brazil: a multilevel analysis
- Age at natural menopause and mortality: a survival analysis of elderly residents of São Paulo, Brazil
- Gender differences between multimorbidity and all-cause mortality among older adults
- Sobrevida e idade da menopausa: uma análise longitudinal de idosas do município do São Paulo
- Machine learning para predizer inconsistências na raça/cor das declarações de óbito
- Factors associated with age at natural menopause among elderly women in São Paulo, Brazil
Informações sobre o DOI: 10.1590/0102-311x00050818 (Fonte: oaDOI API)
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| HEP_53_2019.pdf | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
