Data science for epidemiology: a case study of dengue in Brazil (2022)
- Authors:
- Autor USP: ROSTER, KIRSTIN INGRID OLIVEIRA - ICMC
- Unidade: ICMC
- Sigla do Departamento: SME
- DOI: 10.11606/T.55.2022.tde-27022023-142607
- Subjects: APRENDIZADO COMPUTACIONAL; DOENÇAS; DENGUE; SAÚDE PÚBLICA; ANÁLISE DE DADOS; ANÁLISE DE SÉRIES TEMPORAIS
- Keywords: Causal inference; Disease forecasting; Inferência causal; Machine learning
- Agências de fomento:
- Language: Inglês
- Abstract: Esta tese é um conjunto de estudos sobre a aplicação da ciência de dados a problemas da epidemiologia da dengue. Alavancamos modelos de aprendizado de máquina juntamente com métodos de inferência causal para dois importantes objetivos de saúde pública: (i) prever a prevalência de doenças para antecipar surtos e alocar recursos e (ii) entender os causadores de doenças para desenvolver intervenções preventivas eficazes. Usando dados sobre a prevalência de doenças, condições climáticas e comportamento humano, demonstramos como o aprendizado de máquina pode ser aplicado em três contextos diferentes: (i) para desenvolver previsões precisas de infecções nas cidades brasileiras; (ii) para generalizar as previsões para novas doenças; e (iii) como um passo intermediário para a inferência causal. No Capítulo 2, comparamos algoritmos de aprendizado de máquina para previsão de dengue e avaliamos o valor da seleção de variáveis causais. O algoritmo ideal varia entre o contexto nacional (independente de domínio) e de cidade única (domínio específico). Os modelos de conjuntos de árvores de decisão têm melhor desempenho em escala nacional. A seleção de variáveis causais tem melhor desempenho de acordo com uma das quatro medidas de erro, embora não seja o método ideal em todas as cidades. Esse resultado nos ajuda a entender melhor o custo de modelos informados pelo relacionamento causal entre as variáveis. No Capítulo 3, avaliamos a generalização dos modelos desenvolvidos no capítuloanterior. Com base na hipótese de que doenças podem ter características de séries temporais em comum, testamos a eficácia da transferência de conhecimento de doenças endêmicas para doenças novas, para melhorar as previsões quando existem poucos dados para treinamento. Comparamos algoritmos de transferência de aprendizado baseados em instâncias e em parâmetros, e avaliamos o desempenho em dados empíricos e teóricos. Os resultados sugerem que a transferência de aprendizado oferece o potencial para responder a pandemias, e que o melhor algoritmo depende da semelhança dos pares de doenças. No Capítulo 4, consideramos a contribuição do aprendizado de máquina para a inferência causal, examinando o impacto da pandemia de COVID-19 na dengue no Brasil. Estimamos a diferença entre os casos de dengue esperados e os observados, usando um desenho de estudo de série temporal interrompida. Também separamos os impactos do clima, das mudanças na vigilância devido à pandemia, da suscetibilidade humana e da mobilidade. Descobrimos que há uma variação considerável em todo o país, tanto no impacto geral da pandemia quanto na importância relativa das causas principais. Essa análise ajuda a esclarecer as lacunas de dados causadas pela pandemia de COVID-19 e achar possíveis alvos de intervenção para controlar a dengue no futuro.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2022
- Data da defesa: 19.12.2022
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
ROSTER, Kirstin Ingrid Oliveira. Data science for epidemiology: a case study of dengue in Brazil. 2022. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2022. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-27022023-142607/. Acesso em: 31 dez. 2025. -
APA
Roster, K. I. O. (2022). Data science for epidemiology: a case study of dengue in Brazil (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-27022023-142607/ -
NLM
Roster KIO. Data science for epidemiology: a case study of dengue in Brazil [Internet]. 2022 ;[citado 2025 dez. 31 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-27022023-142607/ -
Vancouver
Roster KIO. Data science for epidemiology: a case study of dengue in Brazil [Internet]. 2022 ;[citado 2025 dez. 31 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-27022023-142607/ - Data-rich modeling helps answer increasingly complex questions on variant and disease interactions [Carta]: comment on "Mathematical models for dengue fever epidemiology: A10-year systematic review" by Aguiar et al.
- Machine-learning-based forecasting of dengue fever in Brazilian cities using epidemiologic and meteorological variables
- Impact of the COVID-19 pandemic on dengue in Brazil: interrupted time series analysis of changes in surveillance and transmission
- Forecasting new diseases in low-data settings using transfer learning
- EEG functional connectivity and deep learning for automatic diagnosis of brain disorders: Alzheimer's disease and schizophrenia
- Application of machine learning and complex network measures to an EEG dataset from ayahuasca experiments
- Diagnosis of autism spectrum disorder based on functional brain networks and machine learning
Informações sobre o DOI: 10.11606/T.55.2022.tde-27022023-142607 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
