Ciência de dados, poluição do ar e saúde (2019)
- Autores:
- Autor USP: AMORIM, WILLIAM NILSON DE - IME
- Unidade: IME
- Sigla do Departamento: MAE
- Assuntos: ANÁLISE DE SOBREVIVÊNCIA; PROCESSOS ESTOCÁSTICOS; ANÁLISE DE DADOS
- Palavras-chave do autor: Aprendizado automático; Proveniente da Base Teses Digitais da USP; Proveniente da Base Teses Digitais da USP; Proveniente da Base Teses Digitais da USP; Proveniente da Base Teses Digitais da USP; Ciência de dados; Data science
- Agências de fomento:
- Idioma: Português
- Resumo: A Estatística é uma ferramenta imprescindível para a aplicação do método científico, estando presente em todos os campos de pesquisa. As metodologias estatísticas usuais estão bem estabelecidas entre os pesquisadores das mais diversas áreas, sendo que a análise de dados em muitos trabalhos costuma ser feita pelos próprios autores. Nos últimos anos, a área conhecida como Ciência de Dados vem exigindo de estatísticos e não-estatísticos habilidades que vão muito além de modelagem, começando na obtenção e estruturação das bases de dados e terminando na divulgação dos resultados. Dentro dela, uma abordagem chamada de aprendizado automático reuniu diversas técnicas e estratégias para modelagem preditiva, que, com alguns cuidados, podem ser aplicadas também para inferência. Essas novas visões da Estatística foram pouco absorvidas pela comunidade científica até então, principalmente pela ausência de estatísticos em grande parte dos estudos. Embora pesquisa de base em Probabilidade e Estatística seja importante para o desenvolvimento de novas metodologias, a criação de pontes entre essas disciplinas e suas áreas de aplicação é essencial para o avanço da ciência. O objetivo desta tese é aproximar a ciência de dados, discutindo metodologias novas e usuais, da área de pesquisa em poluição do ar, que, segundo a Organização Mundial da Saúde, é o maior risco ambiental à saúde humana.Para isso, apresentaremos diversas estratégias de análise e as aplicaremos em dados reais de poluição do ar. Os problemas utilizados como exemplo foram o estudo realizado por Salvo et al. (2017), cujo objetivo foi associar a proporção de carros rodando a gasolina com a concentração de ozônio na cidade de São Paulo, e uma extensão desse trabalho, na qual analisamos o efeito do uso de gasolina/etanol na mortalidade de idosos e crianças. Concluímos que suposições como linearidade a aditividade, feitas por alguns modelos usuais, podem ser muito restritivas para problemas essencialmente complexos, com diferentes modelos levando a diferentes conclusões, nem sempre sendo fácil identificar qual delas é a mais apropriada
- Imprenta:
- Data da defesa: 17.05.2019
-
ABNT
AMORIM, William Nilson de. Ciência de dados, poluição do ar e saúde. 2019. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2019. Disponível em: http://www.teses.usp.br/teses/disponiveis/45/45133/tde-30052019-145057/. Acesso em: 19 set. 2024. -
APA
Amorim, W. N. de. (2019). Ciência de dados, poluição do ar e saúde (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/45/45133/tde-30052019-145057/ -
NLM
Amorim WN de. Ciência de dados, poluição do ar e saúde [Internet]. 2019 ;[citado 2024 set. 19 ] Available from: http://www.teses.usp.br/teses/disponiveis/45/45133/tde-30052019-145057/ -
Vancouver
Amorim WN de. Ciência de dados, poluição do ar e saúde [Internet]. 2019 ;[citado 2024 set. 19 ] Available from: http://www.teses.usp.br/teses/disponiveis/45/45133/tde-30052019-145057/ - Verossimilhança hierárquica em modelos de fragilidade
- Relatório de análise estatística sobre o projeto "avaliação da diferença de gêneros na duração e dispersão do complexo QRS em relação à mortalidade em pacientes com insuficiência cardíaca"
- Relatório de análise estatística sobre o projeto "avaliação do Findrisk como instrumento de detecção de diabetes de tipo 2 em um estudo transversal"
Como citar
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas