Estratégias para tratamento de variáveis com dados faltantes durante o desenvolvimento de modelos preditivos (2012)
- Authors:
- Autor USP: ASSUNÇÃO, FERNANDO - IME
- Unidade: IME
- Sigla do Departamento: MAE
- Assunto: AMOSTRAGEM
- Language: Português
- Abstract: Modelos preditivos têm sido cada vez mais utilizados pelo mercado a fim de auxiliarem as empresas na mitigação de riscos, expansão de carteiras, retenção de clientes, prevenção a fraudes, entre outros objetivos. Entretanto, durante o desenvolvimento destes modelos é comum existirem, dentre as variáveis preditivas, algumas que possuem dados não preenchidos (missings), sendo necessário assim adotar algum procedimento para tratamento destas variáveis. Dado este cenário, este estudo tem o objetivo de discutir metodologias de tratamento de dados faltantes em modelos preditivos, incentivando o uso de algumas delas já conhecidas pelo meio acadêmico, só que não utilizadas pelo mercado. Para isso, este trabalho propõe uma metodologia simples e descreve outras seis. Todas elas foram submetidas a uma aplicação empírica utilizando uma base de dados referente ao desenvolvimento de um modelo de Credit Score. Sobre esta base foram desenvolvidos sete modelos (um para cada metodologia descrita) e seus resultados foram avaliados e comparados através de índices de desempenho amplamente utilizados pelo mercado (KS, Gini, ROC e Curva de Aprovação). Nesta aplicação, as técnicas que apresentaram melhor desempenho foram a que tratam os dados faltantes como uma categoria à parte (técnica já utilizada pelo mercado) e a nova metodologia proposta, que consiste em agrupar os dados faltantes na categoria conceitualmente mais semelhante. Já a que apresentou o pior desempenho foi a metodologia que simplesmente não utiliza a variável com dados faltantes, outro procedimento comumente visto no mercado.
- Imprenta:
- Data da defesa: 09.05.2012
-
ABNT
ASSUNÇÃO, Fernando. Estratégias para tratamento de variáveis com dados faltantes durante o desenvolvimento de modelos preditivos. 2012. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2012. Disponível em: http://www.teses.usp.br/teses/disponiveis/45/45133/tde-15082012-203206. Acesso em: 09 out. 2024. -
APA
Assunção, F. (2012). Estratégias para tratamento de variáveis com dados faltantes durante o desenvolvimento de modelos preditivos (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/45/45133/tde-15082012-203206 -
NLM
Assunção F. Estratégias para tratamento de variáveis com dados faltantes durante o desenvolvimento de modelos preditivos [Internet]. 2012 ;[citado 2024 out. 09 ] Available from: http://www.teses.usp.br/teses/disponiveis/45/45133/tde-15082012-203206 -
Vancouver
Assunção F. Estratégias para tratamento de variáveis com dados faltantes durante o desenvolvimento de modelos preditivos [Internet]. 2012 ;[citado 2024 out. 09 ] Available from: http://www.teses.usp.br/teses/disponiveis/45/45133/tde-15082012-203206
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas