Métodos de categorização de variáveis preditoras em modelos de regressão para variáveis binárias (2017)
- Authors:
- Autor USP: SILVA, DIEGO MATTOZO BERNARDES DA - Interinstitucional de Pós-Graduação em Estatística
- Unidade: Interinstitucional de Pós-Graduação em Estatística
- Sigla do Departamento: SME
- Subjects: REGRESSÃO LOGÍSTICA; MODELOS (ANÁLISE MULTIVARIADA)
- Keywords: Categorização de variáveis preditoras; Categorization of predictor variables; Credit scoring; Regressão; Regression; Risco de crédito
- Language: Português
- Abstract: Modelos de regressão para variáveis resposta binárias são muito comuns em diversas áreas do conhecimento. O modelo mais utilizado nessas situações é o modelo de regressão logística, que assume que o logito da probabilidade de ocorrência de um dos valores da variável resposta é uma função linear das variáveis preditoras. Quando essa suposição não é razoável, algumas possíveis alternativas são: realizar transformação das variáveis preditoras e/ou inserir termos quadráticos ou cúbicos no modelo. O problema dessa abordagem é que ela dificulta bastante a interpretação dos parâmetros do modelo e, em algumas áreas, é fundamental que eles sejam interpretáveis. Assim, uma abordagem muitas vezes utilizada é a categorização das variáveis preditoras quantitativas do modelo. Sendo assim, este trabalho tem como objetivo propor duas novas classes de métodos de categorização de variáveis contínuas em modelos de regressão para variáveis resposta binárias. A primeira classe de métodos é univariada e busca maximizar a associação entre a variável resposta e a covariável categorizada utilizando medidas de associação para variáveis qualitativas. Já a classe de métodos multivariada tenta incorporar a estrutura de dependência entre as covariáveis do modelo através da categorização conjunta de todas as variáveis preditoras. Para avaliar o desempenho, aplicamos as classes de métodos propostas e quatro métodos de categorização existentes em 3 bases de dados relacionadas à área de risco de crédito e adois cenários de dados simulados. Os resultados nas bases reais sugerem que a classe univariada proposta têm um desempenho superior aos métodos existentes quando comparamos o poder preditivo do modelo de regressão logística. Já os resultados nas bases de dados simuladas sugerem que ambas as classes propostas possuem um desempenho superior aos métodos existentes. Em relação ao desempenho computacional, o método multivariado mostrou-se inferior e o univariado é superior aos métodos existentes.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2017
- Data da defesa: 13.06.2017
-
ABNT
SILVA, Diego Mattozo Bernardes da. Métodos de categorização de variáveis preditoras em modelos de regressão para variáveis binárias. 2017. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2017. Disponível em: http://www.teses.usp.br/teses/disponiveis/104/104131/tde-27092017-092122/. Acesso em: 22 jan. 2026. -
APA
Silva, D. M. B. da. (2017). Métodos de categorização de variáveis preditoras em modelos de regressão para variáveis binárias (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/104/104131/tde-27092017-092122/ -
NLM
Silva DMB da. Métodos de categorização de variáveis preditoras em modelos de regressão para variáveis binárias [Internet]. 2017 ;[citado 2026 jan. 22 ] Available from: http://www.teses.usp.br/teses/disponiveis/104/104131/tde-27092017-092122/ -
Vancouver
Silva DMB da. Métodos de categorização de variáveis preditoras em modelos de regressão para variáveis binárias [Internet]. 2017 ;[citado 2026 jan. 22 ] Available from: http://www.teses.usp.br/teses/disponiveis/104/104131/tde-27092017-092122/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas