Exportar registro bibliográfico

Métodos de categorização de variáveis preditoras em modelos de regressão para variáveis binárias (2017)

  • Authors:
  • USP affiliated authors: SILVA, DIEGO MATTOZO BERNARDES DA - INTER: ICMC -UF
  • Unidades: INTER: ICMC -UF
  • Sigla do Departamento: SME
  • Subjects: REGRESSÃO LOGÍSTICA; MODELOS (ANÁLISE MULTIVARIADA)
  • Keywords: Categorização de variáveis preditoras; Categorization of predictor variables; Credit scoring; Regressão; Regression; Risco de crédito
  • Language: Português
  • Abstract: Modelos de regressão para variáveis resposta binárias são muito comuns em diversas áreas do conhecimento. O modelo mais utilizado nessas situações é o modelo de regressão logística, que assume que o logito da probabilidade de ocorrência de um dos valores da variável resposta é uma função linear das variáveis preditoras. Quando essa suposição não é razoável, algumas possíveis alternativas são: realizar transformação das variáveis preditoras e/ou inserir termos quadráticos ou cúbicos no modelo. O problema dessa abordagem é que ela dificulta bastante a interpretação dos parâmetros do modelo e, em algumas áreas, é fundamental que eles sejam interpretáveis. Assim, uma abordagem muitas vezes utilizada é a categorização das variáveis preditoras quantitativas do modelo. Sendo assim, este trabalho tem como objetivo propor duas novas classes de métodos de categorização de variáveis contínuas em modelos de regressão para variáveis resposta binárias. A primeira classe de métodos é univariada e busca maximizar a associação entre a variável resposta e a covariável categorizada utilizando medidas de associação para variáveis qualitativas. Já a classe de métodos multivariada tenta incorporar a estrutura de dependência entre as covariáveis do modelo através da categorização conjunta de todas as variáveis preditoras. Para avaliar o desempenho, aplicamos as classes de métodos propostas e quatro métodos de categorização existentes em 3 bases de dados relacionadas à área de risco de crédito e adois cenários de dados simulados. Os resultados nas bases reais sugerem que a classe univariada proposta têm um desempenho superior aos métodos existentes quando comparamos o poder preditivo do modelo de regressão logística. Já os resultados nas bases de dados simuladas sugerem que ambas as classes propostas possuem um desempenho superior aos métodos existentes. Em relação ao desempenho computacional, o método multivariado mostrou-se inferior e o univariado é superior aos métodos existentes.
  • Imprenta:
  • Data da defesa: 13.06.2017
  • Online source access
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      SILVA, Diego Mattozo Bernardes da; PEREIRA, Gustavo Henrique de Araujo. Métodos de categorização de variáveis preditoras em modelos de regressão para variáveis binárias. 2017.Universidade de São Paulo, São Carlos, 2017. Disponível em: < http://www.teses.usp.br/teses/disponiveis/104/104131/tde-27092017-092122/ >.
    • APA

      Silva, D. M. B. da, & Pereira, G. H. de A. (2017). Métodos de categorização de variáveis preditoras em modelos de regressão para variáveis binárias. Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/104/104131/tde-27092017-092122/
    • NLM

      Silva DMB da, Pereira GH de A. Métodos de categorização de variáveis preditoras em modelos de regressão para variáveis binárias [Internet]. 2017 ;Available from: http://www.teses.usp.br/teses/disponiveis/104/104131/tde-27092017-092122/
    • Vancouver

      Silva DMB da, Pereira GH de A. Métodos de categorização de variáveis preditoras em modelos de regressão para variáveis binárias [Internet]. 2017 ;Available from: http://www.teses.usp.br/teses/disponiveis/104/104131/tde-27092017-092122/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2020