Exportar registro bibliográfico

Fraude de cartão de crédito: como a estatística e o machine learning se conversam (2020)

  • Authors:
  • Autor USP: SILVA, GABRIEL FERREIRA DOS SANTOS - ESALQ
  • Unidade: ESALQ
  • Sigla do Departamento: LCE
  • Subjects: ALGORITMOS; APRENDIZADO COMPUTACIONAL; CARTÃO DE CRÉDITO; ESTATÍSTICA; FRAUDE BANCÁRIA; REVISÃO SISTEMÁTICA
  • Language: Português
  • Abstract: A fraude de cartão de crédito é um mecanismo financeiro responsável por movimentar ilegalmente bilhões de dólares todos os anos, com implicações onerosas para clientes, redes de cartão de crédito e seguradoras. Diante disso, buscar mecanismos que permitam captar situações fraudulentas é um importante movimento para que se possa reduzir os prejuízos tangíveis e intangíveis causados no setor. Dois destes mecanismos são a Estatística e o Machine Learning, áreas que, embora muitas vezes consideradas excludentes, apresentam um potencial sinérgico capaz de oferecer resultados mais consistentes. Nesse sentido, este trabalho buscou explorar tal potencial a partir da utilização de um conjunto de modelos estatísticas e algoritmos de Machine Learning. Para tanto, foi realizada uma Revisão Bibliográfica Sistemática acerca da utilização de algoritmos de Machine Learning em situações de fraude de cartão de crédito, com base nos artigos disponíveis no portal Web of Science e publicados no período de 2008 a 2018. Em seguida, a partir de um conjunto de dados sobre fraude de cartão de crédito disponível na plataforma Kaggle, foram sorteados sete grupos amostrais, por meio de amostragem progressiva, respeitando o balanceamento dos dados, com 30, 60, 120, 180, 360, 540 e 984 observações. Para as análises estatísticas, os conjuntos foram submetidos à NP-ANOVA, NP-MANOVA, Regressão Logarítmica, Análises Discriminantes Linear e Quadrática, Mínimos Quadrados Parciais e à Regressão Logística. Paraas classificações por meio do Machine Learning, foram utilizados os algoritmos Naive Bayes, Random Forest, Multilayer Perceptron, CART, K-NN e Support Vector Machine. Os resultados revelaram dois movimentos principais: com base na revisão bibliográfica realizada, foi observado que os principais algoritmos utilizados na detecção de fraude de cartão de crédito são a Regressão Logística, Random Forest, Multilayer Perceptron, Naive Bayes, C4.5 e Redes Neurais. Os melhores desempenhos, considerando o levantamento bibliográfico, foram obtidos através dos algoritmos Naive Bayes, Random Forest e Random Tree. Além disso, a aplicação dos algoritmos e dos métodos estatísticos neste trabalho confirmou que o Random Forest é uma das ferramentas mais eficazes para este tipo de classificação, com bons índices de taxa de acerto e taxa de falsos positivos. Para a taxa de falsos negativos, no entanto, a Regressão Logística, método tradicionalmente estatístico, apresentou melhor desempenho, de modo que, para a busca de um cenário mais assertivo, recomenda-se a utilização de ambos os métodos
  • Imprenta:
  • Data da defesa: 30.11.2020
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      SILVA, Gabriel Ferreira dos Santos. Fraude de cartão de crédito: como a estatística e o machine learning se conversam. 2020. Dissertação (Mestrado) – Universidade de São Paulo, Piracicaba, 2020. Disponível em: https://www.teses.usp.br/teses/disponiveis/11/11134/tde-14012021-200042/. Acesso em: 08 maio 2025.
    • APA

      Silva, G. F. dos S. (2020). Fraude de cartão de crédito: como a estatística e o machine learning se conversam (Dissertação (Mestrado). Universidade de São Paulo, Piracicaba. Recuperado de https://www.teses.usp.br/teses/disponiveis/11/11134/tde-14012021-200042/
    • NLM

      Silva GF dos S. Fraude de cartão de crédito: como a estatística e o machine learning se conversam [Internet]. 2020 ;[citado 2025 maio 08 ] Available from: https://www.teses.usp.br/teses/disponiveis/11/11134/tde-14012021-200042/
    • Vancouver

      Silva GF dos S. Fraude de cartão de crédito: como a estatística e o machine learning se conversam [Internet]. 2020 ;[citado 2025 maio 08 ] Available from: https://www.teses.usp.br/teses/disponiveis/11/11134/tde-14012021-200042/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2025