Base de dados utilizada foi retirada do site: https://www.kaggle.com/datasets/dhanushnarayananr/credit-card-fraud
Neste projeto utilizamos dados de transações de cartão de crédito para identificar fraudes. Com 1 milhão de registros de transações, cerca de 8,74% delas foram classificadas como fraudes. As variáveis utilizadas para identificar as fraudes estão relacionadas com a localização onde ocorreram as transações, o valor da transação e mecanismos de segurança de um cartão de crédito, como a utilização de chip e pin number.
Diante de um problema de classificação com dados desbalanceados, foram implementadas técnicas de compensação para balancear as classes. Desta maneira, foram testados diferentes algoritmos tanto sobre a base de dados desbalanceada quanto sobre a base de dados balanceada. Os algoritmos utilizados e os resultados podem ser encontrados na tabela abaixo.