Skip to content

Projeto de análise de churn, utilizando machine learning na classificação de dados de clientes que poderão ou não efetuar o encerramento de conta bancária.

License

Notifications You must be signed in to change notification settings

emso-exe/Churn_clientes_de_banco

Repository files navigation

🔎 Análise e classificação de Churn de clientes de banco 😒

Projeto de machine learning para análise de dados e classificação de clientes que potencialmente poderão encerrar suas contas em um banco, os dados estão disponíveis na plataforma Kaggle.

O problema a ser solucionado consiste em utilizar os dados bancários dos clientes que efetuaram ou não o encerramento de suas contas para criar um modelo preditivo que irá identificar possíveis clientes que poderão ou não deixar a instituição bancária, podendo assim determinar a taxa de churn (rotatividade/perda de clientes) e com base nos perfis mapeados tomar ações para retenção dos mesmos, evitando impactos como, por exemplo, aumento de custos, queda de lucro, reputação da marca entre outros fatores sensíveis a experiência do cliente com o produto da empresa.

📃 Demanda da análise

  • Analisar a correlação dos dados dos clientes.
  • Gerar um modelo preditivo de churn de clientes.

📋 Tópicos da análise

  1. Análise das medidas estatísticas dos dados
  2. Distribuição dos valores da váriavel dependente (target)
  3. Distribuição dos dados entre as variáveis independentes (features) e dependente (target)
  4. Correlação entre as variáveis
  5. Preparação dos dados para aplicação no modelo preditivo
  6. Separação (treino e teste), padronização e balanceamento dos dados
  7. Modelo preditivo: Regressão Logística
    1. Busca pelos melhores parâmetros e treinamento do modelo
    2. Treinamento e predições do modelo
    3. Métricas de avaliação do modelo
  8. Modelo preditivo: Decision Tree
    1. Busca pelos melhores parâmetros e treinamento do modelo
    2. Treinamento e predições do modelo
    3. Métricas de avaliação do modelo
  9. Modelo preditivo: Random Forest
    1. Busca pelos melhores parâmetros e treinamento do modelo
    2. Treinamento e predições do modelo
    3. Métricas de avaliação do modelo
  10. Modelo preditivo: SVM (Support Vector Machine)
    1. Busca pelos melhores parâmetros e treinamento do modelo
    2. Treinamento e predições do modelo
    3. Métricas de avaliação do modelo
  11. Comparativo gráfico e de métricas
  12. Conclusão

📓 Dicionário de dados

RowNumber: Números de linha de 1 a 10.000
CustomerId: Ids exclusivos para identificação do cliente do banco
Surname: Sobrenome do cliente
CreditScore: Score do cliente
Geography: País onde o cliente reside
Gender: Gênero, masculino ou feminino
Age: Idade do cliente
Tenure: Número de anos que o cliente está no banco
Balance: Saldo bancário do cliente
NumOfProducts: Número de produtos bancários que o cliente está utilizando
HasCrCard: Flag para saber se o cliente possui um cartão de crédito com o banco ou não
IsActiveMember: Flag para saber se o cliente é um membro ativo do banco ou não
EstimatedSalary: Salário estimado do cliente em dólares
Exited: Flag, 1 se o cliente encerrou a conta no banco e 0 se o cliente permaneceu

💻 Tecnologias

  • Python
    • Biblioteca GC
    • Biblioteca Pandas
    • Biblioteca Matplotlib
    • Biblioteca Seaborn
    • Biblioteca Numpy
    • Biblioteca Warnings
    • Biblioteca Tabulate
    • Biblioteca SciKit-learn
    • Biblioteca Imbalanced-learn

💳 Créditos

🔖 Licença

Licença MIT (MIT). Por favor leia o arquivo da licença para mais informações.

About

Projeto de análise de churn, utilizando machine learning na classificação de dados de clientes que poderão ou não efetuar o encerramento de conta bancária.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published