O projeto envolve o uso de três ferramentas muito utilizadas em ciência de dados:
Reduzir as perdas financeiras devido a pessoas mutuarias que não quitam suas dívidas, ,por meio de estudo das informações financeiras e de solicitação de empréstimo para encontrar padrões que possam indicar uma possível inadimplência.
O backup do banco de dados mysql foi restaurado e as informações contidas nas quatro tabelas disponíveis, foram unidas por meio de uma query. Para facilitar o entendimento das informações contidas em cada colunas, foi feita a tradução das informações. Com todos os dados reunidos, a tabela foi exportada em formato .csv para ser usada como base de dados na etapa de análise exploratório e preditiva.
Os dados foram fornecidos na forma de backup de um banco de dados MySQL com as informações dos clientes.
-
Banco de dados MySQL - 'Análise de risco'
- Tabelas
- Dados_mutuarios
Dados pessoais de cada solicitante de empréstimo.
- person_id: ID do solicitante
- person_age: idade (anos)
- person_income: salário anual
- person_home_ownership: situação do imóvel
- person_emp_lenght: tempo de trabalho (anos)
- Emprestimos
Informações do empréstimo solicitado.
- loan_id: ID da solicitação de empréstimo
- loan_intent: Motivo do empréstimo
- loan_grade: pontuação de empréstimos de A a G
- loan_amnt: valor total do empréstimo solicitado
- loan_in_rate: Taxas de juros
- loan_status: Possibilidade de inadimplência
- loan_percent_income: renda percentual valor do empréstimo e salário anual
- historicos_banco
- cb_id: ID do histórico de cada solicitante
- cb_person_default_on_file: Indica se a pessoa já foi inadimplente
- cb_person_cred_hist_length: Tempo - em anos - desde a primeira solicitação de crédito ou aquisição de um cartão de crédito
- id
- person_id: ID da pessoa solicitante
- loan_id: ID da solicitação de empréstimo de cada solicitante
- cb_id: ID do histórico de cada solicitante