Este repositório contém um notebook Jupyter abordando o aprendizado a partir de dados relacionados a doenças cardíacas. O projeto é composto pelos seguintes tópicos:
-
Aprendizagem a partir de Dados de Doenças do Coração:
- Introdução ao escopo do notebook.
-
Pré-processamento: Eliminação de Dados Duplicados:
- Discussão sobre a eliminação de dados duplicados.
-
Normalização de Alguns Atributos:
- Explicação da normalização de atributos fora de escala.
-
Visualizações Gráficas:
- Utilização de BoxPlot e gráfico de dispersão para explorar a distribuição dos dados.
-
Verificação com BoxPlot e Análise de Covariância:
- Utilização de visualizações para examinar a relação entre atributos descritivos e preditivos.
- Exploração da covariância e correlação entre variáveis.
-
Análise de Overfitting e Underfitting:
- Avaliação de overfitting e underfitting para características específicas.
-
Avaliação do Modelo com K-Fold:
- Utilização do método K-Fold para avaliar o desempenho do modelo.
-
Matriz de Confusão:
- Cálculo de matrizes de confusão para diferentes métricas de distância.
-
Naive Bayes:
- Introdução e possível implementação do algoritmo Naive Bayes.
-
Perceptron Simples e MLP:
- Exploração de redes neurais Perceptron Simples e MLP.
Certifique-se de ter o ambiente Python configurado com as dependências necessárias. Abra o notebook em um ambiente Jupyter com as seguintes instruções:
pip install -r requirements.txt
Abra o notebook em um ambiente Jupyter:
jupyter notebook nome_do_notebook.ipynb
Execute as células do notebook uma a uma para replicar a análise.
Contribuições são bem-vindas! Sinta-se à vontade para abrir issues ou pull requests.