Practicas de Data Science realizadas para el curso de CoderHouse.
La data original fue recogida por "Centers of Disease Control and Prevention", e incluye información de los diferentes estados de Estados Unidos. Se encuentra en: https://www.cdc.gov/brfss/annual_data/annual_2020.html.
Para la elaboración de este trabajo se ha utilizado la data revisada y publicada en kaggle por el usuario KAMIL PYTLAK.
El link con los datos es el siguiente: https://www.kaggle.com/datasets/kamilpytlak/personal-key-indicators-of-heart-disease
Cuenta con un archivo, "heart_2020_cleaned.csv", el cual contiene 319795 observaciones y 18 variables.
Conforme avanza las clases se iran agregando mas notebooks, y hasta la fecha se encuentran subidos los siguientes archivos:
- Análisis Univariado
- Análisis Bivariado
- Análisis Multivariado
- Modelo Árbol de Decisión y Random Forest
- Primera entrega del proyecto final
- Segunda entrega del proyecto final
- Avance de la tercera entrega
- Carpeta con el trabajo finalizado
Nuestro objetivo final es practicar, aprender y poder mejorar en el área de Data Science.