Skip to content

Latest commit

 

History

History
11 lines (6 loc) · 1.05 KB

README.md

File metadata and controls

11 lines (6 loc) · 1.05 KB

Preprocesamiento de datos y clasificación binaria

PDF con la documentación final.

Introducción

Kaggle es una comunidad online propiedad de Google de científicos de datos. Esta comunidad permite a sus usuarios encontrar y publicar conjuntos de datos, explorar y construir modelos en un entorno de ciencia de datos basado en la web, trabajar con otros científicos e ingenieros de aprendizaje automático y acceder en competiciones para resolver desafíos relacionados con este área.

Una de estas competiciones, organizada por el banco Santander, es Santander Customer Transaction Prediction[2], que promete premios de un total de 65.000$ para los equipos con los mejores resultados. Esta competición proporciona un conjunto de datos de las transacciones con 200.000 clientes y 200 variables cada uno y está orientada a identificar qué clientes realizarán una transacción en el futuro, independientemente del dinero.

El objetivo de esta práctica será conseguir un resultado competente para esta competición usando RStudio.