-
Todos los datasets y archivos deben estar en la carpeta 'data' local de cada uno.
-
El dataset con eventos se debe llamar 'events.csv' (unico dataset que se va a renombrar, por comodidad).
-
Feature Gathering:
- levantar todos los datasets necesarios en una celda del notebook.
- hacer todo lo que se deba hacer.
- guardar los features encontrados en un .csv en la carpeta 'data' local para futuro uso.
-
Modelos de ML:
- leer todos los .csv necesarios de la carpeta 'data'.
- armar el dataframe (que se va a usar durante todo el notebook) en una celda.
- hacer todo lo que hay que hacer
-
Algunas cosas importantes:
- Siempre hay que usar el mismo dataframe durante todo el modelado, para que sea facil cambiar las features y volver a correr todo.
- Cuando se hace el feature gathering la idea es dejar todo armado para que venga otro, corra todo y tenga el .csv en 'data'.
- Es muy importante hacer el join de todos los .csv a un mismo dataframe en un solo bloque del notebook. Para facilitar el cambio del mismo. No hay que agregar features luego de ese bloque, ya que si otra persona quiere correr el notebook con sus features va a tener que ir a buscar donde fueron agregadas otras features para sacarlas.
-
Notifications
You must be signed in to change notification settings - Fork 1
ndvazquez/7506-TP2
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
No description, website, or topics provided.
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published