University of Buenos Aires (UBA)
Master in Data Mining and Knowledge Discovery
Datamining en Ciencia y Tecnologia
- Adrian Norberto Marino
- Claudio Collado
- Flavia Felicioni
Paso 1: Descargar el repositorio.
$ git clone https://github.com/magistery-tps/dm-cyt-tp2.git
$ cd dm-cyt-tp
Paso 2: Crear environment de dependencias para el proyecto (Parado en el directorio del proyecto).
$ conda env create -f environment.yml
Paso 3: Activamos el entorno donde se encuentran instaladas las dependencias del proyecto.
$ conda activate dm-cyt-tp2
Paso 4: Descomprimir el dataset:
$ cd datasets
$ unzip strength.SWOW-EN.R1.csv.zip
Paso 5: Descargar y descomprimir word embedding:
$ wget https://nlp.stanford.edu/data/glove.840B.300d.zip
$ unzip glove.840B.300d.zip
Nota: En algunas ocasiones el servidor de stanford no admite descargas. Como alternativa se puede descargar desde kaggle.
Paso 6: Sobre el directorio del proyecto levantamos jupyter lab.
$ jupyter lab
Jupyter Notebook 6.1.4 is running at:
http://localhost:8888/?token=45efe99607fa6......
Paso 7: Ir a http://localhost:8888.... como se indica en la consola.
Paso 1: Agregar la nueva dependencia a ´environment.yml´
Conda tiene sus propios repositorios de paquetes pero en caso de tener algun problema siempre se puede usar los paquetes de pip.
...
dependencies:
- SOY_UN_PAQUETE_DE_CONDA
- SOY_OTRO_PAQUETE_DE_CONDA
- pip:
- SOY_UN_PAQUETE_DE_PIP
- SOY_OTRO_PAQUETE_DE_PIP
...
Paso 2: Una ques que agregamos el nombre del nuevo pquetes en ´environment.yml´ resta instalarlo. Para esto debemos actializar nuestro environment con con lso cambio que realizamos en ´environment.yml´ de la siguiente forma:
$ conda env update -f environment.yml
Paso 3: Finalmente si teniamos abierto jupyter lab, debemos reinifiar el kernel donde estemso corriendo nuestra notebook para poder cargar la nueva libreria.
Paso 1: Instalar tema.
$ jupyter labextension install @oriolmirosa/jupyterlab_materialdarker
Paso 2: Reiniciar Jupyter Lab