Skip to content

Repositorio dedicado al analisis del tiempo de permanencia de baches en diferentes zonas del municipio de Hermosillo, Sonora, en relacion a factores socioeconomicos.

License

Notifications You must be signed in to change notification settings

BSM-Analytics/proyecto-baches-hmo

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 

Repository files navigation

Contributors MIT License

Construido con:

Python HTML5 CSS Markdown Git Github

Jupyter Notebooks Python

sep_line

Acerca del Proyecto 🎯


Buscamos determinar si existe una relacion entre la presencia y/o permanencia de baches en las calles versus las caracteristicas socioeconomicas, para distintas zonas del municipio de Hermosillo, Sonora.

Consideramos que los resultados serian de especial interes para todo ciudadano que reside en el municipio de Hermosillo, Sonora, sin embargo tambien podrian servir de referencia a las autoridades locales e inclusive a habitantes de otras localidades de Mexico.

sep_line

Estructura del Proyecto πŸ“


β”œβ”€β”€ modules  <- Codigo fuente del proyecto
β”‚   β”‚
β”‚   β”œβ”€β”€ __init__.py    <- Convierte el contenido de la carpeta modules en un modulo de Python
β”‚   β”‚
β”‚   β”œβ”€β”€ dataset.py     <- Script para descarga de datos
β”‚   β”‚
β”‚   β”œβ”€β”€ tidying.py     <- Script para procesar datos crudos y darles un formato tidy
β”‚   β”‚
β”‚   β”œβ”€β”€ tools.py       <- Archivo con funciones desarrolladas para el proyecto
β”‚   β”‚
β”‚   β”œβ”€β”€ config.py      <- Archivo para depositar configuraciones y variables
β”‚   β”‚
β”‚   └── templates      <- El directorio con los datos en formato tidy
β”‚       β”‚
β”‚       β”œβ”€β”€ data_download_log_template  <- Plantilla para bitacora de descarga de datos
β”‚       β”‚
β”‚       └── data_tidying_log_template   <- Plantilla para bitacora de procesamiento de datos a formato tidy
β”‚
β”œβ”€β”€ data
β”‚   β”œβ”€β”€ raw            <- El directorio con datos crudos - originales e inmutables
β”‚   β”‚
β”‚   └── processed      <- El directorio con los datos en formato tidy
β”‚
β”œβ”€β”€ README.md          <- El README principal para desarrolladores que usaran el proyecto
β”‚
β”œβ”€β”€ Makefile           <- Makefile con comandos que facilitan el uso del proyecto
β”‚
β”œβ”€β”€ references         <- Diccionarios de datos, manuales, y otro material explicativo
β”‚   β”‚
β”‚   β”œβ”€β”€ raw     <- El directorio con los diccionarios de datos crudos
β”‚   β”‚   β”‚
β”‚   β”‚   β”œβ”€β”€ baches_raw_diccionario.md  <- Diccionario Datos Baches crudos
β”‚   β”‚   β”‚
β”‚   β”‚   └── socioeconomico_2020_raw_diccionario.md   <- Diccionario Datos SE crudos
β”‚   β”‚
β”‚   └── processed     <- El directorio con los diccionarios de datos en formato tidy
β”‚       β”‚
β”‚       β”œβ”€β”€ baches_processed_diccionario.md  <- Diccionario Datos Baches/AGEB Tidy
β”‚       β”‚
β”‚       └── socioeconomico_2020_processed_diccionario.md   <- Diccionario Datos SE Tidy
β”‚
β”œβ”€β”€ reports            <- Reportes de analisis (HTML, PDF, LaTeX, etc.)
β”‚   β”‚
β”‚   β”œβ”€β”€ baches_report.html          <- Reporte EDA sobre datos de baches HMO
β”‚   β”‚
β”‚   β”œβ”€β”€ hmo_ec_2020_report.html     <- Reporte EDA sobre datos socioeconomicos de HMO
β”‚   β”‚
β”‚   └── figures        <- Generated graphics and figures to be used in reporting
β”‚
β”œβ”€β”€ requirements.txt   <- Archivo que contiene los requerimientos (dependencias) para crear
β”‚                         el entorno virtual. Para este proyecto se genero con
β”‚                         "pip3 freeze > requirements.txt"
β”‚
β”œβ”€β”€ notebooks          <- Jupyter Notebooks utilizados unicamente, de momento, para pruebas
β”‚
β”œβ”€β”€ LICENSE            <- Licencia Open-Source del MIT adaptada para el proyecto
β”‚
β”œβ”€β”€ docs               <- Proyecto default de mkdocs
β”‚
β”œβ”€β”€ models             <- Directorio destinado a modelos - Temporalmente sin uso
β”‚
β”œβ”€β”€ pyproject.toml     <- Archivo de configuracion de proyecto con metadata del
β”‚                         paquete/modulo baches_hermosillo y configuracion para
β”‚                         otras herramientas e.g. black (formato)
β”‚
└── setup.cfg          <- Archivo de configuracion para flake8
sep_line

Guia de Uso πŸ““

Clonando el Repositorio πŸ”»


  1. Desde una terminal, navegar hasta el directorio donde se desea clonar el repositorio
    cd "<ruta_del_directorio>"
  2. Clonar el repositorio
    git clone https://github.com/BSM-Analytics/proyecto-baches-hmo.git

Con Python 🐍


Creando el Entorno Virtual


  1. Desde una terminal, navegar hasta el directorio donde se clono el repositorio
    cd "<ruta_del_directorio_con_respositorio_clonado>"
  2. Crear un entorno virtual con las herramientas nativas de Python (venv -> virtual env) NOTA: Tambien puedes crearlo con conda u otras herramientas de tu preferencia
    python3 -m venv <nombre_del_entorno>
  3. Activar el entorno virtual
    source activate <nombre_del_entorno>
  4. Instalar las dependencias del proyecto. Estas se encuentran en el documento requirements.txt
    pip3 install requirements.txt
  5. Opcional: Puedes verificar que se hayan instalado los paquetes utilizando la funcion list de pip
    pip3 list

Descargando los Datos


  1. Desde una terminal, estando ubicado en el directorio raiz del proyecto, navegar hacia el directorio modules
    cd modules
  2. Ejecutar el script de Python denominado dataset.py. Este descargara todos los datos a la carpeta data/raw
    python3 dataset.py
  3. Opcional: Verificar que se hayan descargado los datos a la carpeta data/raw
    ls -d ./data/raw

Procesando los Datos a Formato Tidy


  1. Desde una terminal, estando ubicado en el directorio raiz del proyecto, navegar hacia el directorio modules
    cd modules
  2. Ejecutar el script de Python denominado tidy.py. Esto procesara todos los datos ubicados en data/raw y generara los conjuntos de datos tidy en la carpeta data/processed
    python3 tidy.py
  3. Opcional: Verificar que se hayan descargado los datos a la carpeta data/processed
    ls -d ./data/processed

Con Make ➑️


  1. Se puede ejecutar el pipeline completo con el comando:
    make execute_full_pipeline
  2. Para ejecutar el pipeline por cada una de sus etapas, se puede utilizar los siguientes comandos:
    make create_venv
    make activate_venv
    make install_venv_requirements
    make download_data
    make tidy_data
sep_line

EDAs πŸ“Š


  1. Reporte Datos Baches
  2. Reporte Datos Socioeconomicos
sep_line

Fuentes ℹ️


  1. API del Sitio Web del Bachometro del Ayuntamiento de Hermosillo
  2. AGEBS INEGI Hermosillo (2021)
  3. Indicadores Socioeconomicos INEGI Hermosillo (2020)
sep_line

Licenciamiento πŸ“œ


Distribuido bajo la licencia del MIT. Para mas informacion consulte el documento LICENSE.

sep_line

Contacto πŸ“¬


Desarrolladores: ⌨️

About

Repositorio dedicado al analisis del tiempo de permanencia de baches en diferentes zonas del municipio de Hermosillo, Sonora, en relacion a factores socioeconomicos.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published