Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Proyecto 🚀 #20

Open
ricardomiron opened this issue Sep 10, 2020 · 16 comments
Open

Proyecto 🚀 #20

ricardomiron opened this issue Sep 10, 2020 · 16 comments
Labels
informativo Indicaciones generales tarea Actividad a realizar

Comments

@ricardomiron
Copy link
Member

ricardomiron commented Sep 10, 2020

Proyecto para el curso de Datos Abiertos y Hacking Cívico 🚀

Aquí encontrarás las instrucciones para realizar tu proyecto final del curso de Datos Abiertos y Hacking Cívico, en donde aplicarás todos los conocimientos de las lecciones anteriores para crear tu primer hack cívico.

Especificaciones 🏷️

Hasta ahora has aprendido sobre diferentes herramientas para obtener, explorar, visualizar datos, y más. Así que intentaremos desarrollar un proyecto simple, pero completo, que incluya todos estos componentes aprendidos.

Comienza planteando 3 preguntas de interés en tu comunidad, con relación a un tema público o social específico. Trata de que las preguntas estén enfocadas a:

  1. La existencia u obtención de los datos.
  2. Una característica o consecuencia directa de los datos.
  3. Un tema que ayude a resolver los planteamientos anteriores o una herramienta que sea el resultado de tus análisis y exploraciones.

Por ejemplo:

  1. ¿Existen datos abiertos sobre reportes de baches, así como presupuesto destinado para taparlos en la ciudad/estado Xʔ De ser así, ¿de dónde podría descargar o scrapear un conjunto de datos?
  2. ¿Se pueden explorar/visualizar datos historiales para saber si los reportes de baches han ido aumentando o disminuyendo conforme pasa el tiempo? ¿Existe un aumento/disminución del presupuesto destinado a la reparación de calles, que sea consistente con los historiales de reportes?
  3. ¿Puedo redactar un reporte que ilustre la consistencia del presupuesto-reportes sobre baches o reparación de calles en los últimos años? ¿Puedo concluir con un estudio contundente que me permita realizar alguna acción posterior para cambiar la situación?

Una vez que tengas el planteamiento de las preguntas anteriores, puedes proceder a investigar y obtener los datos, así como a responder las preguntas utilizando las herramientas que hemos explorado en el curso. La recomendación es que puedas ir documentando todo el proceso y que tengas bien claros los entregables para que tu proyecto contenga la estructura adecuada.

Entregables 📁

Un único Notebook autocontenido con la documentación y el código del proyecto, de manera que se vaya explicando secuencialmente qué se hizo en cada paso, la interpretación de los resultados obtenidos y un análisis final. Debe incluir como mínimo:

  • Título del proyecto - Un título breve que permita saber sobre qué y dónde realizaste tu proyecto.
  • Descripción del proyecto - Una descripción concisa sobre la problemática abordada, la comunidad/ ciudad/ estado y el rubro o área que se analiza.
  • Selección y obtención de los datos (responde a la pregunta 1) - Menciona la fuente de los datos, el proceso de obtención de los mismos y su alcance. En caso de que hayas hecho scraping (o los hayas obtenido de alguna otra manera diferente a un portal de datos) agrega el código que usaste.
  • Exploración de los datos (responde a la pregunta 2) - Resume las principales características de los datos e interprétalos que puedas encontrar respuesta a tus preguntas iniciales.
  • Visualización de los datos (responde a la pregunta 3) - Comunica de manera visual los resultados obtenidos del análisis de los datos.
  • Conclusión - Menciona brevemente qué acciones se podrían producir a manera de propuesta a partir de lo que encontraste.
  • Referencias - Agrega las fuentes de información o consulta que hayas usado.

Pon un enlace al Notebook (ya sea que lo hayas subido a GitHub o de Google Colab) en un comentario de este Issue con el título de tu proyecto. El archivo (notebook) deberá llamarse

Recomendaciones 👍

El Notebook debe tener una estructura ordenada, consistente y entendible que permita su comprensión tanto por lectores técnicos como no técnicos. Te recomendamos:

  • Incluir ligas de referencia, imágenes, etc. que ayuden a proveer contexto.
  • Usar Markdown para darle el formato adecuado a las explicaciones.
  • Usar los bloques de código para separar lógicamente el procesamiento/ visualización de los datos.
  • Utilizar mapas en caso de trabajar con datos georreferenciados.

Indicaciones ⚠️

Haz un comentario en este Issue con un enlace al Notebook (ya sea que lo hayas subido a GitHub o desde Google Colab). Adicionalmente, desde tu fork, dentro de la carpeta de proyecto:

Guarda una copia del Notebook en tu fork de GitHub de la siguiente manera proyecto/proyecto-hacking-civico.ipynb.

Notas adicionales 🗒️

*Puedes abordar cualquier tema público o social y utilizar cualquier fuente de datos siempre y cuando sea de un tema relevante al curso (en esta ocasión, aunque es un uso válido de los datos abiertos, dejaremos fuera la aplicaciones comerciales o estudios de mercado).

**El proyecto se realiza de manera individual.

***Los mejores proyectos serán publicados y presentados con un reconocimiento especial por el esfuerzo realizado.

Fecha límite 📆

Domingo 4 de diciembre a las 11:59 pm.

@ricardomiron ricardomiron added the tarea Actividad a realizar label Sep 10, 2020
@ricardomiron ricardomiron added this to the Proyecto final milestone Sep 10, 2020
@ricardomiron ricardomiron added the informativo Indicaciones generales label Sep 10, 2020
@LuisGTZB
Copy link

LuisGTZB commented Sep 25, 2020

Notebook en GitHub

Notebook en GoogleColab

@shan-david
Copy link

shan-david commented Sep 26, 2020

Accidentes viales en el municipio de Puebla

@ricardomiron ricardomiron pinned this issue Sep 28, 2020
@MadriD2ev
Copy link

MadriD2ev commented Oct 1, 2020

🌊Ciclones que han impactado y municipios que han sido afectados por ellos en el Estado de Veracruz de 1999 a 2014.

@MARTIN0399
Copy link

MARTIN0399 commented Oct 1, 2020

Notebook GoogleColab

Notebook Gitub

@jose-gomezm
Copy link

Yucatán: Salud mental 🧠

@Glaydyesther
Copy link

El Ejercicio Físico Salvando Vidas


GitHub
Google Colab

@ghost
Copy link

ghost commented Oct 3, 2020

México: Análisis de Accidentes de Tránsito Terrestre en Zonas Urbanas y Suburbanas 🚗 🚨

Github
Google Colab

@MarcelaMosino
Copy link

MarcelaMosino commented Oct 3, 2020

Colab
Github

@jorgegarcia396
Copy link

@hizmarck
Copy link

hizmarck commented Oct 5, 2020

Yucatán. Desnutrición.

@EsquivelJC
Copy link

Accidentes viales en Monterrey

Github

Google Colab

Una disculpa por la entrega tardía, los trabajos de la facultad tuvieron que ser prioridad, aún si no lo toman en cuenta por fuera de tiempo, no quería dejarlo inconcluso cuando ya llevaba desde finales de julio con este curso, al menos quería hacer algo sencillo, de nuevo una disculpa y gracias por todo

@cabreratr
Copy link

Muertes maternas en México

@Edgar-La
Copy link

Edgar-La commented Oct 11, 2020

Hacking Cívico: Deuda Pública del Estado de Guanajuato.

Proyecto en Github

Proyecto en Colaboratory

@jballesterosc
Copy link

jballesterosc commented Oct 12, 2020

Análisis de contratos adjudicados para atender la situación del COVID-19 en la Ciudad de México 💰 💸

@ricardomiron ricardomiron unpinned this issue Oct 27, 2020
@davseg
Copy link

davseg commented Oct 30, 2020

Hola compañeros! Espero anden bien 👍
Hace unos días tuve la desgracia de que Google Colab (GC) eliminara por error mi proyecto final 😢 Me había resignado a dejar el asunto ahí pero llegué a la conclusión de que sería injusto considerando sus trabajos finales y todo el empeño que puso el team Codeando México y Future Lab 💪 Adjunto aquí el reporte súper sencillo que hice porque siguen mis problemas con GC (no obstante, dejé los datos y el script de Spyder en mi carpeta de tareas). Un abrazo a todos! 😄


ENTORNO NACIONAL DE LAS MyPYMES EN MÉXICO

las-tienditas-han-tenido-que_0_34_600_373
Fotografia recuperada del portal Milenio.com

Las Micro, Pequeñas y Medianas Empresas (MyPYMES) son negocios ubicados a lo largo del país que se desenvuelven en uno de los múltiples sectores económicos (desde estéticas y tienditas hasta despachos tecnológicos y exportadores de baja escala). Se les suele clasificar según el número de personas que emplean: las micro de 1 a 10 sea en industria, comercio o servicios; las pequeñas de 11 a 30 en comercio y de 11 a 50 en industria y servicios; y las medianas de 31 a 100 en comercio, 51 a 100 en servicios y 51 a 250 en industria (INEGI 1).

Su trascendencia en la economía nacional no sólo va de representar el 95% de las empresas existentes, dar empleo a 4 de cada 10 mexicanos y producir 9% del PIB, sino que también es una válvula de escape para el desempleo y las tensiones sociales. No obstante a su importancia, 83% de las microempresas en el país son informales y su productividad laboral ha caído hasta -2% en años recientes (INEGI 2).

Aquí nos interesa, por un lado, poner en práctica algunas de las herramientas aprendidas en el curso y, por el otro, contar con un diagnóstico elemental sobre la operación y el desarrollo de las MyPYMES. Para ello, dividimos el resto del trabajo en tres secciones donde se habla sobre el origen de los datos, el análisis descriptivo y las enseñanzas.

Datos

La información utilizada proviene de la Encuesta Nacional sobre Productividad y Competitividad
de las Micro, Pequeñas y Medianas Empresas (ENAPROCE) 2018, que contiene información de 2017 y 2016 en ciertos casos, y fue publicada por Instituto Nacional de Estadística y Geografía (INEGI) con el apoyo de la Asociación Mexicana de Secretarios de Desarrollo Económico, A.C. (AMSDE). Una versión anterior se realizó previamente bajo iniciativa del Instituto Nacional del Emprendedor (INADEM) y el Banco Nacional de Comercio Exterior, S.N.C. (BANCOMEXT) en 2015 (INEGI 3).

El objetivo de la ENAPROCE es complementar los Censos Económicos mediante un enfoque específico y pormenorizado de la operación y desarrollo de las MyPYMES. Aunque las preguntas y extensión varia ligeramente entre las Micro (M) y Pequeñas y Medianas empresas (PyMES), ambas incluyen alguno de los siguientes apartados (INEGI 4):

  1. Datos generales de la empresa.
  2. Clasificación económica.
  3. Inicio de operaciones.
  4. Actividades complementarias del propietario del negocio.
  5. Personal ocupado, tiempo efectivo de trabajo y remuneraciones.
  6. Capacitación.
  7. Gastos por consumo de bienes o servicios.
  8. Ingresos de bienes o servicios.
  9. Existencias.
  10. Activos fijos.
  11. Capacidad de su negocio y expectativas de desarrollo.
  12. Apoyos gubernamentales y fuentes de financiamiento.
  13. Cadenas productivas globales.
  14. Ciencia y tecnología.
  15. Ambiente de negocios y regulación.

Análisis

Los reactivos mostrados a continuación son sólo una muestra parcial del cuestionario (se omitieron las secciones 7, 8, 9 y 10). Aunque su elección es totalmente discrecional, permiten responder al objetivo de la actividad.

  1. Datos generales de la empresa 🏭

Se entrevistaron a un Total (T) de 4,169,677 empresas, de las cuales 97.3% fueron M y 2.7% PyMES. La propiedad del negocio, disponible únicamente para las PyMES, arroja que del total de casos el 58.3% recae en el fundador, el 17.1% en la familia del fundador, 8.8% en accionistas dispersos, 7.8% en individuos privados, 3.3% en gerentes, 2.5% en otros y 2.2% en capital privado o capital de riesgo. Otra pregunta importante es:

Pregunta 9: Número de empresas según los medios de pago que aceptan por los productos (bienes o servicios)
df_enaproce9atp2b

  1. Personal ocupado, tiempo efectivo de trabajo y remuneraciones 👥

Pregunta 14: Número de empresas según los problemas que las empresas indicaron como los tres más importantes que enfrentan para su crecimiento
df_enaproce14a

Pregunta 16: Número de empresas según la principal carencia del personal que contratan
df_enaproce16ap1b

  1. Capacitación 🎓

Un total de 635,216 y 639,729 empresas recibieron capacitación en 2016 y 2017, respectivamente, manteniendo una concentración de 90.4% en M y 9.6% en PyMES en ambos años. A continuación, un rubro adicional de relevancia:

Pregunta 18: Número de empresas según la principal causa por la que no ofreció capacitación al personal
df_enaproce18a

  1. Capacidad de su negocio y expectativas de desarrollo 💡

Cómo reaccionan al surgir un inconveniente? Tomando como referencia al número de empresas mencionadas en I, 21.7% de M, 12.9% de PyMES y 21.5% de T lo solucionaron pero no se llevaron a cabo acciones posteriores; 24.6% de M, 39.3% de PyMES y 25% de T alcanzaron los resultados y realizaron cambios para asegurar que no sucediera de nuevo; 13.3% de M, 34.3% de PyMES y 13.9% de T lo solucionaron, emprendieron modificaciones para garantizar que no se repitiera e iniciaron un proceso de mejora continua para anticipar problemas; y, finalmente, 40.4% de M, 13.5% de PyMES y 39.7% de T no llevaron a cabo acciones. Abajo se especifica otra duda crucial:

Pregunta 33: Número de empresas según el número de indicadores clave de desempeño que se monitorearon
df_enaproce33atp3a1
df_enaproce33atp3a2
df_enaproce33atp3a3

  1. Apoyos gubernamentales y fuentes de financiamiento 💲

En 2016 solicitaron crédito gubernamental 38,308 M y se aprobó a 78%, 1,592 PyMES con respuesta favorable del 62% y 39,900 T consiguiendo los recursos el 78%. En 2017, solicitaron crédito 34,596 M pero sólo se aprobó a 62%, 1,856 PyMES con amplia respuesta desfavorable del 64% y 36,451 T consiguiendo los recursos únicamente el 62%. La gráfica contigua explica la lógica de este fenómeno:

Pregunta 50:
df_enaproce50ap1b

  1. Cadenas productivas globales 🌎

Apenas 5,143 de las 111,958 PyMES participan en procesos productivos segmentados. En 2016, aquellas empresas inactivas lo atribuyen a falta de información (35.3%), giro de su empresa (25.4%), no lo considera necesario (18.8%), no le interesa (15.5%), precios ofrecidos muy bajos (2%), problemas de financiamiento (1.5%), producción insuficiente (0.8%), otra (0.4%) y problemas de calidad (0.3%). Para 2017 las cifras cambian a 34.8%, 25.5%, 19.1%, 15.5%, 1.9%, 1.6%, 0.8%, 0.4% y 0.3%, respectivamente.

  1. Ciencia y tecnología 🔭

Del número de empresas mencionadas en I, se da el uso de computadoras en 37.4% de M, 94.7% de PyMES y 39% de T. Al enfocarnos en M, notamos que quienes no las utilizan lo asocian a 50.5% no la necesitan, 16.5% no saben usarlo, 12.2% falta de recursos económicos, 10% no cuentan con equipo de cómputo, 5.4% no saben para que puede ser útil, 4.9% no les interesa, 0.3% renta equipo y 0.2 otra.

  1. Ambiente de negocios y regulación 🚨

Pregunta 85: Número de empresas según la manera de cómo han llevado la contabilidad
df_enaproce85a

Pregunta 81: Número de empresas según los problemas que las empresas indicaron como los tres más importantes que enfrentan para su crecimiento
df_enaproce81atp2a

Conclusión

El mensaje es claro. Las MyPIMES constituyen la principal fuente de ingresos para un gran número de familias. Sin embargo, adolecen de capacitación deficiente de sus recursos humanos, los productos o servicios de poco valor agregado, el encadenamiento productivo inexistente, las fuentes de financiamiento inaccesibles, los programas gubernamentales condicionados, la carga impositiva excesiva, los choques económicos reincidentes y la competencia desafiante. Sea causa o consecuencia de lo anterior, se da cabida a la informalidad e improductividad.

Referencias

(INEGI 1) https://www.inegi.org.mx/contenidos/programas/ce/2009/doc/minimonografias/m_pymes.pdf
(INEGI 2) http://internet.contenidos.inegi.org.mx/contenidos/productos//prod_serv/contenidos/espanol/bvinegi/productos/nueva_estruc/702825077952.pdf
(INEGI 3) https://www.inegi.org.mx/app/biblioteca/ficha.html?upc=702825190811
(INEGI 4) https://www.inegi.org.mx/app/biblioteca/ficha.html?upc=702825190811

@davseg
Copy link

davseg commented Oct 30, 2020

Pdt. En caso de que sigan igual de animados que yo por el curso, les comparto otro que probablemente nos ayudaria a seguir nuestro aprendizaje: https://hsalvadol.wixsite.com/cursosds Inicia el lunes y lo imparten 2 egresados de la maestría en Programación y Políticas Públicas de la universidad de Chicago que andan muy metidos en el Data Science. Abrazo a todos!

@ricardomiron ricardomiron reopened this Nov 19, 2020
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
informativo Indicaciones generales tarea Actividad a realizar
Projects
None yet
Development

No branches or pull requests