Skip to content

Creación de Base de Datos Mercamadrid y consultas con MongoDB.

Notifications You must be signed in to change notification settings

pabloabap/MongoDB_Mercamadrid2020

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 
 
 
 
 

Repository files navigation

Creación de base de datos de Mercamadrid y realización de consultas con MongoDB

Introducción

En este proyecto he trabajado sobre el volumen y precio de productos comercializados en Mercamadrid de enero a septiembre de 2020. Los datos han sido obtenidos del portal de datos abiertos del Ayuntamiento de Madrid.

Mercamadrid es el centro de abastecimiento y distribución de alimentos frescos más importante de España y un referente internacional. Fue fundado en 1982 y actualmente cuenta con 222 hectareas dedicadas a la comercialización de frutas, verduras, carnes y pescados al por mayor.

Los datos vienen en CSV por lo que he hecho ciertos cambios para convertirlos a formato JSON (mercamadrid2020.json) y poder sacar más partido de ellos. En total son 33.644 registros y 8 campos.

Estructura del conjunto de datos

  1. fechaVenta: Momento de recopilación de los datos
    • año: El año de la toma de datos es 2020
    • mes: De enero a septiembre en formato número
  2. codVariedad: Código de producto vendido. Dividido en codFam y codProd:
    • codFam: Clasifica los productos según familias. En base a observaciones:
      - CA: Vacuno
      - CB: Ovino
      - CC: Porcino
      - CE: Avicola, conejo, perdiz y codorniz
      - CG: Vacuno
      - CH: Ovino (incluye producto congelado)
      - CI: Porcino (incluye producto congelado)
      - CK: Codorniz, conejo, pavo, perdiz y pollo
      - F1: Fruta y frutos secos
      - F2: Hortalizas, tubérculos y setas
      - F3: Patatas
      - P4: Pescado fresco
      - P5: Marisco fresco
      - P6: Pescado y marisco congelado
    • codProd: Código del producto dentro de la familia
  3. descVar: Descripción del producto vendido
  4. origen: Código de origen del producto. Del 1 al 54 corresponde al número de provincia de España. Por encíma, hacen referencia a distintos paises.
  5. descOrigen: Descripción del origen del producto
  6. kg: Kilos vendidos en la franja de tiempo
  7. precio: Precios/kg registrados en el periodo separados en:
    • freq: Precio más frecuente registrado en el periodo
    • max: Precio máximo registrado del periodo
    • min: Precio mínimo registrado del periodo
  8. tags: Etiquetas clasificadoras de cada registro (elaboración propia)

Importacion

Importo archivo JSON por linea de comandos e inserto 4 registros de forma manual.

Consultas

De busqueda

  1. Comprobar que los registros tienen el campo precio relleno.
  2. Encontrar los productos de enero 2020 con precio.freq entre 0.01€ y 0.20€ y ordenarlos por ascendentemente por precio.freq.
  3. Encontrar los tegistro con una etiqueta (tags) para pensar posibles etiquetas a añadir.

De actualización

  1. Crear una nueva columna que sea TRUE si el producto es nacional (clave "origen" menor a 54).

De proyección

  1. Consultar las claves "descOrigen" y "tags" de cada registro.

De agregación

  1. Agrupar la canditad (Kg) de producto vendido en Mercamadrid por lugar de origen y ordenar descendentemente en función de la cantidad.
  2. Top 10 productos con más kg vendidos de origen valenciano y su cantidad.
  3. Conocer los 10 lugares de origen que llevan más cantidad de un único producto y mostrar el producto del que se trata.
  4. Ventas anuales en Mercamadrid por mes y ordenadas descendentemente por facturación.
  5. Ventas anuales de producto, kg vendidos y ordenadas descendentemente por facturación.
  6. Conocer cúantos productos diferentes se venden por categoría ("codFam").
  7. Producto más caro de cada familia de producto.
  8. Productos internacionales ordenados descendentemente por ventas (kg).
  9. Kg de mercancía de origen nacional vs origen internacional.
  10. Top 10 importadores y cantidad importada.
  11. Obtener todos los peces con la categoría "RIO" en su clave "tags" y ordenar por "precio.freq" descendentemente.

About

Creación de Base de Datos Mercamadrid y consultas con MongoDB.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published