Source : https://medium.com/@elmaslouhy.mouaad/understanding-hadoop-mapreduce-f3e206cc3598
Ce repository est lié à notre article Le Paradigme MapReduce.
Depuis l'apparition du Big Data, les méthodes, architectures et outils de traitement de gros volumes de données n'ont cessé d'émerger : MapReduce, Hadoop, Spark, etc.
MapReduce, créé par le géant Google, va être très vite adopté comme framework pour faire les opérations de calculs distribués et de parallélisation.
Dans cet article, nous allons à la découverte de MapReduce : du concept à son utilisation. Puis, je présenterai une de ses extensions et un exemple succinct en Python.