Shavadoop

Educational project of Simplified Data Processing on Large Clusters, in java.

Il s’agit d’implémenter un « Word Count » reposant sur une architecture répartie scalable, tel MapReduce. Ce « Word Count » classique consiste à compter le nombre d’occurrences de chaque mot contenu dans un document. L’objectif est de réaliser cette opération de façon optimisée (autant que cela a été possible) sur un cluster de machines de TP de l’école.

Notre cluster de machines sera utilisé selon le principe des architectures distribuées, avec une machine principale qui sera notre « Master » et des machines « slaves » qui seront nos « Workers ». Le but est d’optimiser au mieux notre algorithme de « Word Count » en parallélisant et distribuant les différentes tâches sur nos Master et Workers. Ceci afin d’obtenir les meilleures performances.

Source : http://static.googleusercontent.com/media/research.google.com/fr//archive/mapreduce-osdi04.pdf

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
.metadata		.metadata
.recommenders		.recommenders
MASTER_SHAVADOOP_JAR		MASTER_SHAVADOOP_JAR
SLAVE_SHAVADOOP_JAR		SLAVE_SHAVADOOP_JAR
.DS_Store		.DS_Store
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Shavadoop

About

Releases

Packages

Languages

WestleyB/Shavadoop

Folders and files

Latest commit

History

Repository files navigation

Shavadoop

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages