BigData Project For Global Terrorism Database

Made by : Ines Achour / Safa Laabidi / Amal Sammari

In this project we made a pipeline to process the Global Terrorism Database from Kaggle.

The pipeline includes batch and stream processing that's why it's based on the Lambda Architecture.

Architecure

1. Data Ingestion

Kafka

2. Data Processing

Streaming : Spark Streaming
Batch : Hadoop MapReduce

3. Data Storage

Streaming : MongoDB
Batch : HDFS (data before processing) & MongoDB (data after processing)

4. Data Visualization

Dashboarding : MongoDB Charts

Other

Project Folders

1. No Kafka And No MongoDB

GlobalTerrorism_Stream
GlobalTerrorism_Batch

2. Kafka Without MongoDB

GlobalTerrorism_Kafka_Stream

3. Kafka And MongoDB

GlobalTerrorism_Kafka_Batch : append the sent data from Kafka to the database csv file
GlobalTerrorism_Batch_MongoDB : launch the batch process on the csv database and save the result in MongoDB database
GlobalTerrorism_Kafka_MongoDB : receive streaming data, process them and save result in MongoDB database

Visualization

We used MongoDB Charts for visualization.

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
.idea		.idea
GloablTerrorism_Stream		GloablTerrorism_Stream
GlobalTerrorism_Batch		GlobalTerrorism_Batch
GlobalTerrorism_Batch_MongoDB		GlobalTerrorism_Batch_MongoDB
GlobalTerrorism_Kafka_Batch		GlobalTerrorism_Kafka_Batch
GlobalTerrorism_Kafka_Stream		GlobalTerrorism_Kafka_Stream
GlobalTerrorism_Kafka_Stream_MongoDB		GlobalTerrorism_Kafka_Stream_MongoDB
images		images
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

BigData Project For Global Terrorism Database

Architecure

1. Data Ingestion

2. Data Processing

3. Data Storage

4. Data Visualization

Other

Project Folders

1. No Kafka And No MongoDB

2. Kafka Without MongoDB

3. Kafka And MongoDB

Visualization

About

Releases

Packages

Languages

safa-abidi/BigData_Project

Folders and files

Latest commit

History

Repository files navigation

BigData Project For Global Terrorism Database

Architecure

1. Data Ingestion

2. Data Processing

3. Data Storage

4. Data Visualization

Other

Project Folders

1. No Kafka And No MongoDB

2. Kafka Without MongoDB

3. Kafka And MongoDB

Visualization

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages