Banking Data Warehouse Pipeline

Project Overview

This project demonstrates an end-to-end data pipeline specifically designed for banking data using AWS and dbt. The goal is to ingest, process, and analyze banking data efficiently, catering to various data consumers such as Data Analysts, Data Scientists, BI Developers, and Operations Teams.

Architecture

Data Generation: Using Python scripts to generate banking data.
Data Storage: Storing generated data in Amazon S3.
Ingestion and Loading: Using AWS Glue to ingest and load data from S3 into Amazon Redshift.
Data Transformation: Utilizing dbt (data build tool) to transform data within Amazon Redshift.
- Bronze Layer: Raw ingestion and history.
- Silver Layer: Filtered, cleaned, and augmented data.
- Gold Layer: Business-level aggregates.

Technologies Used

AWS S3: For scalable storage.
AWS Glue: For ETL operations.
Amazon Redshift: For data warehousing.
dbt: For data transformation and modeling.
Python: For data generation scripts.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.venv		.venv
.vscode		.vscode
dbt_dwh		dbt_dwh
logs		logs
.DS_Store		.DS_Store
README.md		README.md
main.py		main.py
s3_loader.py		s3_loader.py
sysArch.jpg		sysArch.jpg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Banking Data Warehouse Pipeline

Project Overview

Architecture

Technologies Used

About

Releases

Packages

Languages

DivineSamOfficial/Banking-Data-Warehouse-Pipeline

Folders and files

Latest commit

History

Repository files navigation

Banking Data Warehouse Pipeline

Project Overview

Architecture

Technologies Used

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages