Skip to content

lvgalvao/data-engineering-roadmap

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Roadmap de Engenharia de Dados

Jornada de Dados

Nossa missão é fornecer o melhor ensino em engenharia de dados

Bem-vindo ao Roadmap de Engenharia de Dados da Jornada de Dados! Este repositório foi construído colaborativamente e tem como objetivo capacitá-lo para a carreira de engenharia de dados, ajudando profissionais como você a atingir novos patamares em sua trajetória profissional.

Aqui você encontrará:

  • Roadmap de Estudo: Links, referências e materiais complementares para auxiliar no seu aprendizado. Se você quer ter um plano de estudo, encontrará uma série de projetos e recursos que o guiarão passo a passo no desenvolvimento das habilidades essenciais em engenharia de dados.
  • Códigos das Aulas: Todos os códigos e materiais utilizados durante as aulas estão disponíveis neste repositório para que você possa praticar e aprofundar seu conhecimento.
  • Calendário dos Próximos Encontros: Fique por dentro das datas e temas dos próximos workshops e bootcamps da Jornada de Dados.

Se você gostou do conteúdo e quer se inscrever em nosso programa profissional, pode fazer isso aqui:


Próximos Eventos

Nome/Github Onde Data Mês
Pipeline de dados no Azure Jornada 21/12 Hoje
ETL 10 bilhões de linhas Youtube Terça dia 14/01 ás 19h30 Janeiro
Databricks e delta table (OLAP + OLTP) Jornada 22/01 Janeiro
Bootcamp Multiengine Databricks, Spark e DuckDB Jornada 27/01 até 31/01 Janeiro
Convidado surpresa Jornada 04/02 Janeiro
Kubernetes e Airflow no Google Cloud Jornada 22/02 Fevereiro
Bootcamp de AI Agents Jornada 27/03 Março

roadmap

Tem sugestões de Tópicos? clique aqui

imagem

Abra uma Issue aqui

imagem

Participe e interaja

imagem


Youtube - Workshops ao vivo - Lives abertas

Nome Link Duração Stack/Github
Extração de API do zero Assistir no YouTube 2h GitHub, Python, API, SQL, Azure, Streamlit
Pipeline ETL - Web Scraping com Requests e Beautiful Soup 4 Assistir no YouTube 2h GitHub, Python, Requests e Beautiful Soup 4
Pipeline de Dados com GA4 e Typeform Assistir no YouTube 6h Python, SQL e Cursor AI
Pipeline Gen AI - ETL com API e CRM de vendas Assistir no YouTube 6h Python, SQL, OpenAI, Langchain e Git
WORKSHOP ABERTO #1 - DO ZERO AO DEPLOY COM LUCIANO Assistir no YouTube 2h GitHub, VirtualEnv, TDD, taskipy, pytest, Streamlit, Selenium, Pydantic, MkDocs
Criando ETL Com Python e DUCKDB DO ZERO AO DEPLOY ft. @mehd-io Assistir no YouTube 1h47min DuckDB, SQL, S3, CSV, JSON, MotherDuck, Streamlit, Docker, Render
CRIANDO ETL COM PYTHON E DUCKDB DO ZERO AO DEPLOY Assistir no YouTube 2h32min DuckDB, SQLAlchemy, Google Drive, SQL, Postgres, Python, CSV, Parquet, JSON, Streamlit, Docker, Render
Modern Data Stack com SQL - Parte 1 de 3 ft. @MarcLamberti Assistir no YouTube 2h AirFlow, Astro-cli, Docker, Airbyte Cloud , Render, Postgres
Modern Data Stack com SQL - Parte 2 de 3 Assistir no YouTube 1h53min SQL, dbt, Render
Modern Data Stack com SQL - Parte 3 de 3 Assistir no YouTube 1h53min Python, AirFlow, SQL, dbt, Render, Docker

Workshops - Quem sabe faz ao vivo

Nome Link Profissional Stack
Construindo um Pipeline ETL em Tempo Real Assistir no YouTube Caio Machado Kafka, PostgreSQL e Streamlit
Como sair do ZERO com SQL na AWS Assistir no YouTube Ghabriel Fiorotti ETL Parquet S3 Athena e Glue
Plataforma com Big Query do Zero Assistir no YouTube Alan Lanceloty Python, Airflow, dbt, soda e docker
Qualidade de dados e Contrato de Dados Assistir no YouTube Renan Heckert Pandera e Pydantic

Workshops - Especialistas

Nome Link Profissional Stack
Como sair do ZERO em Observabilidade com Logfire Assistir no YouTube Marcelo Trylesinski Logfire
dbt no Airflow - Como melhorar o desempenho do seu deploy de forma correta Assistir no YouTube Tatiana Martins Airflow e dbt-core
Construa Data Apps Completos com Briefer Assistir no YouTube Lucas Costa Briefer, SQL e Python
Como sair do ZERO no AIRBYTE Assistir no YouTube Alan Lanceloty Airbyte
Como criar do ZERO um Lakehouse Assistir no YouTube Nilton Ueda Conceitual

Youtube - Vídeos tutoriais

Nome Link Duração Stack
Top 5 Projetos de Engenharia de Dados Aprenda ETL, Python e SQL Gratuitamente! Assistir no YouTube 14min Python, DuckDB, Spark, GitHub, Docker
O que é CLOUD? Explicação COMPLETA para DADOS (Deploy Python e SQL na AWS, Azure, GCP com Terraform) Assistir no YouTube 15min Python, GitHub, AWS, Azur, GCP, SQL, Docker, Terraform
Como fazer o Deploy de Airflow na EC2 AWS Assistir no YouTube 14min AWS, EC2, Airflow
Amazon SQS e Rabbit MQ eu preciso mesmo disso? Assistir no YouTube 5min SQS, Rabbit MQ
Segredos para economizar com a AWS Assistir no YouTube 5min AWS
CRUD, qual a vantagem de usar um ORM? Assistir no YouTube 6min SQL Alchemy, Python, ORM, SQL
Como instalar Python em 2024 + Pyenv, PIP, VENV, PIPX e Poetry Assistir no YouTube 33min Pyenv, PIP, VENV, PIPX, Poetry, Python
Como instalar Python em 2024 + VSCode, Git e GitHub do Zero Assistir no YouTube 33min Python, VSCode, Git, GitHub
O que é o arquivo init.py em Python? Explicado com 4 exemplos Assistir no YouTube 14min Python

Especialização Jornada de dados

Nome do Treinamento Link GitHub Status Descrição
Python para Dados Link Concluído Fundamentos de Python para engenharia de dados, com foco em bibliotecas como Pandas.
SQL para Analytics Engineer Link Concluído Domine SQL avançado para análise de dados e otimização de consultas complexas.
dbt-core Link Concluído Utilize dbt-core para transformação de dados no data warehouse com práticas modernas.
Web Scraping Avançado Link Concluído Técnicas avançadas de extração de dados de sites e manipulação de APIs.
Cloud para Dados Link Em andamento Serviços de nuvem aplicados à engenharia de dados com AWS, Azure e GCP.

Caso queira sugerir temas para próximos workshops, abra uma issue.

About

Jornada engenharia de dados 2025

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published