Data Engineering Roadmap

The document outlines a 10-week training program focused on data engineering, covering topics such as setting up Postgres and Airflow, data ingestion, analytics engineering, batch and streaming processing, data quality, and orchestration. Each week has specific objectives, including hands-on labs and a capstone project to apply learned skills. The program emphasizes the use of tools like Docker, dbt, Spark, and Great Expectations for data management and validation.

Uploaded by

Phát Nguyễn Hồng

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as XLSX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

28 views2 pages

Data Engineering Roadmap

Uploaded by

Phát Nguyễn Hồng

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as XLSX, PDF, TXT or read online on Scribd

Subject Objective

Week 1: Introduction and - Running Postgres locally with Docker

Prerequisites -- Setting Setting up
up Airflow
Snowflakelocally
Cloud Data Warehouse
Week 2: Data Ingestion - Ingesting data to AWS with Airflow
-- Partitioning andtoClustering
Ingesting data local Postgres with Airflow
Week 3: Data Warehouse -- Postgres and dbt
Best practices
Week 4: Analytics Engineering -- dbt Whatmodels
is Spark
Week 5: Batch Processing -- Testing and documenting
Spark Dataframes
Week 6: Streaming -- Schemas
Spark SQL(avro)
Processing -- Kafka Streams with Great Expectations and Deequ
Data validation
Week 7: Data Quality -- Pipeline
Week 8: Orchestration and Anomalyorchestration
detection andbenefits
incremental validation with Deequ
- Creating Data Lineage
Automation -- Week 9: working on your project
Week 9 : Capstone Project Event-based vs time-based ; business driven vs data driven
- Week 10 (extra): reviewing your peers
python Labs function and 3 DDL for 3 normal form tables.
- Forward and Backward data format
-- Sample End-to-End data pipeline
Setup Docker
-- Setup MinIO for datalake
Colllect data from API, Database
- Build Pipeline to load data from datalake to data warehouse
-with Schedule dbt pipeline
adenpotent patternwith Airlfow (Astronomer)
-- Processing
Connect BI large data with
tool (Google Spark
Studio / Metabase) with data
- Trigger and schedule spark job
-- Setup schema
Apply Spark jobregister and ML
to process validation
pipeline
-- Analyze real-time data
Implement dataops with dbt and schduling with Airflow
-- Data Quality
Research datawith Great Expectations
lineage
- Design data model for logging and lineage
To be defined

Data Engineering Nanodegree Program Syllabus PDF
No ratings yet
Data Engineering Nanodegree Program Syllabus PDF
5 pages
5-Day KVCET Bootcamp - Data Analytics
No ratings yet
5-Day KVCET Bootcamp - Data Analytics
6 pages
Data Analyst & Engineer 12-Week Course
No ratings yet
Data Analyst & Engineer 12-Week Course
4 pages
Toc D&a Azure Aws
No ratings yet
Toc D&a Azure Aws
12 pages
Roadmap and Skills
No ratings yet
Roadmap and Skills
15 pages
Syllabus For Data Engineering
100% (1)
Syllabus For Data Engineering
3 pages
Data Engineering Roadmap Guide
No ratings yet
Data Engineering Roadmap Guide
3 pages
Data Engineering Roadmap
No ratings yet
Data Engineering Roadmap
2 pages
Iran
No ratings yet
Iran
7 pages
Data Engineering Course Outline
No ratings yet
Data Engineering Course Outline
3 pages
DuckDB and SFTP in Data Engineering
No ratings yet
DuckDB and SFTP in Data Engineering
7 pages
Big Data With Artificial Intelligence and Cloud
No ratings yet
Big Data With Artificial Intelligence and Cloud
7 pages
Data Engineering Nanodegree Program Syllabus
33% (3)
Data Engineering Nanodegree Program Syllabus
15 pages
Big Data Course Outline for Students
No ratings yet
Big Data Course Outline for Students
2 pages
AI DS Roadmap Index
No ratings yet
AI DS Roadmap Index
2 pages
CIT 4401big Data Analytics Course Outline
No ratings yet
CIT 4401big Data Analytics Course Outline
5 pages
Data Engineering Study Plan With Costs
No ratings yet
Data Engineering Study Plan With Costs
5 pages
That
No ratings yet
That
4 pages
Web Scraping
No ratings yet
Web Scraping
6 pages
Data Engineering Nanodegree with AWS
No ratings yet
Data Engineering Nanodegree with AWS
16 pages
Roadmap To Become Data Engineer in 2024
No ratings yet
Roadmap To Become Data Engineer in 2024
8 pages
Data Engineer Introduction
No ratings yet
Data Engineer Introduction
3 pages
Associate Data Practitioner Exam Guide English
No ratings yet
Associate Data Practitioner Exam Guide English
3 pages
Data Engineering Roadmap
No ratings yet
Data Engineering Roadmap
3 pages
NPN 1 Credit Course Learning Guide V1
No ratings yet
NPN 1 Credit Course Learning Guide V1
7 pages
Data and ML Roadmap
No ratings yet
Data and ML Roadmap
4 pages
Azure de and Fabric de Full Edited
No ratings yet
Azure de and Fabric de Full Edited
7 pages
Project Data Eng
No ratings yet
Project Data Eng
2 pages
Data Engineers Instagram Story
No ratings yet
Data Engineers Instagram Story
8 pages
Data Analyst Training Guide
No ratings yet
Data Analyst Training Guide
4 pages
NDS Data Practitioner Degree Curriculum
No ratings yet
NDS Data Practitioner Degree Curriculum
10 pages
Data Engineering Roadmap
No ratings yet
Data Engineering Roadmap
3 pages
Data Engineering Study Plan
No ratings yet
Data Engineering Study Plan
2 pages
Data Engineering Learning Path
No ratings yet
Data Engineering Learning Path
2 pages
Data Science
No ratings yet
Data Science
4 pages
Big Data Analytics Practical Through Practice
No ratings yet
Big Data Analytics Practical Through Practice
4 pages
AI - ML - DS 1-Credit Program-Learning-Guide
No ratings yet
AI - ML - DS 1-Credit Program-Learning-Guide
7 pages
UNIT 1 Merged
No ratings yet
UNIT 1 Merged
11 pages
Introduction of Subject
No ratings yet
Introduction of Subject
28 pages
Data Analytics Engineering Roadmap
No ratings yet
Data Analytics Engineering Roadmap
2 pages
AI & ML Course Plan for Coders
No ratings yet
AI & ML Course Plan for Coders
18 pages
Data Engineer Roadmap
No ratings yet
Data Engineer Roadmap
2 pages
Data Engineer in 3 Months
No ratings yet
Data Engineer in 3 Months
2 pages
Modern DSR 3
No ratings yet
Modern DSR 3
4 pages
PySpark and AWS Big Data Training
No ratings yet
PySpark and AWS Big Data Training
8 pages
Mastering Cloud Data Services
No ratings yet
Mastering Cloud Data Services
18 pages
Shamee K Sharma - IR
No ratings yet
Shamee K Sharma - IR
11 pages
Complete Data Engineering Roadmap With Resources
No ratings yet
Complete Data Engineering Roadmap With Resources
16 pages
Cloud Data Engineering Program Overview
No ratings yet
Cloud Data Engineering Program Overview
5 pages
GCP Data Engineer Course Content
No ratings yet
GCP Data Engineer Course Content
7 pages
DS C59 - Cohort ID 4518 - Aug - 2023 - Calendar EPGP
No ratings yet
DS C59 - Cohort ID 4518 - Aug - 2023 - Calendar EPGP
1 page
Data Science & Engineering Project Ideas
No ratings yet
Data Science & Engineering Project Ideas
2 pages
Enhanced Databricks 6 Week Training Agenda
No ratings yet
Enhanced Databricks 6 Week Training Agenda
6 pages
Data Engineering Roadmap Cloud
No ratings yet
Data Engineering Roadmap Cloud
2 pages
Mayur Rao DE Resume
No ratings yet
Mayur Rao DE Resume
2 pages
12 Computer Science-File Handling-Notes
100% (3)
12 Computer Science-File Handling-Notes
11 pages
Privacy Laws in Asia: Overview & Benefits
No ratings yet
Privacy Laws in Asia: Overview & Benefits
12 pages
Student Behavior Analysis Project
No ratings yet
Student Behavior Analysis Project
3 pages
PBL Project
No ratings yet
PBL Project
18 pages
RDF & RDF Schema for IT Students
No ratings yet
RDF & RDF Schema for IT Students
44 pages
Movie Download Links on Telegram
No ratings yet
Movie Download Links on Telegram
19 pages
Snowflake DSII Driver Configuration Guide
No ratings yet
Snowflake DSII Driver Configuration Guide
7 pages
Ba PDF
No ratings yet
Ba PDF
2 pages
DB2 UDB V8.1 Family Application Development Certification:: Java Programming
No ratings yet
DB2 UDB V8.1 Family Application Development Certification:: Java Programming
23 pages
Ayush Verma Resume
No ratings yet
Ayush Verma Resume
1 page
Oracle Apps
No ratings yet
Oracle Apps
98 pages
BDA Question Bank
No ratings yet
BDA Question Bank
17 pages
EER Diagram to Relational Schema
No ratings yet
EER Diagram to Relational Schema
13 pages
ADB - Practical Material 2024
No ratings yet
ADB - Practical Material 2024
12 pages
SVM 10 Install Instructions
No ratings yet
SVM 10 Install Instructions
62 pages
9 SQL ORDER BY Clause
No ratings yet
9 SQL ORDER BY Clause
2 pages
React GraphQL Server Setup Guide
No ratings yet
React GraphQL Server Setup Guide
15 pages
Technical Skill Bidding Template
No ratings yet
Technical Skill Bidding Template
1 page
16.Template-BCP Testing Report
100% (2)
16.Template-BCP Testing Report
9 pages
Profile
No ratings yet
Profile
4 pages
EWM - QM Related Tables
No ratings yet
EWM - QM Related Tables
4 pages
LGU Regulatory Reform Portal
No ratings yet
LGU Regulatory Reform Portal
14 pages
RDBMS Design for IT Professionals
No ratings yet
RDBMS Design for IT Professionals
10 pages
Module 2 Linked List
No ratings yet
Module 2 Linked List
102 pages
Soscmd
No ratings yet
Soscmd
12 pages
Home Folder
No ratings yet
Home Folder
8 pages
Adding Fields To RPT File
No ratings yet
Adding Fields To RPT File
4 pages
Class 8
No ratings yet
Class 8
37 pages
SAP HANA SQL Script Reference en
No ratings yet
SAP HANA SQL Script Reference en
156 pages
AWS EC2 Basics for Beginners
No ratings yet
AWS EC2 Basics for Beginners
56 pages

Data Engineering Roadmap

Uploaded by

Data Engineering Roadmap

Uploaded by

Subject Objective

Week 1: Introduction and - Running Postgres locally with Docker

You might also like