Data
Engineering
PROGRAMA DEL CURSO
Educación digital
para el mundo real.
DATA ENGINEERING
Acerca del curso
En este curso aprenderás los conceptos y prácticas del
manejo de grandes cantidades de datos a través de
procesos de extracción, transformación y carga (ETL).
A su vez, aprenderás a diseñar y administrar una
arquitectura de Data Warehousing aplicando las
tecnologías que se usan hoy en día en el mercado.
Implementarás procesos de manejo de datos utilizando el
lenguaje Python, haciendo uso de librerías como Pandas.
Utilizarás dialectos de SQL con bases de datos Amazon
Redshift. Al finalizar este curso, estarás capacitado para
administrar, mantener y realizar optimizaciones a
infraestructuras de datos modernas.
Perfil profesional
Al finalizar el curso de Data Engineering podrás:
✔ Comprender los conceptos y desafíos del ecosistema
del Big Data
✔ Diseñar e implementar soluciones a problemas de
administración de grandes cantidades de datos
✔ Programar procesos ETL para la extracción,
transformación y carga de datos para su posterior
procesamiento de analítica.
✔ Administrar un data warehouse
PROGRAMA DEL CURSO 03
DATA ENGINEERING
Características generales
Modalidad Curso Flex
✓ 1 clase en vivo semanal de 2 horas
✓ Más de 10 horas de contenidos audiovisuales on-demand,
disponibles en nuestra plataforma para acceder en cualquier
momento (videos, infografías, actividades gamificadas y desafíos)
Haz click aquí para conocer más acerca de CoderFlex
Nivel Duración
11 semanas + Semana 0
Avanzado
Pre-requisitos
Requerimientos técnicos
Para mejorar tu experiencia de cursada, te aconsejamos:
- Tener una PC o laptop con 8 GB de memoria RAM y
procesador de 4 núcleos.
- Sistema operativo: macOS Sierra/superior o Windows
7/superior.
PROGRAMA DEL CURSO 05
DATA ENGINEERING
Pre-requisitos
Conocimientos previos
✓ Manejo intermedio de SQL y análisis de datos.
Recomendamos ampliamente haber tomado el curso
"Data Analytics" de Coderhouse. Conocimientos de
bases de datos relacionales. En específico es
conveniente contar con los siguientes conocimientos:
● Saber qué es una clave primaria y una clave
foránea.
● Conocer el concepto de normalización y
preferentemente haber normalizado una base de
datos.
● Saber realizar consultas a una tabla, agrupar
resultados, utilizar funciones de agregación,
realizar JOINs, crear nuevas tablas, insertar, borrar
y actualizar registros.
● Instrucciones a conocer: JOINS, GROUP BY,
HAVING, INSERT, UPDATE, DELETE, CREATE.
✓ Manejo intermedio de Python. Recomendamos
ampliamente haber tomado el curso de "Python" en
Coderhouse. En especìfico es conveniente contar con
los siguientes conocimientos:
● Saber ejecutar scripts en Python, manejar
variables numéricas, strings, listas/arrays,
diccionarios y saber escribir y ejecutar funciones.
● A su vez conocer lo que es una API y haber usado
alguna para extraer datos de un sitio. maneja listas,
diccionarios, JSON. Preferentemente sabe cómo
consultar una API y extraer información de la
misma.
PROGRAMA DEL CURSO 05
DATA ENGINEERING
Metodología Curso Flex
La experiencia de aprender combinando encuentros prácticos y en
vivo con material teórico y práctico offline, pensado para que puedas
adaptar el proceso de aprendizaje a tu vida.
Contenido Audiovisual (On demand)
Este material, compuesto por videos, podcast, desafíos y
actividades interactivas, se encuentra disponible de
manera asincrónica (puedes acceder a cualquier hora y
las veces que quieras). Te sugerimos visualizarlo y realizar
las actividades cada semana antes de la clase en vivo.
Clases en vivo
Tendrás una clase en vivo semanal de dos horas. En este
encuentro de carácter práctico se profundizará el
contenido teórico con ejemplos, buenas prácticas e
instancias de intercambio colaborativo. El objetivo es
consolidar los conocimientos adquiridos y aplicarlos en la
elaboración de un proyecto integrador final.
Proyecto final
Durante tu recorrido aprenderás a partir de la elaboración
progresiva de un proyecto mediante entregas parciales y
una entrega final de carácter integrador.
PROGRAMA DEL CURSO 06
DATA ENGINEERING
Te presentamos el recorrido dividido en módulos:
00
Contenido nivelatorio
(Opcional)
✔ Uso de terminal unix
✔ Conceptos básicos de
arquitectura de una
computadora
✔ Ejercicios Python y SQL
01
Introducción a Data
Engineering
✔ Big Data y los problemas de
hoy
✔ Cómo trabaja un DE con un
Data Analyst y un Data
Scientist
✔ Conceptos base del mundo
de DE
✔ Review de una arquitectura
de datos base
02
Data Warehouse
✔ Bases de datos OLAP
✔ MPP, Clustering y Map
Reduce
✔ Amazon Redshift
✔ Apache Parquet
PROGRAMA DEL CURSO 07
DATA ENGINEERING
Te presentamos el recorrido dividido en módulos:
03
ETLs
✔ Pandas Dataframes
✔ Transformación de un
dataframe (de-duplicación,
merge, apply, etc)
04
Seguridad y Backup
de BD
✔ Conceptos de seguridad en
bases de datos
✔ Seguridad en Amazon
Redshift
✔ Backups manuales a S3
05
Docker
✔ Containerización y
Máquinas virtuales
✔ Dockerfiles, Docker images
✔ Práctica con Docker
PROGRAMA DEL CURSO 08
DATA ENGINEERING
06
Apache Airflow
✔ Introducción
✔ Arquitectura de los
procesos de Airflow
✔ DAGs, Tasks, Operators
✔ Conceptos avanzados:
sensores, subdags, XCOMs
07
Stream Processing
✔ Introducción
✔ PubSub
✔ Introducción teórica de
Apache Kafka
✔ Práctica con AWS Kinesis
PROGRAMA DEL CURSO 09
www.coderhouse.com
Coderhouse se reserva el derecho de modificar este programa, o cualquiera de los componentes
del curso, cuando lo considere necesario a fin de generar mejoras o actualizaciones.