EL PROCESO DE ETL
ÍNDICE
0. PRÓLOGO 5
1. EL PROCESO DE ETL (EXTRACT, TRANSFORM AND LOAD) 6
1.1 DEFINICIÓN 6
1.2 HERRAMIENTAS ETL 11
1.2.1 PROCESAMIENTO EN HERRAMIENTAS ETL 18
1.3 RETOS EN LOS PROCESOS Y HERRAMIENTAS ETL 19
1.4 ETL EN CONTEXTO PENTAHO 20
1.4.1 CARGA DE LOS DATOS (LOAD DATA) 24
1.4.2 CALIDAD DE LOS DATOS (DATA QUALITY) 27
1.4.3 LIMPIEZA DE LOS DATOS (DATA CLEANING) 29
2. INTEGRACIÓN DE DATOS 38
2.1 TÉCNICAS DE INTEGRACIÓN DE DATOS 39
2.2 TECNOLOGÍAS DE INTEGRACIÓN DE DATOS 41
2.3 USOS DE LA INTEGRACIÓN DE DATOS 43
3. IMPLEMENTAR UN PROCESO ETL 44
3.1 ANÁLISIS DEL PROCESO DE CARGA 44
3.2 TRANSFORMACIONES 48
3.3 TRABAJOS 52
3.4 EVALUACIÓN 52
Y
Página 2
EL PROCESO DE ETL
3.5 CREACIÓN DE DASHBOARDS 54
4. ANEXOS 73
4.1 CREACIÓN DE UN DASHBOARD 73
4.1.1 CREACIÓN DE UN DASHBOARD EN GOOGLE ANALYTICS 73
4.1.2 CREACIÓN DE UN DASHBOARD EN EXCEL 2010 73
4.2 EJECUCIÓN DE TRANSFORMACIONES Y TRABAJOS 74
4.2.1 GUÍA DE COMPONENTES PENTAHO 74
4.2.2 EJECUTAR UNA TRANSFORMACIÓN O TRABAJO 74
4.2.3 TRANSFORMACIÓN GRÁFICA ETL CON SPOON 74
4.2.4 ETL: EJEMPLO PRÁCTICO DE TRANSFORMACIÓN DE DATOS USANDO
KETTLE 75
4.3 ENLACES DE INTERÉS 88
4.3.1 MANUAL DE PENTAHO 88
4.3.2 JSON 88
4.3.3 API DE TWITTER 88
4.3.4 API DE FACEBOOK 88
4.3.5 API YAHOO 89
4.3.6 DESARROLLADOR DE FACEBOOK 89
4.3.7 TWITTER APPS 89
Y
Página 3
EL PROCESO DE ETL
5. BIBLIOGRAFÍA 90
5.1 LIBROS 90
5.2 WEBS 90
Y
Página 4