0% encontró este documento útil (0 votos)
21 vistas10 páginas

SC602 ProyectoFinal

El proyecto final consiste en desarrollar un Data Warehouse funcional que integre diversas fuentes de datos y satisfaga necesidades empresariales específicas, utilizando herramientas como Pentaho, MS SQL Server y PowerBI. Se estructurará en tres fases: análisis y diseño, implementación inicial, y entrega final con defensa pública, documentándose en un informe IEEE. La evaluación se centrará en el diseño del Data Warehouse, conexiones de datos, aplicación de conocimientos y calidad de la documentación presentada.

Cargado por

quesadaisaac0802
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
21 vistas10 páginas

SC602 ProyectoFinal

El proyecto final consiste en desarrollar un Data Warehouse funcional que integre diversas fuentes de datos y satisfaga necesidades empresariales específicas, utilizando herramientas como Pentaho, MS SQL Server y PowerBI. Se estructurará en tres fases: análisis y diseño, implementación inicial, y entrega final con defensa pública, documentándose en un informe IEEE. La evaluación se centrará en el diseño del Data Warehouse, conexiones de datos, aplicación de conocimientos y calidad de la documentación presentada.

Cargado por

quesadaisaac0802
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Nombre de la

Proyecto Final
evaluación
Valor porcentual Categoría Fecha de entrega

50% Grupal (4 Integrantes) A lo largo del cuatrimestre

Objetivo
Desarrollar un Data Warehouse funcional que satisfaga una necesidad empresarial específica.

Descripción General del Proyecto

El proyecto debe incluir la integración de diversas fuentes de datos, el análisis de los requisitos del
negocio, y la implementación de conexiones y representaciones eficientes de los datos. Además, el
proyecto deberá documentarse en un informe de investigación bajo el formato IEEE, donde se
detallen las fases del desarrollo, las decisiones de diseño, las herramientas utilizadas, y las
conclusiones obtenidas.

• Herramientas para utilizar: Pentaho, MS SQL Server y PowerBI.


• Formato del Documento Final: Informe de investigación en formato IEEE.
• Fases del Proyecto:
• Avance 1 (Semana 5):
❖ Análisis del problema a resolver y diseño del Data Warehouse.
❖ Definición de las fuentes de datos y requerimientos de negocio.
❖ Planificación del desarrollo del proyecto.
• Avance 2 (Semana 10):
❖ Implementación inicial del Data Warehouse, incluyendo las conexiones y
elementos necesarios para la extracción y carga de datos.
❖ Pruebas de carga y verificación del modelo dimensional.
• Entrega y Defensa Final (Semana 14):
❖ Presentación del 100% del proyecto completo y funcionando.
❖ Defensa pública, en la que se demostrará el uso del Data Warehouse con
consultas y análisis utilizando PowerBI.
❖ Artículo final en formato IEEE detallando todos los aspectos del proyecto.

Aspectos Clave Para Evaluar

1. Diseño del Data Warehouse:


• Correcta identificación de las fuentes de datos.
• Modelado de dimensiones y hechos, aplicando el esquema estrella.
• Eficiencia y funcionalidad del Data Warehouse.

2
2. Conexiones y Representación de Datos:
• Implementación efectiva de conexiones entre las fuentes de datos y el Data
Warehouse.
• Visualización adecuada de los datos mediante PowerBI.

3. Aplicación de Conocimientos:
• Capacidad para aplicar principios vistos en clase (modelado dimensional, OLAP,
minería de datos).
• Incorporación de estándares emergentes y buenas prácticas en el desarrollo del
proyecto.

4. Documentación y Presentación:
• Elaboración de un artículo en formato IEEE que recoja los hallazgos y análisis del
proyecto.
• Organización, claridad y coherencia en la presentación y defensa del proyecto.

Detalles del Proyecto

1. Componentes Mínimos del Data Warehouse

• Fuentes de Datos:
• El proyecto debe integrar al menos cinco fuentes de datos distintas, que pueden
incluir:
❖ Sistemas operacionales (ej. CRM, ERP).
❖ Bases de datos transaccionales.
❖ Archivos planos (CSV, Excel).
❖ Servicios web o APIs.
❖ Datos externos (mercado, competidores).
• Las fuentes deben representar diferentes áreas del negocio como ventas, inventario,
finanzas, clientes y proveedores.

• Modelado Dimensional:
• Se debe utilizar un esquema estrella o copo de nieve con:
❖ Dos tablas de hechos, una para capturar transacciones históricas y otra
para datos operativos actuales.
❖ Cinco tablas de dimensiones mínimas, que incluyan: Dimensión de
Tiempo, Dimensión de Producto, Dimensión de Cliente, Dimensión de
Región o Ubicación, Dimensión de Proveedor o Vendedor.
❖ Cada tabla de dimensiones debe estar bien normalizada, con claves
surrogadas y atributos detallados para mejorar la granularidad de los datos.

• Procesos de ETL (Extracción, Transformación y Carga):


• El proyecto debe incluir seis procesos ETL en Pentaho:
❖ Extracción de datos desde cada fuente de datos (un proceso ETL por
3
fuente).
❖ Transformación de datos que incluya la limpieza, consolidación y
conversión de datos entre diferentes formatos y sistemas.
❖ Carga en las tablas de dimensiones.
❖ Carga en las tablas de hechos (fact table) con actualizaciones
incrementales.
❖ Proceso de validación de datos para garantizar la calidad e integridad de
los datos cargados.
❖ Proceso de actualización automática para la actualización periódica de
los datos del Data Warehouse sin necesidad de recargar toda la
información.

• Metadatos:
• Implementación de un sistema de metadatos avanzado que incluya:
❖ Información de auditoría (quién cargó los datos, cuándo, y de qué fuente
provienen).
❖ Versionamiento de los datos.

• Cubos OLAP (Online Analytical Processing):


• Construcción de al menos dos cubos OLAP para análisis multidimensional de los
datos:
❖ Un cubo para análisis de ventas (con dimensiones de tiempo, producto,
cliente, región).
❖ Un cubo para análisis financiero (ingresos, costos, márgenes de beneficio
por período).
• Estos cubos permitirán consultas rápidas y análisis de grandes volúmenes de datos,
facilitando la toma de decisiones.

• Automatización del Proceso ETL:


• Implementación de un sistema de automatización que permita la ejecución
programada de los procesos ETL, asegurando que los datos en el Data Warehouse
se actualicen automáticamente.

2. Reportes Para Desarrollar en PowerBI:

Los estudiantes deben desarrollar al menos cuatro reportes distintos en PowerBI, cubriendo las
siguientes áreas:

1. Reporte de Ventas por Producto y Cliente: Con gráficos que muestren ventas totales por
categorías de producto y cliente, con filtros de tiempo.
2. Reporte de Inventario y Stock: Incluyendo alertas automáticas de productos con bajo
inventario y una visualización de los movimientos de stock.
3. Reporte Financiero: Ingresos, egresos, utilidades netas y comparación de periodos

4
históricos.
4. Reporte de Análisis Regional: Ventas, costos y márgenes de ganancia segmentados por
región.

El documento IEEE que los estudiantes deben entregar debe cumplir con los siguientes
elementos:

1. Portada: Debe incluir el título del proyecto, nombres de los integrantes del grupo, nombre de la
universidad, curso y fecha de entrega.
2. Introducción: Breve descripción del proyecto, el contexto empresarial y la necesidad del Data
Warehouse. Explicación del propósito del trabajo y una visión general de los problemas
abordados.
3. Palabras Clave: Lista de términos relevantes (e.g., Data Warehouse, ETL, OLAP, PowerBI,
Pentaho, MS SQL Server).
4. Justificación:
• Explicación de la importancia del proyecto y su relevancia para la organización o
contexto empresarial.
• Por qué es necesario implementar el Data Warehouse y los beneficios que
proporcionará a la empresa o institución.
5. Antecedentes del Problema de Investigación:
• Contexto detallado de los problemas existentes con el manejo de datos, informes
fragmentados, decisiones mal informadas, o fuentes de datos no centralizadas.
6. Objetivo General y Específicos.
7. Requerimientos Específicos y Características de la Solución Planteadas:
• Requerimientos Funcionales: Descripción de los requerimientos técnicos, como el
número de fuentes de datos, tipo de consultas a realizar, y los componentes ETL.
• Características Técnicas: Especificaciones de las herramientas a utilizar (Pentaho, MS
SQL Server, PowerBI), los modelos de seguridad de datos, y las tecnologías para el
almacenamiento y procesamiento de datos.
8. Diagramas de Entidad-Relación del Modelado Dimensional:
• Representación visual de las tablas de hechos y dimensiones.
• Diagrama detallado del esquema estrella o copo de nieve utilizado.
• Explicación de la estructura de las relaciones entre las tablas.
9. Definición de las Fuentes de Datos:
• Descripción de las cinco fuentes de datos seleccionadas, su formato original (archivos
planos, bases de datos, APIs) y la relevancia de cada una para el análisis.
• Procesos necesarios para la extracción y transformación de los datos desde estas
fuentes hacia el Data Warehouse.
10. Procesos y Justificación de las Decisiones Técnicas:
• ETL: Explicación de los seis procesos ETL implementados en Pentaho, describiendo
cada fase de extracción, transformación, y carga.
• Cubos OLAP y Consultas SQL: Descripción de los cubos OLAP implementados y su
5
utilidad para el análisis multidimensional.
• Reportes en PowerBI: Explicación de los cuatro reportes generados, su propósito y los
tipos de análisis que facilitan.
• Justificación de las decisiones técnicas, como la elección del modelo dimensional, la
selección de herramientas y las medidas tomadas para optimizar el rendimiento.
11. Resultados Obtenidos y Conclusiones o Comentarios:
• Análisis de los resultados, tanto en términos de rendimiento del Data Warehouse como en
la calidad y utilidad de los informes generados.
• Comentarios sobre la efectividad de los procesos ETL y la satisfacción de los
requerimientos planteados inicialmente.

12. Referencias Bibliográficas.

Nombre de la Primer Avance


6
evaluación
Valor porcentual Categoría Fecha de entrega

5% Grupal (4 Integrantes) Semana 05

Instrucciones

Los estudiantes deben entregar la primera parte del Informe de Investigación, se deben incluir los
siguientes puntos:

1. Portada
2. Introducción
3. Palabras Clave
4. Justificación
5. Antecedentes del Problema de Investigación
6. Objetivo General y Específicos
7. Requerimientos Específicos y Características de la Solución Planteadas
8. Diagramas de Entidad-Relación del Modelado Dimensional
9. Definición de las Fuentes de Datos
10. Referencias Bibliográficas (Debe existir en todas las etapas del proyecto)

Se debe utilizar el formato IEEE para elaborar el Informe de Investigación.

Cada grupo debe entregar únicamente de manera digital mediante el Campus Virtual UN ÚNICO
DOCUMENTO en formato PDF el cual debe tener por nombre en el archivo el siguiente formato:
GX_SC602_MN_Avance1

7
Nombre de la
Segundo Avance
evaluación
Valor porcentual Categoría Fecha de entrega

15% Grupal (4 Integrantes) Semana 10

Instrucciones

Los estudiantes deben entregar la segunda parte del Informe de Investigación, se deben incluir
los siguientes puntos:

1. Todo lo elaborado en el primer avance


2. Procesos y Justificación de las Decisiones Técnicas
3. Referencias Bibliográficas (Debe existir en todas las etapas del proyecto)

Se debe utilizar el formato IEEE para elaborar el Informe de Investigación.

Adicional, se debe presentar un avance del desarrollo del Data Warehouse, que incluya:

1. Implementación inicial del Data Warehouse, incluyendo las conexiones y elementos necesarios
para la extracción y carga de datos:
• Diseño del Data Warehouse
• Fuentes de Datos
• Modelado Dimensional
• Avance de los Procesos ETL
• Avance de los Metadatos.

2. Pruebas de carga y verificación del modelo dimensional.

Cada grupo debe entregar únicamente de manera digital mediante el Campus Virtual DOS
ARCHIVOS; uno en formato PDF (informe) el cual debe tener por nombre en el archivo el siguiente
formato: GX_SC602_MN_Avance2 y otro archivo comprimido que incluya los archivos generados
de Pentaho, .SQL como evidencia del avance del desarrollo.

8
Nombre de la
Entrega Final y Defensa
evaluación
Valor porcentual Categoría Fecha de entrega

30% Grupal (4 Integrantes) Semana 14

Instrucciones

Los estudiantes deben entregar la segunda parte del Informe de Investigación, se deben incluir
los siguientes puntos:

1. Todo lo elaborado en el primer y segundo avance


2. Resultados Obtenidos y Conclusiones o Comentarios
3. Referencias Bibliográficas (Debe existir en todas las etapas del proyecto)

Se debe utilizar el formato IEEE para elaborar el Informe de Investigación.

Adicional, se debe presentar un el desarrollo del Data Warehouse completado, que incluya:

1. Implementación inicial del Data Warehouse, incluyendo las conexiones y elementos necesarios
para la extracción y carga de datos:
• Procesos ETL completos
• Metadatos completos
• Cubos OLAP
• Automatización de Procesos ETL
• Reportes Desarrollados en PowerBI

Consideraciones para la Defensa Final

• Durante la defensa del proyecto, los(as) integrantes del grupo deben activar sus cámaras y
micrófonos, si su computadora tiene problemas con algunos de estos periféricos entonces
deberá usar la del celular, tableta o cualquier dispositivo que se lo permita (Teams facilita
tener varias sesiones abiertas de un mismo usuario desde diferentes dispositivos), al
finalizar su presentación podrán apagarlos.
• Debe presentarse con atuendo de negocio (formal / ejecutivo).
• Cada grupo cuenta con 15 min. para hacer su presentación.
• Cualquier configuración que necesite para ejecutar de manera correcta el proyecto debe
estar lista para el momento de la presentación, es responsabilidad del grupo tener medidas
por si la base de datos, el sistema o algún componente no funciona ya que no se darán
prórrogas más allá del día de la defensa.
• Todos deben tener en sus computadoras el proyecto funcionando por si al compañero(a)
9
encargado(a) de compartir la pantalla le sucede algún imprevisto como fallo de ejecución,
fallas en el servicio eléctrico o bien que no se presentará a la defensa.
• El grupo que termine de presentar debe permanecer en la sesión o aula por respeto a las
exposiciones de los demás equipos.
• Solo tendrán el puntaje respectivo los miembros del grupo que estén presentes.
• El docente hará las preguntas necesarias a nivel técnico para validar que el proyecto cumple
con lo requerido y que cada miembro conoce el sistema a detalle.
• El proyecto debe estar terminado y funcionando, si se detecta que está incompleto y tiene
muchos errores y excepciones durante la defensa el/la docente podrá dar por finalizada la
exposición y pasar con el siguiente grupo, recuerden que este es un curso sin exámenes por
lo tanto hay tiempo suficiente para terminar el proyecto.
• No hay que exponer presentación de PowerPoint ni documento Word durante la defensa,
debe ser el proyecto como tal.

Cada grupo debe entregar únicamente de manera digital mediante el Campus Virtual DOS
ARCHIVOS; uno en formato PDF (informe final) el cual debe tener por nombre en el archivo el
siguiente formato: GX_SC602_MN_InformeFinal y otro archivo comprimido que incluya los archivos
generados de Pentaho, .SQL como evidencia del avance del desarrollo.

10

También podría gustarte