0% encontró este documento útil (0 votos)
108 vistas11 páginas

Diseño y Poblamiento de Data Warehouse

Este documento describe el diseño e implementación de una base de datos estratégica (data warehouse) para la empresa Northwind Traders utilizando SQL Server. Se explica el proceso de diseño del almacén de datos, incluyendo la selección del proceso empresarial a modelar, las dimensiones y medidas clave. Luego, se muestra el esquema multidimensional resultante con tablas de dimensión para cliente, producto, tiempo, entre otras, y una tabla de hechos. Finalmente, se explican scripts para poblar las dimensiones y tabla de hechos desde las tabl

Cargado por

Diego Rod
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
108 vistas11 páginas

Diseño y Poblamiento de Data Warehouse

Este documento describe el diseño e implementación de una base de datos estratégica (data warehouse) para la empresa Northwind Traders utilizando SQL Server. Se explica el proceso de diseño del almacén de datos, incluyendo la selección del proceso empresarial a modelar, las dimensiones y medidas clave. Luego, se muestra el esquema multidimensional resultante con tablas de dimensión para cliente, producto, tiempo, entre otras, y una tabla de hechos. Finalmente, se explican scripts para poblar las dimensiones y tabla de hechos desde las tabl

Cargado por

Diego Rod
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

BASE DE DATOS ESTRATGICAS

LABORATORIO DISEO DEL DATAWAREHOUSE POBLAMIENTO DEL DATAWAREHOUSE MEDIANTE TRANSACT-SQL


Contenido 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. La informacin estratgica en una organizacin Data warehouse Datawarehouse(OLAP) vs. Bd transaccional(OLTP) Estructura de la bd multidimensional Diseo del almacn de datos Caso de ejemplo Base de datos multidimensional northwind_mart Poblamiento sin verificar los datos en el destino Poblamiento verificando los datos en el destino Generacin de vistas para el poblamiento de dimensiones Script de poblamiento de la dimensin de tiempo Script de poblamiento de la tabla de hechos

Ing. Heber Abanto Cabrera [email protected]

2009 - II

LA INFORMACIN ESTRATGICA EN UNA ORGANIZACIN La administracin de la informacin planea, organiza, dirige y controla efectivamente a los datos como un recurso global de la empresa. Beneficios: Apoyar las estrategias y la operacin del negocio con informacin oportuna, relevante y de calidad. Mejoras en la integracin de los datos, para apoyar mejor a la organizacin. Mejor atencin al usuario, al mejorar la productividad del desarrollo de sistemas de informacin. Incremento en la calidad, la consistencia y el conocimiento de los datos DATA WAREHOUSE sistema construido para soportar decisiones que utiliza un almacenamiento de datos separado de los sistemas operacionales, aunque stos lo alimentan. Data Mart: Datawarehouse a baja escala, que apoya a un rea particular, y no a la empresa completa

S i s te m a s d e G ER E N C I A Sistemas de Soporte informacin EIS DSS de Decisin Ejecutivo


Informacin estratgica

Base de Datos Estratgicas (DataWarehouse)

Informacin operativa
RECURSOS HUMANOS PRODUCCION VENTAS

FINANZAS

BD para el procesamiento de transacciones

OPERACIONES

DATAWAREHOUSE(OLAP) VS. BD TRANSACCIONAL(OLTP ) Caractersticas Tamao Fuente Actualizacin Tiempo Carga Actividades Procesamiento Estructura OLTP Megabytes Internas Transacciones Actual Predecible Operacional Pocos registros Relacional Gigabytes Internas y Externas Batch Histrico Ad-hoc Analtica Masivo y complejo Multidimensional OLAP

ESTRUCTURA DE LA BD MULTIDIMENSIONAL Tabla de Hechos : Almacena las medidas numricas del negocio. cada medida es el conjunto de valores cuantitativos de una columna de la tabla de hechos y representa la interseccin de las dimensiones. Tabla de dimensiones : Almacena la descripcin textual y cualitativa de las dimensiones. Mejores atributos: textuales, discretos y son fuente para restricciones y encabezados

Tabla de dimensin

Tabla de hechos

Tabla de dimensin

Atributos
(caracteristicas)

Medidas
(cantidades)

Atributos
(caracteristicas)

Joins Mltiples

DISEO DEL ALMACN DE DATOS Modelamiento Escoger el proceso del negocio a modelar. Escoger el granulo (tamao) para determinar el nivel de detalle de representacin del proceso Escoger las dimensiones que caracterizarn el proceso Escoger los hechos medidos que almacenaran la informacin del proceso

z z

Recoleccin y anlisis de requerimientos

Fuentes de datos necesarias internas y externas Requisitos de usuario

Diseo conceptual

Medidas y atributos

z z

Diseo lgico especfico

Esquema Estrella o Copo de Nieve

Diseo fsico

Estructura Multidimensional

Implementacin

Preparacin de las vistas de usuario (herramienta OLAP)

CASO DE EJEMPLO DESCRIPCIN DE LA EMPRESA La base de datos relacional contiene informacin de las ventas de la corporacin NorthWindTraders, que importa y exporta artculos alrededor del mundo La Base de Datos NorthWind soporta el sistema de ordenes de pedido que contiene las siguientes Tablas:

El Administrador de NorthWind desea incrementar su habilidad para analizar datos enfocando las tendencias que le permitan tomar decisiones sobre las ventas del negocio

Paso 1. Elegir un proceso de la organizacin para modelar La actividad a modelar son las ventas desde que el cliente solicitud los productos hasta que el empleado enva el pedido. Paso 2. Decidir el nivel de detalle Se requiere tener informacin sobre las ventas de cada producto a los respectivos clientes por periodos de tiempo, adems se necesita saber que empleado atendi la venta y como se envi. Paso 3. Identificar las dimensiones que caracterizan el proceso. Tiempo cundo se produce la venta? (dia, mes, trimestre, semestre, ao) Producto cul es el producto vendido? (nombre, categora, proveedor) Envo Cmo se realizo el envo? (nombre) Cliente Quin compr? Empleado Quin atendi la venta? (nombre y apellido, fecha de contratacin) Paso 4. Decidir la informacin estrategica a analizar del proceso. Cantidad de productos vendidos Descuentos otorgados Importe Total de la venta (lnea total del tem) Costo del flete por enviar el producto al cliente Algunas de la medidas son datos precalculados y que se realizaran al momento de hacer la transformacin de los datos por ejemplo:

DIMENSIN CLIENTE

DIMENSION TRANSPORTISTA

DIMENSIN EMPLEADO

DIMENSION PRODUCTO

DIMENSION TIEMPO

TABLA DE HECHOS

BASE DE DATOS MULTIDIMENSIONAL NORTHWIND_MART

POBLAMIENTO SIN VERIFICAR LOS DATOS EN EL DESTINO

POBLAMIENTO VERIFICANDO LOS DATOS EN EL DESTINO METODO DE LIMPIEZA TOTAL

METODO INCREMENTAL

GENERACIN DE VISTAS PARA EL POBLAMIENTO DE DIMENSIONES

SCRIPT DE POBLAMIENTO DE LA DIMENSION DE TIEMPO

10

SCRIPT DE POBLAMIENTO DE LA TABLA DE HECHOS

REFERENCIAS Libros en pantalla de SQL Server 2008 http://msdn.microsoft.com/es-es/library/ms130214.aspx

11

También podría gustarte