BASE DE DATOS ESTRATGICAS
LABORATORIO DISEO DEL DATAWAREHOUSE POBLAMIENTO DEL DATAWAREHOUSE MEDIANTE TRANSACT-SQL
Contenido 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. La informacin estratgica en una organizacin Data warehouse Datawarehouse(OLAP) vs. Bd transaccional(OLTP) Estructura de la bd multidimensional Diseo del almacn de datos Caso de ejemplo Base de datos multidimensional northwind_mart Poblamiento sin verificar los datos en el destino Poblamiento verificando los datos en el destino Generacin de vistas para el poblamiento de dimensiones Script de poblamiento de la dimensin de tiempo Script de poblamiento de la tabla de hechos
2009 - II
LA INFORMACIN ESTRATGICA EN UNA ORGANIZACIN La administracin de la informacin planea, organiza, dirige y controla efectivamente a los datos como un recurso global de la empresa. Beneficios: Apoyar las estrategias y la operacin del negocio con informacin oportuna, relevante y de calidad. Mejoras en la integracin de los datos, para apoyar mejor a la organizacin. Mejor atencin al usuario, al mejorar la productividad del desarrollo de sistemas de informacin. Incremento en la calidad, la consistencia y el conocimiento de los datos DATA WAREHOUSE sistema construido para soportar decisiones que utiliza un almacenamiento de datos separado de los sistemas operacionales, aunque stos lo alimentan. Data Mart: Datawarehouse a baja escala, que apoya a un rea particular, y no a la empresa completa
S i s te m a s d e G ER E N C I A Sistemas de Soporte informacin EIS DSS de Decisin Ejecutivo
Informacin estratgica
Base de Datos Estratgicas (DataWarehouse)
Informacin operativa
RECURSOS HUMANOS PRODUCCION VENTAS
FINANZAS
BD para el procesamiento de transacciones
OPERACIONES
DATAWAREHOUSE(OLAP) VS. BD TRANSACCIONAL(OLTP ) Caractersticas Tamao Fuente Actualizacin Tiempo Carga Actividades Procesamiento Estructura OLTP Megabytes Internas Transacciones Actual Predecible Operacional Pocos registros Relacional Gigabytes Internas y Externas Batch Histrico Ad-hoc Analtica Masivo y complejo Multidimensional OLAP
ESTRUCTURA DE LA BD MULTIDIMENSIONAL Tabla de Hechos : Almacena las medidas numricas del negocio. cada medida es el conjunto de valores cuantitativos de una columna de la tabla de hechos y representa la interseccin de las dimensiones. Tabla de dimensiones : Almacena la descripcin textual y cualitativa de las dimensiones. Mejores atributos: textuales, discretos y son fuente para restricciones y encabezados
Tabla de dimensin
Tabla de hechos
Tabla de dimensin
Atributos
(caracteristicas)
Medidas
(cantidades)
Atributos
(caracteristicas)
Joins Mltiples
DISEO DEL ALMACN DE DATOS Modelamiento Escoger el proceso del negocio a modelar. Escoger el granulo (tamao) para determinar el nivel de detalle de representacin del proceso Escoger las dimensiones que caracterizarn el proceso Escoger los hechos medidos que almacenaran la informacin del proceso
z z
Recoleccin y anlisis de requerimientos
Fuentes de datos necesarias internas y externas Requisitos de usuario
Diseo conceptual
Medidas y atributos
z z
Diseo lgico especfico
Esquema Estrella o Copo de Nieve
Diseo fsico
Estructura Multidimensional
Implementacin
Preparacin de las vistas de usuario (herramienta OLAP)
CASO DE EJEMPLO DESCRIPCIN DE LA EMPRESA La base de datos relacional contiene informacin de las ventas de la corporacin NorthWindTraders, que importa y exporta artculos alrededor del mundo La Base de Datos NorthWind soporta el sistema de ordenes de pedido que contiene las siguientes Tablas:
El Administrador de NorthWind desea incrementar su habilidad para analizar datos enfocando las tendencias que le permitan tomar decisiones sobre las ventas del negocio
Paso 1. Elegir un proceso de la organizacin para modelar La actividad a modelar son las ventas desde que el cliente solicitud los productos hasta que el empleado enva el pedido. Paso 2. Decidir el nivel de detalle Se requiere tener informacin sobre las ventas de cada producto a los respectivos clientes por periodos de tiempo, adems se necesita saber que empleado atendi la venta y como se envi. Paso 3. Identificar las dimensiones que caracterizan el proceso. Tiempo cundo se produce la venta? (dia, mes, trimestre, semestre, ao) Producto cul es el producto vendido? (nombre, categora, proveedor) Envo Cmo se realizo el envo? (nombre) Cliente Quin compr? Empleado Quin atendi la venta? (nombre y apellido, fecha de contratacin) Paso 4. Decidir la informacin estrategica a analizar del proceso. Cantidad de productos vendidos Descuentos otorgados Importe Total de la venta (lnea total del tem) Costo del flete por enviar el producto al cliente Algunas de la medidas son datos precalculados y que se realizaran al momento de hacer la transformacin de los datos por ejemplo:
DIMENSIN CLIENTE
DIMENSION TRANSPORTISTA
DIMENSIN EMPLEADO
DIMENSION PRODUCTO
DIMENSION TIEMPO
TABLA DE HECHOS
BASE DE DATOS MULTIDIMENSIONAL NORTHWIND_MART
POBLAMIENTO SIN VERIFICAR LOS DATOS EN EL DESTINO
POBLAMIENTO VERIFICANDO LOS DATOS EN EL DESTINO METODO DE LIMPIEZA TOTAL
METODO INCREMENTAL
GENERACIN DE VISTAS PARA EL POBLAMIENTO DE DIMENSIONES
SCRIPT DE POBLAMIENTO DE LA DIMENSION DE TIEMPO
10
SCRIPT DE POBLAMIENTO DE LA TABLA DE HECHOS
REFERENCIAS Libros en pantalla de SQL Server 2008 http://msdn.microsoft.com/es-es/library/ms130214.aspx
11