Tópicos Avanzados II
Magistral IX
Introducción al Modelamiento
Multidimensional.
Ing. Victoria Guerrero
Tópicos Avanzados II
Contenido
• Introducción
• Introducción a OLAP
• Diagramas Multidimensionales
Ing. Victoria Guerrero
Tópicos Avanzados II
Introducción
La definición de bases de datos multidimensionales viene marcada por la forma en la que guardan y procesan la información. Al igual
que las bases de datos relacionales, almacenan la información en tablas. Sin embargo, la diferencia radica en la estructura que forman
estas tablas, ya que en las bases multidimensionales los datos se ven como «cubos de información«.
Estos cubos de información añaden una nueva dimensión a las tradicionales bases de datos formadas por tablas. Los cubos están
formados por dos componentes:
• Tabla de dimensiones: aquí se almacenan datos como ítems (nombre del producto, marca, etc) o fechas
• Tabla de hechos: almacena las medidas y las claves que la relaciona con las tablas de dimensiones. Por ejemplo, tamaño en
centímetros o valor en euros.
Las bases de datos multidimensionales o MDB son ampliamente utilizadas en el entorno de los Data Warehouse y para aplicaciones
encargadas de realizar análisis de procesos en línea. También es habitual que este tipo de bases de datos se empleen usando la
información ya contenida en otras bases de datos relacionales.
Por otro lado, lo sistemas de gestión de bases de datos multidimensionales (MDDBMS) son capaces de procesar la información a gran
velocidad, lo que las convierte en una herramienta muy útil para entornos o aplicaciones que requieren obtener respuestas a las
consultas inmediatas o en tiempo real.
Ing. Victoria Guerrero
Tópicos Avanzados II
Introducción a OLAP
Características y aspectos a tener en cuenta
Las características de las bases de datos multidimensionales hacen que se diferencien de otros sistemas de almacenamiento.
Veamos cuáles son los principales aspectos a tener en cuenta en este tipo de databases.
OLAP
Las tablas de las bases de datos multidimensionales se organizan en forma de cubo, más en concreto se les denomina cubo
OLAP (On-Line Analytical Processing). En este tipo de estructura, cada dimensión del cubo equivale a un campo de dimensiones
en la tabla, mientas que la información almacenada en cada celda del cubo corresponde a los hechos.
Ing. Victoria Guerrero
Tópicos Avanzados II
Introducción a OLAP
Tablas
Las bases de datos multidimensionales también pueden verse como una sola tabla, pero tienen una peculiaridad. Y es que tienen
un campo o columna por cada dimensión, del mismo modo que también tiene un campo por cada hecho (métricas).
*Ejemplo: d1, d2, d3,…,m1, m2, m3…
*Donde «d» hace referencia a las dimensiones y «m» a las métricas o hechos que se almacenan.
De hechos
En una base de datos multidimensional están, por una parte, las tablas de hechos. Y es que este tipo de bases de datos se suelen
organizar en base a un tema: Ventas, Ganancias, Climatología, etc.
Dicho tema ha de estar representado en la tabla de hechos. Esta tabla contiene valores numéricos que van a permitir establecer
las relaciones entre las distintas dimensiones del cubo OLAP..
Aparte del nombre del hecho y un valor numérico para sus medidas, la tabla de hechos también incluye las claves que permitirán
relacionar los hechos con la tabla de dimensiones.
Ing. Victoria Guerrero
Tópicos Avanzados II
Introducción a OLAP
De dimensiones
Por otro lado, están las tablas de dimensiones, que representan aquello que se quiere almacenar respecto a un tema concreto.
En una misma base de datos multidimensional puede haber numerosas tablas de dimensiones asociadas entre sí.
Las tablas de dimensiones pueden ser generadas de forma automática, o creadas manualmente por los propios usuarios.
Asimismo, también existen claves naturales o subrogadas. Las claves naturales son aquellas que ya vienen predefinidas. Por su
parte, las claves subrogadas se definen de forma manual, son de tipo secuencial y no tienen ningún tipo de relación directa con
otros datos.
Ing. Victoria Guerrero
Tópicos Avanzados II
Introducción a OLAP
Medidas
En las tablas de hechos se almacenan las medidas de los datos. Estas medidas están formadas por dos componentes principales:
Una propiedad numérica, un valor, como puede ser el precio de venta de un producto.
Una fórmula, de forma que se puedan combinar distintos valores de medidas.
Se pueden distinguir entre tres tipos de medidas:
Medidas aditivas: pueden ser combinadas a lo largo de varias dimensiones. Por ejemplo, medir las ventas totales de un producto
a lo largo del tiempo.
Medidas semiaditivas: no está permitida su combinación a lo largo de una o varias dimensiones. Por ejemplo, hacer inventario
de productos presentes en el almacén. Sin embargo, no tendría ningún sentido sumar el stock total de un producto a través del
tiempo.
Medidas no aditivas: no es posible combinarlas en ninguna dimensión
Ing. Victoria Guerrero
Tópicos Avanzados II
Introducción a OLAP
Jerarquía
El concepto de jerarquía permite que la información se que almacena en las bases de datos multidimensionales se organice en
base a diferentes niveles de abstracción.
Nivel 1: Todos
Nivel 2: Continentes > Europa, Asia
Nivel 3: Países > Europa > Francia, Italia, España
Nivel 4: Ciudades > España > Madrid, Barcelona, Sevilla
Nivel 5: Oficinas > Madrid > Oficina 1, Oficina 2, Oficina 3
Ing. Victoria Guerrero
Tópicos Avanzados II
Introducción a OLAP
Ventajas y desventajas
La estructura multidimensional de estas bases de datos les confieren unas características especiales, lo que se traduce en una
serie de ventajas e inconvenientes.
Ventajas
Comenzamos por ver algunas de las principales ventajas de las bases de datos multidimensionales:
Son capaces de trabajar con datos con un alto nivel de abstracción.
Posibilitan la creación de numerosas relaciones entre diversas dimensiones y hechos
Son muy utilizadas en los Data Warehouse y en los procedimientos de aplicaciones analíticas gracias a la gran velocidad de
procesado de información y restitución de los datos.
Pueden trabajar con datos previamente almacenados en bases de datos relacionales simples.
Ing. Victoria Guerrero
Tópicos Avanzados II
Introducción a OLAP
Ventajas y desventajas
Ventajas
Comenzamos por ver algunas de las principales ventajas de las bases de datos multidimensionales:
Son capaces de trabajar con datos con un alto nivel de abstracción.
Posibilitan la creación de numerosas relaciones entre diversas dimensiones y hechos
Son muy utilizadas en los Data Warehouse y en los procedimientos de aplicaciones analíticas gracias a la gran velocidad de
procesado de información y restitución de los datos.
Pueden trabajar con datos previamente almacenados en bases de datos relacionales simples.
Desventajas
Por otra parte, una de las principales desventajas de las bases de datos multidimensionales es la dificultad para hacer cambios
en su estructura. Debido a su complejidad, cuando el usuario desea realizar modificaciones en la estructura de la base de datos,
debe diseñar un nuevo cubo OLAP, sin posibilidad de utilizar la estructura previamente diseñada.
Ing. Victoria Guerrero
Tópicos Avanzados II
Diagramas Multidimensionales
Estructura
Las estructura de una base de datos multidimensional puede ser de diferentes tipos. A continuación vemos algunos de los más
frecuentes.
Esquema de estrella
Es la estructura más empleada en las bases de datos multidimensionales. Está formada por los siguientes elementos:
Una tabla central o Fact Table donde se almacenan los datos no redundantes.
Una serie de tablas de dimensiones (una por cada dimensión).
Cada tabla de dimensiones está formada por un conjunto de atributos.
Estos atributos se pueden organizar de forma jerárquica o parcial.
Ing. Victoria Guerrero
Tópicos Avanzados II
Diagramas Multidimensionales
Esquema de copo de nieve
Es similar a la estructura anterior, con la salvedad de que algunas de las tablas que componen la base de datos están
normalizadas. Gracias a esta normalización se pueden generar tablas adicionales, con lo que la estructura resultante tiene una
forma parecida a un copo de nieve.
Las principales ventajas de este tipo de estructura respecto al esquema de estrella es que se reduce la redundancia y se ahorra
espacio de almacenamiento.
Esquema de constelación de hechos
Es una estructura formada por un conjunto de esquemas de estrella, esto es, múltiples tablas de hechos que se relacionan con
otras tablas de dimensiones.
Ing. Victoria Guerrero
Tópicos Avanzados II
Diagramas Multidimensionales
Relacional
Multidimensional
Organización de datos Celdas, dimensiones, Tablas
tablas de hechos
Nivel de datos Detallados y agregados Detallados
Operaciones Análisis Actualizaciones
Lenguaje para Querys MDX SQL
Uso de espacio en disco Bajo Grande
Rendimiento Bueno Débil
Flexibilidad Baja Alta
Tiempo de procesamiento Alto Bajo
Escalabilidad Baja Alta
Alcance del diseño Limitado Muy grande
Acceso a datos Soporta acceso directo Acceso indirecto
Ing. Victoria Guerrero
Tópicos Avanzados II
Diagramas Multidimensionales
En definitiva, una base de datos multidimensional es un sistema que permiten añadir nuevas dimensiones a las relaciones que
se establecen dentro de la base de datos, gracias a la creación de tablas de dimensiones que se asocian con tablas de hechos.
Gracias a ello son bases de datos muy empleadas en la analítica online y a la hora de trabajar con Data Warehouses. Entre sus
ventajas están su gran rendimiento y la posibilidad de establecer relaciones complejas. Por contra, su escalabilidad y flexibilidad
es bastante baja debido a su estructura.
Si quieres consultar más información te recomendamos consultar nuestro artículo sobre bases de datos, donde encontrarás
información general y enlaces a otras tipologías de databases.
Ing. Victoria Guerrero