Modelado
Dimensional
El modelado dimensional es una forma de acercar los datos a la manera en
que estos sern convertidos en informacin til para los usuarios del negocio.
El objetivo final es que estos puedan encontrar de manera intuitiva y rpida la
informacin
que
necesitan.
La aplicacin del modelo dimensional tiene lugar en la fase de diseo lgico, lo
que permite la traduccin del esquema resultante del diseo conceptual al
plano lgico. El modelo dimensional se describe en el ao 1996 por Ralph
Kimball, como propuesta para el diseo de almacenes de datos (Data
Warehouses), partiendo de la visin multidimensional que los usuarios tienen
de los datos empresariales cuando se enfrentan a ellos con propsito de
anlisis (de
anlisis
multidimensional
OLAP
en
concreto).
El anlisis multidimensional consiste en analizar los datos que hacen referencia
a hechos, sean econmicos o de otros tipos, desde la perspectiva de sus
componentes o dimensiones (utilizando para ello algn tipo de mtrica o
medida
de
negocio).
Este modelo tiene en cuenta que para el anlisis multidimensional los datos se
representan como si estuvieran en un espacio n-dimensional (cubo de datos),
permitiendo su estudio en trminos de hechos sujetos al anlisis (facts, en
ingls) y dimensiones que permiten diferentes puntos de vista por los que
analizar
esos
hechos.
La analoga del cubo (recuerde el cubo de Rubik) con la visin multidimensional
es vlida para comprender el concepto desde un punto de vista grfico, pero
slo es vlido para un modelo de tres dimensiones. Un modelo de ms de tres
dimensiones suele denominarse hipercubo, y ya resulta ms difcil su
representacin
grfica.
El modelo dimensional distingue tres elementos bsicos:
Hechos: es la representacin en el data warehouse de los procesos de
negocio de la organizacin. Por ejemplo: una venta puede identificarse
como un proceso de negocio. Los hechos se podrn reconocer adems
porque siempre tienen asociada una fecha, y una vez registrados no se
modifican ni se eliminan (para no perder la historia).
Mtrica: son los indicadores de negocio de un proceso de negocio.
Aquellos conceptos cuantificables que permiten medir nuestro proceso
de negocio. Por ejemplo, en una venta tenemos el importe de la misma y
la cantidad vendida. Existen mtricas derivadas, como el precio unitario,
que se obtiene al dividir el importe total por las unidades vendidas.
Dimensin: es la representacin en el data warehouse de un punto de
vista para los hechos de cierto proceso de negocio. Si regresamos al
ejemplo de una venta, para la misma tenemos el cliente que ha
comprado, la fecha en la que se ha realizado, el producto vendido,
Estos conceptos pueden ser considerados como vistas para este
proceso de negocio. Puede ser interesante recuperar todas las compras
realizadas por un cliente, o para un producto o familia de productos, o
para un lapso determinado.
Pero qu hay de su representacin? Igual que sucede en el modelo
relacional, el modelo dimensional adopta el concepto de relacin (tabla) como
estructura bsica del modelo. Pero a diferencia del modelo relacional, que no
hace distincin entre relaciones, el modelo dimensional distingue entre
relaciones de hecho (tablas de hecho) y relaciones de dimensin (tablas de
dimensin).
Los conceptos bsicos hechos, mtricas y dimensiones (facts, measures y
dimensions) se representan en el modelo como relaciones (tablas) dentro de
un esquema dimensional. Segn las tcnicas de modelado utilizadas, ese
esquema dimensional puede adoptar forma de estrella o de copo de nieve.
El siguiente, es un ejemplo de esquema en estrella para el caso de las ventas
diarias
en
un
conjunto
de
tiendas:
Vemos que existe una tabla de hechos en el centro (h_ventas_diarias), y una
tabla de dimensin para cada dimensin de anlisis que participa de la
descripcin
de
ese
hecho
(dim_xxx).
Las columnas de la tabla de hechos incluyen las dimensiones que identifican el
hecho, y los hechos o medidas del negocio. Las columnas en las tablas de
dimensin incluyen atributos asociados a cada posible valor de la dimensin.
Los atributos de una dimensin permitirn agrupar los hechos jerrquicamente,
para poder consolidar y desagregar las mediciones segn se desee. Como
ejemplos tenemos:
Para la dimensin fecha: ao, mes, da, nombre del mes, da de la
semana, trimestre,
Para la dimensin producto: tipo de producto, familia, unidad de medida,
Cuando a una dimensin no se le pueden asociar mltiples atributos, se dice
que tenemos una dimensin degenerada, y solo aparecer como una columna
en la tabla de hechos. Por ejemplo, si tuviramos en nuestro ejemplo una
dimensin Estado de la Venta, con los posibles valores: Confirmada,
Pendiente, Cancelada; en este caso la dimensin servira solo para separar
las ventas segn su estado, y no se requieren atributos adicionales.
Eventualmente, pudiera surgir un esquema en estrella integrado solo por una
tabla
de
hechos
con
dimensiones
degeneradas.
Por otro lado, cuando se decide normalizar las tablas de dimensiones para
eliminar campos redundantes, tenemos lo que se conoce como esquema en
copo
de
nieve.
El Copo de Nieve es una generalizacin de la Estrella, por lo que no es
necesario
tratar
de
diferenciar
uno
de
otro.
La decisin de normalizar, o no, una tabla de dimensin corresponde a los
diseadores, quienes debern tener presente que el objetivo es dar respuesta
rpida a las consultas de los usuarios, no ahorrar espacio. Generalmente, el
espacio que se logra ahorrar al normalizar la dimensin, es insignificante
comparado con el volumen de la tabla de hechos, mientras el impacto en los
tiempos de respuesta es apreciable.