UNIVERSIDAD CATÓLICA DE HONDURAS
Campus “Jesús Sacramentado”
Sistemas inteligentes para negocios
Procesamiento analítico en línea
Índice
Introducción..............................................................................................................................................2
Objetivos....................................................................................................................................................3
OLAP y su evolución................................................................................................................................4
Funcionalidades........................................................................................................................................6
Recuperar datos OLAP........................................................................................................................6
Crear archivos de cubo para utilizarlos sin conexión........................................................................6
Crear cubos a partir de bases de datos relacionales..........................................................................6
Sistemas OLAP.........................................................................................................................................7
ROLAP (OLAP Relacional).................................................................................................................7
MOLAP (OLAP Multidimensional)....................................................................................................7
HOLAP (OLAP Híbrido).....................................................................................................................8
Desafíos......................................................................................................................................................9
Ejemplo....................................................................................................................................................11
Bibliografía..............................................................................................................................................12
2
Introducción
Se pueden considerar los sistemas OLAP como pertenecientes a los sistemas de información para
ejecutivos, EIS, utilizados para proporcionar al nivel estratégico información útil para la toma de
decisiones.
Es un método para buscar en los datos de diferentes maneras. Con OLAP los datos son
clasificados en diferentes dimensiones las que pueden ser vistas unas con otras en cualquier
combinación para obtener diferentes análisis de los datos que contienen.
En un modelo de datos OLAP, la información es vista como cubos, los cuales consisten en
categorías descriptivas y valores cuantitativos.
Objetivos
• Conocer los conceptos básicos y la consistencia de OLAP.
• Definir un análisis de la implementación que se requiere.
• Mejorar el rendimiento de la empresa mediante una recolección de datos profundizada.
2
OLAP y su evolución.
¿Qué es OLAP?
OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical
Processing). Es una solución utilizada en el campo de la llamada inteligencia empresarial (o
Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para
ello utiliza estructuras multidimensionales (o cubos OLAP) que contienen datos resumidos de
grandes bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de
ventas, marketing, informes de dirección, minería de datos y áreas similares.
OLAP no es un nuevo concepto y ha permanecido en el tiempo por décadas, de hecho, el origen
de la tecnología OLAP se remonta a 1962. Pero no fue hasta 1993 que comienza a ser usada por
grandes corporaciones con el fin de dar soporte a las estrategias de negocios basada en la
información de ventas, finanzas y producción; para realizar consultas de grandes cantidades de
datos que a la fecha se tornaba engorrosa.
Para esto el software utiliza estructuras multidireccionales o Cubos OLAP, que son bases de
datos multidireccionales en la cual el almacenamiento físico de los datos se realiza en un vector
multidireccional. Los cubos OLAP se pueden considerar como una ampliación de las 2
2
dimensiones de una hoja de cálculo, estos contienen datos resumidos de grandes bases de datos o
Sistemas Transaccionales.
En el mundo empresarial de la actualidad existe una seria de competidores en donde se hace
primordial tener software que entregan información como lo es OLAP, software que son de gran
ayuda para las organizaciones ya que entregan soluciones inteligentes que permiten a los usuarios
llevar a cabo análisis de datos para así tomar decisiones puntuales que son los principales
problemas que enfrentaban las empresas.
En la actualidad su aplicación a sido expandida hacia todas las áreas de la empresa y hacia otros
tipos de organizaciones que analizan volúmenes masivos de datos, incluyendo medianas
empresas, academia, Gobierno y demás instituciones públicas y privadas, las cuales cada día
más, requieren de un análisis dinámico, potente y en línea de los indicadores para tomar las
decisiones, lo que genera un potente aumento en la demanda del software.
Este sistema debe estar preparado para un gran número de usuarios en línea y los distintos tipos
de operaciones que necesitaran una respuesta inmediata.
Como mencionamos anteriormente los sistemas OLAP son una de las herramientas más
utilizadas en el campo de las soluciones Business Intelligence, ya que brinda la posibilidad de
disponer de una base de datos multidimensional que permite llevar a cabo el procesamiento
analítico de la información de manera online.
Con el paso de los años y el avance de las tecnologías informáticas al servicio de las empresas,
que han logrado convertirse en la solución adecuada para la realización de negocios inteligentes,
la herramienta OLAP ha dado lugar al nacimiento de diversos sistemas basados en su
arquitectura que pueden ofrecer respuestas a las necesidades de las distintas compañías.
Funcionalidades
Recuperar datos OLAP
Puede conectarse a los orígenes de datos (origen de datos: conjunto almacenado de información
de "origen" utilizado para conectarse a una base de datos. Un origen de datos puede incluir el
nombre y la ubicación del servidor de la base de datos, el nombre del controlador de la base de
datos e información que necesita la base de datos cuando se inicia una sesión. OLAP como lo
haría a otros orígenes de datos externos. Puede trabajar con bases de datos creadas con servicios
OLAP de Microsoft SQL Server, el producto servidor OLAP de Microsoft Corporation. Los
2
datos OLAP sólo se pueden mostrar como informe de tabla dinámica o de gráfico dinámico, no
como rango de datos externos. Puede guardar informes OLAP de tabla dinámica y de gráfico
dinámico en plantillas de informe que incluye una o más consultas o informes de tabla dinámica
basados en datos externos.
Crear archivos de cubo para utilizarlos sin conexión
Los archivos de cubo sin conexión permiten trabajar con datos OLAP sin estar conectado a la
red. Sólo podrá crear archivos de cubo si utiliza un proveedor OLAP (proveedor OLAP: conjunto
de software que proporciona acceso a un tipo concreto de base de datos OLAP. Este software
puede incluir un controlador de origen de datos y otro software de cliente necesario para
conectarse a una base de datos.), como los servicios OLAP de Microsoft SQL Server, que admita
esta función.
Crear cubos a partir de bases de datos relacionales
Los cubos OLAP, permiten organizar datos consultados de bases de datos relacionales, como
Microsoft SQL Server, en cubos OLAP. El asistente está disponible desde Microsoft Query. Un
cubo permite trabajar con cantidades mayores de datos en un informe de tabla dinámica o gráfico
dinámico que en otras circunstancias y, además, agiliza la recuperación de los datos.
Características de OLAP:
• Las herramientas de OLAP presentan al usuario una visión multidimensional de los datos
(esquema multidimensional) para cada actividad que es objeto de análisis.
• El usuario formula consultas a la herramienta OLAP seleccionando atributos de este
esquema multidimensional sin conocer la estructura interna (esquema físico) del almacén
de datos.
• La herramienta OLAP genera la correspondiente consulta y la envía al gestor de consultas
del sistema.
2
Sistemas OLAP
De acuerdo a su forma de funcionamiento y a su estructura, los sistemas OLAP han sido
clasificados en distintas categorías:
ROLAP (OLAP Relacional)
Este es el tipo de implementación OLAP que almacena los datos en un motor relacional.
Normalmente, los datos son detallados, de esta manera se evitan las agregaciones y además las
tablas se encuentran normalizadas. Los esquemas más comunes sobre los que se trabaja son el
esquema de estrella y el esquema copo de nieve, aunque también es posible trabajar sobre
cualquier base de datos relacional. La arquitectura de estas bases de datos está compuesta por un
servidor de banco de datos relacional y el motor OLAP se encuentra en un servidor dedicado solo
para esto.
MOLAP (OLAP Multidimensional)
Este otro tipo de implementación OLAP lo que hace es almacenar los datos en una base de datos
multidimensional. Para optimizar los tiempos de respuesta, se calcula el resumen de la
información por adelantado. Algunos sistemas utilizan técnicas de compresión de datos para
disminuir el espacio de almacenamiento en disco debido a los valores pre-calculados.
HOLAP (OLAP Híbrido)
Almacena algunos datos en un motor relacional y otros en una base de datos multidimensional.
Este tipo de implementación utiliza las dos técnicas expuestas anteriormente. De ahí que es una
técnica híbrida.
Comparación
Cada sistema OLAP tiene ciertos beneficios (aunque existe desacuerdo acerca de las
características específicas de los beneficios entre los proveedores).
Algunas implementaciones MOLAP son propensas a la "explosión" de la base de datos; este
fenómeno provoca la necesidad de grandes cantidades de espacio de almacenamiento para el uso
de una base de datos MOLAP cuando se dan ciertas condiciones: elevado número de
dimensiones, resultados pre-calculados y escasos datos multidimensionales. Las técnicas
2
habituales de atenuación de la explosión de la base de datos no son todo lo eficientes que sería
deseable.
Por lo general MOLAP ofrece mejor rendimiento debido a la especializada indexación y a las
optimizaciones de almacenamiento. MOLAP también necesita menos espacio de
almacenamiento en comparación con los especializados ROLAP porque su almacenamiento
especializado normalmente incluye técnicas de compresión.
ROLAP es generalmente más escalable. Sin embargo, el gran volumen de pre-procesamiento es
difícil de implementar eficientemente por lo que con frecuencia se omite; por tanto, el
rendimiento de una consulta ROLAP puede verse afectado.
Desde la aparición de ROLAP van apareciendo nuevas versiones de bases de datos preparadas
para realizar cálculos, las funciones especializadas que se pueden utilizar tienen más
limitaciones.
HOLAP (OLAP Híbrido) engloba un conjunto de técnicas que tratan de combinar MOLAP y
ROLAP de la mejor forma posible. Generalmente puede pre-procesar rápidamente, escala bien,
y proporciona una buena función de apoyo.
Otros tipos
Los siguientes acrónimos a veces también se utilizan, aunque no son sistemas tan generalizados
como los anteriores:
• WOLAP o Web OLAP: OLAP basado u orientado para la web.
• DOLAP o Desktop OLAP: OLAP de escritorio
• RTOLAP o Real Time OLAP: OLAP en tiempo real
• SOLAP o Spatial OLAP: OLAP espacial
Desafíos
A pesar de todas las ventajas que proporcionan los sistemas OLAP, producen algunos desafíos:
2
• En tanto que los datos en los sistemas OLTP se actualizan constantemente a través de
transacciones que fluyen procedentes de diversos orígenes, los almacenes de datos OLAP
normalmente se actualizan a intervalos mucho más lentos, en función de las necesidades
del negocio. Esto significa que los sistemas OLAP son más adecuados para tomar
decisiones empresariales estratégicas, en lugar de dar respuestas inmediatas ante los
cambios. Además, se debe planear cierto nivel de limpieza de datos y orquestación para
mantener actualizados los almacenes de datos OLAP.
• A diferencia de las tablas tradicionales, normalizadas y relacionales encontradas en los
sistemas OLTP, los modelos de datos OLAP suelen ser multidimensionales. Esto hace
difícil o imposible la asignación directa a modelos entidad-relación y modelos orientados
a objetos, en los que cada atributo se asigna a una columna. Los sistemas OLAP
normalmente usan un esquema de estrella o copo de nieve en lugar de la normalización
tradicional.
Aplicación del análisis OLAP en la empresa
El OLAP, o análisis multidimensional de datos, es una forma específica de representación de
datos financieros y estadísticos destinada a ejecutivos, especialistas y analistas. Sirve de apoyo en
el proceso de toma de decisiones y facilita una mejor comprensión de la información. Su función
es responder a las preguntas que puedan surgir al usuario durante su trabajo. Permite a sus
usuarios entrar en detalles y generalizar, filtrar, clasificar y reagrupar datos en el momento del
análisis, mediante su organización en cubos multidimensionales.
La herramienta principal para visualizar y manipular datos es la hoja de trabajo electrónica y
dinámica. Las filas y columnas de datos que la forman son los controles de manipulación.
Desplazándolas y pinchando sobre ellas, el usuario hace que el ordenador realice cálculos y
presente los datos desde diferentes puntos de vista. De este modo, el usuario puede producir
diversos informes a partir de un único conjunto de datos, sin que los especialistas en IT
intervengan en el proceso, lo que evita que los departamentos de IT tengan que ocuparse de
codificar distintos tipos de informes y eleva el nivel de independencia de los ejecutivos y
especialistas para obtener la información que necesitan.
2
El análisis OLAP divide los datos en dos grupos: hechos (números, también denominados
medidas) y dimensiones (o descripciones). Los hechos se agregan mediante algoritmos en una
gráfica determinada, con la profundidad de agregación y agrupación definida por el usuario.
Además, la hoja de trabajo electrónica puede mostrar los datos bajo una estructura regular. El
OLAP se puede aplicar a todo tipo de tarea que requiera un análisis multifactorial de datos. Por lo
general, contar con una tabla repleta de datos, suponiendo que contiene al menos una columna
descriptiva y una o más columnas de datos, OLAP puede resultar una herramienta efectiva y
conveniente para analizar dicha tabla y para producir informes.
En el artículo 30 ideas of using OLAP se realiza una revisión de posibles aplicaciones de este
tipo de análisis en la empresa. Desde el análisis de ventas, que puede realizarse desde distintos
puntos de vista (estructura de las ventas, análisis factorial, análisis por regiones, dinámico, de
dependencia, comparativo…), análisis de precios, marketing, flujos de fondos, análisis de
presupuestos, contabilidad e informes financieros, hasta estadísticas web, entre muchas otras
posibilidades.
Ejemplo
Una organización tiene datos almacenados en una base de datos grande. Se desea poner estos
datos a disposición de clientes y usuarios de negocios para que puedan crear sus propios
informes y realizar análisis. Una opción es simplemente dar a dichos usuarios acceso directo a la
base de datos. Sin embargo, esta opción tiene varias desventajas, incluida la administración de la
seguridad y el control de acceso. Asimismo, el diseño de la base de datos, incluidos los nombres
de las tablas y columnas, puede ser difícil de entender para los usuarios. Los usuarios tendrían
que saber qué tablas consultar, cómo deberían combinarse esas tablas y conocer otra lógica de
negocios que deba aplicarse para obtener los resultados correctos. Además, para empezar, los
usuarios deberían conocer un lenguaje de consulta, como SQL. Esto suele provocar que varios
usuarios generen informes con las mismas métricas, pero con resultados distintos.
Otra opción consiste en encapsular toda la información que necesitan los usuarios en un modelo
semántico. Los usuarios pueden consultar el modelo semántico más fácilmente con la
2
herramienta de generación informes que prefieran. Los datos proporcionados por el modelo
semántico se extraen de un almacenamiento de datos, lo que garantiza que todos los usuarios
vean una misma versión. El modelo semántico también proporciona nombres descriptivos de
tablas y columnas, relaciones entre tablas, descripciones, cálculos y seguridad a nivel de fila.
Bibliografía
[Link] [Link]
[Link]
[Link]
[Link]
analyticalprocessing