0% encontró este documento útil (0 votos)
34 vistas55 páginas

Bases de Datos Avanzadas: Conferencia # 3. Sistema de Soporte A La Toma de Decisiones

Cargado por

nayletbv03
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
34 vistas55 páginas

Bases de Datos Avanzadas: Conferencia # 3. Sistema de Soporte A La Toma de Decisiones

Cargado por

nayletbv03
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Bases de Datos Avanzadas

Conferencia # 3. Sistema de soporte a la toma de decisiones.

Dra. C. Lisandra Bravo Ilisástigui

[email protected]

@lisibravo
Introducción

❖ La información está directamente “Las organizaciones tienen un


asociada a la definición de la
estrategia.
insaciable apetito de datos, pero
❖ Es un recurso vital cuando hay una frecuentemente le faltan las
estructuración correcta, porque agrega
enzimas para digerirlos”
valor en el momento en que integran
varias áreas y funciones. Neil Raden
❖ […] es una forma de generar ventaja
competitiva, pues posibilita nuevas
formas de superar el desempeño de
CONOCIMIENTO = DATOS + SIGNIFICADO
los rivales.
Datos, Información y Conocimiento

❖ Datos: Constituyen los hechos básicos sobre los


que se fundamentan las necesidades de
información y de procesamiento de una
empresa.
❖ Información: Es el procesamiento de los datos
en el sentido más amplio: almacenamiento,
recuperación y procesamiento de los datos se
convierten.
❖ Conocimiento: Es un conjunto organizado de
afirmaciones de hechos o ideas, que presentan
un juicio razonado o un resultado experimental,
que se transmite a otros a través de algún
medio de comunicación en alguna forma
sistemática.
Sistemas de Información Operacionales

● Automatizan en primera instancia los

Procesamiento procesos de carácter repetitivo o


administrativo,

Transaccional en ● Entendemos por aplicaciones


operacionales, aquellas que resuelven
Línea, OLTP las necesidades de funcionamiento de
la empresa.

On-Line Transaction Processing ● En este tipo de sistemas, los conceptos


más importantes son la actualización y
el tiempo de respuesta.
● Diseño de Bases de Datos en función de
estas necesidades.
Problemas
Toma de
Decisiones

Grandes
Sistemas Operacionales de las

Volúmenes de
Ventas Información
Empresas

Personal

¿Cómo
Clientes lo logro?

Marketing
Ayudan en el análisis de información de
negocios:
❖ Consideran más facetas de una decisión.
❖ Generan mejores alternativas.
SISTEMA DE SOPORTE ❖ Responden rápidamente ante
A LAS DECISIONES determinadas peticiones.
❖ Resuelven problemas complejos.
DECISION SUPPORT SYSTEMS – ❖ Consideran más opciones para resolver
un problema.
DSS
❖ Inspiran soluciones.
❖ Utilizan múltiples análisis para resolver
un problema.
Esencia de los DSS
Los datos deben ser extraídos de diversas fuentes, limpiados, transformados,
consolidados y cargados en las bases de datos de apoyo a la toma de decisiones, y
luego, actualizados periódicamente.
Sistemas operacionales vs. DSS

Sistemas operacionales DSS


Funciones de día a día Decisiones estratégicas a corto, mediano y
largo plazo

Fundamentalmente datos actuales Fundamentalmente datos históricos

Datos detallados Datos con cierto nivel de detalle y resumidos

Orientados a aplicaciones Orientados a entidades

Cargas de trabajo predecibles Cargas de trabajo impredecibles

Manejo de transacciones Toma de decisiones

Bases de Datos Operacionales Bases de datos de Apoyo a la Toma de


Decisiones
Los Sistemas Operacionales (OLTP) poseen un diseño
de las bases de datos ineficiente para el
procesamiento de los datos de forma rápida y
sencilla.
Bases de datos de apoyo a la toma de decisiones

➔ Involucran datos históricos, por lo que tienden a poner marcas de tiempo en la mayoría
o en todos los datos
◆ Las llaves incluyen frecuentemente columnas de marcas de tiempo
➔ Grandes volúmenes de información altamente indexadas.
➔ Redundancia controlada.
➔ Principalmente de solo lectura. Actividades ocasionales de inserción por lotes.
➔ Consultas tienden a ser complejas.
Sistema de soporte a la toma de decisiones

➔ No es parte de la tecnología de base datos por sí misma, sino, la combinación de varias


aplicaciones de esta técnica:
◆ Data Warehouse
◆ Data Mart
◆ OLAP (Procesamiento Analítico en Línea)
◆ Minería de Datos
◆ Data Lakes y Lakehouses
◆ Tecnologías de visualización.
Almacenes y Mercados de Datos

Data Warehouse & Data Marts


¿Qué es un Data Warehouse?

“Un Data Warehouse es una colección de datos orientados a temas, integrados,


no-volátiles y variante en el tiempo, organizados para soportar necesidades
empresariales”. [Inmon 1992]
● Los datos se organizan por temas
para facilitar su acceso y
entendimiento por parte de los
usuarios finales.
● Por ejemplo, todos los datos sobre
clientes pueden ser consolidados en

Temático una única tabla del Data Warehouse.


De esta forma, las peticiones de
información sobre clientes serán más
fáciles de responder dado que toda la
Orientado a Temas información reside en el mismo lugar.
● Sólo los datos necesarios para el
proceso de generación del
conocimiento del negocio se integran
desde el entorno operacional.
● Los datos almacenados en el Data
Warehouse deben integrarse en una
estructura consistente, por lo que las
inconsistencias existentes entre los
diversos sistemas operacionales y
Integrado fuentes de datos deben ser
eliminadas.
● La información suele estructurarse
también en distintos niveles de
detalle para adecuarse a las distintas
necesidades de los usuarios.
● El almacén de información de un
Data Warehouse existe para ser leído,
consultado, y no modificado.
● La información es por tanto
No volátil permanente, significando la
actualización del Data Warehouse la
incorporación de los últimos valores
que tomaron las distintas variables
contenidas en él sin ningún tipo de
acción sobre lo que ya existía.
● El tiempo es parte implícita de la
información contenida en un Data
Warehouse. En los sistemas
operacionales, los datos siempre
Variante en el reflejan el estado de la actividad del
negocio en el momento presente.

tiempo ● La información almacenada en el


Data Warehouse sirve, entre otras
cosas, para realizar análisis de
Histórico tendencias.
● El Data Warehouse se carga con los
distintos valores que toma una
variable en el tiempo para permitir
comparaciones
¿Por qué surgieron?

Brindar una fuente única de datos


No afectar el funcionamiento de las
limpia y de apoyo a la toma de
bases de datos operacionales
decisiones

● El término aparece por 1ra vez en “Data Architecture the Informations Paradigm”,
Inmon, 1988.
● Brindan una plataforma sólida que permite realizar análisis a partir de datos históricos.
● Integra la información proveniente de sistemas operacionales no integrados, al tiempo
que organiza y almacena los datos que se necesitan para el procesamiento analítico
sobre una amplia perspectiva de tiempo.
Características Fundamentales .

● La información se colecciona desde fuentes diferentes y dispersas y se sitúa en un lugar


donde estas desigualdades se reconcilian.
● Una vez situados los datos en el Data Warehouse, se permite que diferentes
aplicaciones hagan uso de la información que se puede obtener a partir de ellos.
● El sistema se utiliza en el contexto global de la empresa.
¿Cuál es el
pronóstico de
promoción del
curso?

¿Cómo
incrementar en un
Extracción, 10% los ingresos
Transformación y Data por turismo?
Carga Warehouse

¿Cuáles son los


suministradores
que nos venden
con mejor calidad y
precio?
Problema
Operaciones de análisis e informes
sobre un subconjunto de información
específico dentro del DW

Data Warehouse
Ineficiente

Construir un tipo de almacén limitado de propósito


específico que proporcione un acceso más rápido a los datos
que si tuvieran que ser sincronizados con todos los demás
datos del Data Warehouse
Data Mart

“Un Data Warehouse especializados, orientados a temas, integrados, volátil y


variante en el tiempo, organizados para soportar necesidades empresariales”.

Es un data warehouse departamental


● Especializado
○ Contiene datos para dar apoyo a un
área específica de análisis de
Diferencias DW negocio

● Volátil
○ Los datos pueden modificarse,
eliminarse y crearse otros para algún
propósito
Características Data Mart.

● Se ajustan a las necesidades que tiene un departamento o área.


● Se enfocan al manejo de datos resumidos o de muestras, más que a la historia
presentada con detalle.
● Pueden estar a cargo de un grupo específico dentro del área de la organización.
● Disminuyen significativamente el costo de creación y de operación.
● Son diseñados para satisfacer las necesidades específicas de grupos comunes de
usuarios, ya sea por divisiones geográficas, divisiones organizacionales, períodos de
tiempo no muy grande.
¿Cómo se obtienen?

1. A partir de un DW extrayendo un subconjunto de los datos asociados con un criterio


específico, hacía una BD física.
2. De forma independiente al DW existente.
3. A partir de las necesidades se van creado los Data Marts siendo el DW la consolidación
de ellos.
DM dependiente de DW
DM

Ventas 2020
OLTP

DM

La Habana
OLTP Data Warehouse

DM
Recursos
OLTP Humanos
Data Mart Independiente
DM
OLTP
Ventas 2020
Ventas

DM
OLTP
La Habana
Clientes

DM
OLTP Recursos
Recursos Humanos
Humanos
Diseño Multidimensional

¿Cómo se ordena la información?


Diseño multidimensional

“Aplicable cuando la BD puede verse como un cubo de 3, 4 ó más dimensiones”


● Dimensiones: Representa las distintas categorías.
● Puntos en el interior del cubo: Intersección espacial entre valores dados de cada una
de las dimensiones del cubo
Proveedor

Envíos
Piezas

Transportistas
Diferencias entre el MER y MD
➢ El MER:
○ Es una técnica poderosa para el diseño de sistemas transaccionales en el entorno de las
bases de datos relacionales.
○ Diseño sin redundancias y menor espacio.
○ Gran cantidad de tablas relacionadas entre sí y existen diferentes caminos para obtener
una misma información.
○ No contribuye en la habilidad del usuario en el momento de consultar la base de datos .
➢ El MD:
○ Una técnica mucho más poderosa para la interrogación de los datos.
○ Menos riguroso en cuanto a organización, permite más flexibilidad en el diseño, para
lograr un mayor desempeño y optimizar la recuperación de la información desde un
punto de vista más cercano al usuario final.
○ Simple de navegar y encuestar para cualquier usuario.
Estructura modelo multidimensional

➢ Las Dimensiones, contienen por lo


Llave de la Fecha
(Atributos de la Fecha)
Llave del Cliente
(Atributos del Cliente)
general, una llave simple y un conjunto
de atributos que la describen. Son la
fuente de gran parte de todas las
Llave de la Fecha necesidades empresariales que deben
Llave
Llave
del Cliente
de Tienda cubrirse, y sirven de restricciones en la
Llave del Producto
mayoría de las consultas
Cantidad Vendida

➢ Las tablas de hechos, representan los


procesos que ocurren en la
organización. Cada medida o hecho, se
Llave de Tienda
(Atributos de la
Llave de Producto
(Atributos del
corresponde con una intersección de
Tienda) Producto) valores de las dimensiones
Estructura modelo multidimensional

Se representa a través de un esquema dimensional o Diagrama Entidad-Vínculo

Tienda Producto Cliente Fecha Cantidad Vendida

Variables Independientes
Variable
Dependientes
Tablas de Dimensiones
➢ Las tablas de dimensión, son las que alimentan a las tablas de hechos, la llave de un
hecho es la composición de las llaves de las dimensiones que están conectados a esta, por
tanto los atributos que conforman las tablas de dimensiones también describen el hecho.
➢ Los atributos dimensionales son fundamentalmente textos descriptivos, estos juegan un
papel determinante, son la fuente de gran parte de todas las necesidades que deben
cubrirse, además, sirven de restricciones en la mayoría de las consultas que realizan los
usuarios.
➢ La calidad del modelo multidimensional, dependerá en gran parte de cuan descriptivos y
manejables, sean los atributos dimensionales escogidos
➢ Las tablas de dimensión en general, son muchos más pequeñas que las tablas de hecho
en cuanto a cantidad de registro.
➢ En cuanto a cantidad de atributos, una tabla de dimensión bien descriptiva puede tener
un gran número de estos.
Tablas de Dimensiones

➢ Un Data Warehouse debe aceptar la responsabilidad de describir el pasado con precisión,


en un sistema operacional normalmente si se produce un cambio, se sobrescribe el nuevo
valor en el registro y se pierde el anterior.
➢ Cuando queremos mantener las trazas de lo que ha ocurrido en el entorno
multidimensional, por lo general ocurren cambios en la dimensiones, esto implica que se
debe mantener almacenado el valor anterior y registrar el nuevo valor; a este fenómeno
se le conoce como pequeños cambios en la dimensiones.
➢ Se debe prestar especial atención pues las tablas de dimensiones pueden crecer en el
número de registros y afectar el rendimiento.
La Dimensión Tiempo

La dimensión más importante de un Data Warehouse, es la dimensión tiempo.


➢ Cada hecho que se registra en un tabla de hecho, tiene asociado una marca de tiempo, es
decir, en qué momento ocurrió este hecho.
➢ Esto permite el almacenamiento y análisis histórico de la información.
➢ La inserción de datos, en la base de datos multidimensional, se hace por intervalos de
tiempo, lo cual asegura un orden implícito.
Tablas de Hechos

➢ Las tablas de hechos, representan los procesos que ocurren en la organización, son
independientes entre sí (no se relacionan unas con otras).
➢ En estas, se almacenan las medidas numéricas de la organización. Cada medida, se
corresponde con una intersección de valores de las dimensiones y generalmente se trata
de cantidades numéricas, continuamente evaluadas y aditivas.
➢ La llave de la tabla de hecho, es una llave compuesta, es la composición de las llaves
primarias de las tablas dimensionales a las que está unida.
➢ Podemos distinguir dos tipos de columnas en una tabla de hecho, columnas de hechos y
columnas llaves. Las columnas de hecho almacenan las medidas del negocio que se
quieren controlar y las columnas llaves, forman parte de la llave de la tabla.
Tablas de Hechos sin Hechos

Existen tablas de hechos que no contienen medidas, a estas tablas se les denomina
tablas de hechos sin hechos.
La semántica de la relación entre las dimensiones que definen la llave de esta tabla de hecho
implica por sí sola la ocurrencia de un evento, por ejemplo si quisiéramos representar el
hecho de que un estudiante matriculó en una universidad la combinación de las siguientes
dimensiones definiría este suceso: el estudiante matriculado, la carrera en que matriculó, la
fecha de matrícula, el tipo de curso que va a cursar, etc.
Esquemas más comunes

➢ Esquema estrella: Es un paradigma de modelado que tiene un solo objeto en el medio


conectado con varios objetos de manera radial. El objeto en el centro de la estrella es la
Tabla de Hechos y los objetos conectados a ella son las Tablas de Dimensiones. Las
tablas de dimensiones solo se relacionan con la tabla de hechos, es decir no existen
relaciones entre estas.
➢ Esquema copo de nieve: El esquema copo de nieve es una extensión del esquema
estrella en donde cada una de las puntas de la estrella puede dividirse en más puntas.
En esta forma de esquema, las tablas de dimensión pueden tener relación con otras
tablas de dimensión.
Esquemas estrella

Tabla de Dimensión 1 Tabla de Dimensión n

Tabla de Hechos

Tabla de Dimensión 2 Tabla de Dimensión n-1


Esquemas más comunes

➢ Esquema estrella: Es un paradigma de modelado que tiene un solo objeto en el medio


conectado con varios objetos de manera radial. El objeto en el centro de la estrella es la
Tabla de Hechos y los objetos conectados a ella son las Tablas de Dimensiones. Las
tablas de dimensiones solo se relacionan con la tabla de hechos, es decir no existen
relaciones entre estas.
➢ Esquema copo de nieve: El esquema copo de nieve es una extensión del esquema
estrella en donde cada una de las puntas de la estrella puede dividirse en más puntas.
En esta forma de esquema, las tablas de dimensión pueden tener relación con otras
tablas de dimensión.
Esquemas estrella
Llave de la Fecha Llave del Cliente
(Atributos de la Fecha) (Atributos del Cliente)
Llave de la Provincia

Llave de la Fecha
Llave del Cliente
Llave de Tienda
Llave del Producto Llave de la Provincia
(Atributos de la Provincia)
Cantidad Vendida

Llave de Tienda Llave de Producto


(Atributos de la Tienda) (Atributos del Producto)
Ventajas y Desventajas entre los Esquemas

➢ El esquema Copo de Nieve ocupa menor espacio de almacenamiento, sin embargo,


aumenta el número de tablas con las que el usuario debe interactuar e incrementa la
complejidad de las consultas a realizar.
➢ El esquema estrella nos proporciona mayor compresión, navegabilidad, es más
cercano a como el usuario final refleja la visión de una consulta empresarial

Nota: De ser posible se debe emplear un esquema estrella antes que un copo de nieve,
justificándose la utilización de mayor espacio de almacenamiento, en la disminución del
tiempo de obtención de la información que se necesita.
Diseño BD de apoyo a la toma de decisiones

Granularidad: Nivel más bajo de agregación de datos que se mantendrán en la base de


datos.
➢ La mayoría de las aplicaciones de apoyo para la toma de decisiones requieren en algún
momento de acceso a datos detallados.
➢ No existe algo similar a la teoría de la normalización que pueda servir como base
científica para el diseño de bases de datos multidimensionales
Pasos para el Modelo Multidimensional
Seleccionar el proceso de negocio a
Paso 1 modelar para combinar un
entendimiento de los requerimientos
del negocio con un entendimiento de los
datos disponibles.
Ejemplo

En una empresa se ha identificado la necesidad de rediseñar sus procesos internos


proyectando una mayor orientación hacia los clientes y un incremento de las ganancias a
partir de los servicios que ofrece. Para alcanzar estas metas se ha definido como línea de
trabajo el desarrollo de sistemas de apoyo a la toma de decisiones.
El proceso de toma de decisiones resulta insuficiente por varias causas, entre las que se
destacan: la no disponibilidad de la información en el tiempo y forma requeridos, la
duplicidad y falta de veracidad y la dispersión de los datos que conforman informaciones
claves en la conducción del negocio. El manejo inadecuado de indicadores y estadísticas
provoca pérdidas de efectividad en los diferentes análisis de las situaciones que se
presentan.
Procesos de Negocios

Marketing Inventarios
Ventas

Recursos
Humanos Transporte

Finanzas
Producción
Ejemplo
A partir del estudio de los indicadores que tradicionalmente monitorean los directivos de la
empresa, se han identificado para el área de Recursos humanos los siguientes indicadores:
● Plan de capacitación
● Cumplimiento del plan de capacitación
● Presupuesto de capacitación
● Proyección del plan mensual de capacitación
Recursos
● Avance del presupuesto
Humanos
● Plantilla
● Cubrimiento de plantilla
● Altas
● Bajas
Declarar los granos del proceso de
negocio (granularidad): Significa
especificar qué exactamente representa
una fila de una tabla de hechos.
Ejemplo:

Paso 2 ●

Plantilla por plan
Cubrimiento real
● Porcentaje de cubrimiento
● Total de trabajadores con más de 5
años de trabajo por áreas,
● Plazas o puestos de trabajo
● Mes
Seleccionar las dimensiones: Las
dimensiones representan todas las
posibles descripciones que toman los
valores simples en el contexto de cada
medida .
Ejemplo

Paso 3
● D_Área
● D_Plaza
● D_Tiempo
Identificar los hechos: Los usuarios del
negocio están interesados en analizar
este proceso de negocio a partir de estas
medidas
Ejemplo
H_CubrimientoPlantilla

Paso 4
● FA<<FactAttribute>>Plan
● FA<<FactAttribute>>Real
● FA<<FactAttribute>>%Cubrimiento
● FA<<FactAttribute>>Total>5años
Requerimientos del negocio + Realidad de las fuentes de Datos

Proceso de
negocio

Granularidad

Dimensiones

Resista la tentación de modelar Hechos


los datos mirando solamente
las fuentes de datos
Conclusiones

● El Data Warehousing se ha convertido en el centro de la arquitectura para los sistemas


de soporte a la toma de decisiones.
● Proveen una plataforma sólida que permite realizar análisis a partir de los datos
históricos y actuales.
● Facilita la integración de sistemas de aplicación no integrados.
● Organiza y almacena los datos que se necesitan para el procesamiento analítico sobre
una amplia perspectiva de tiempo.
● Los Datamart se ajustan más a las necesidades de información de un área o
departamento
Conclusiones

El modelado multidimensional:
● Se logra un diseño más cercano a la visión del usuario final de una consulta
empresarial, la información es fácil de encuestar y navegar.
● Obtiene mayor velocidad de recuperación de las consultas en comparación con el
modelo Entidad-Relación.
● En dependencia de los datos que se necesiten modelar, se debe escoger el esquema
multidimensional más adecuado.

También podría gustarte