0% encontró este documento útil (0 votos)
36 vistas52 páginas

CLASE 9 Intro Datawarehouse

El documento aborda el desarrollo de bases de datos, centrándose en conceptos clave como Data Warehouse, Business Intelligence y CRM. Se discuten metodologías de diseño de Data Warehouse, comparando enfoques de Inmon y Kimball, así como las diferencias entre OLTP y OLAP. Además, se destacan las características y beneficios de los sistemas CRM en la gestión de relaciones con clientes.

Cargado por

Sergio
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
36 vistas52 páginas

CLASE 9 Intro Datawarehouse

El documento aborda el desarrollo de bases de datos, centrándose en conceptos clave como Data Warehouse, Business Intelligence y CRM. Se discuten metodologías de diseño de Data Warehouse, comparando enfoques de Inmon y Kimball, así como las diferencias entre OLTP y OLAP. Además, se destacan las características y beneficios de los sistemas CRM en la gestión de relaciones con clientes.

Cargado por

Sergio
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

Desarrollo Base de

Datos

1
Conocimiento

• Datos • Información
2
Ubicación de los Sistemas de
Información

3
Características de Información
según su Rol

4
Características de Información según su
Contenido

5
6
Preguntas Típicas difícil de responder

La Dirección y Gerencias necesitan tener acceso a las respuestas para evaluar ,decidir ,
planificar y ejecutar cursos de acción, cambios o tomar decisiones con la menor
incertidumbre posible

7
Problemas Comunes

8
Respuestas Comunes

9
Pautas a tener en cuenta con la
Información

10
11
12
Que no es Business Intelligence

13
Business Intelligence

14
Business Intelligence
Las herramienta acceden a una capa Lógica la cual se adapta a cada organización.

Ejemplo:

Tabla Customer perteneciente al modelo del DW.

• Create View Clientes AS


(
Select
Customer as Cliente,
Customer_Name as Nombre
Income_Amt as Sueldo,
Case When ranch=1 Then ‘Propio’ Else ‘Externo’ End as Ind_Staff
From Customer
);

15
Datawarehouse, primeras soluciones a viejos
problemas

16
Que espera la organización

17
Datawarehouse la promesa de …

18
Datawarehouse

19
20
Datawarehouse
El DW es:
• Colección de Datos

• Orientado a temas/Foco

• Integrado

• Variante en el Tiempo

• No volátil/ Histórico

21
22
Primeras consideraciones

23
Requerimientos

24
Metodologías a utilizar

25
Arquitecturas

26
Algunos componentes genéricos

27
Las siglas MDM aluden a Master Data Management o lo que es lo mismo, gestión de datos
maestros. Se trata de un conjunto de procesos, políticas, servicios y tecnologías que se
emplean no sólo para gestionar, sino también para generar y mantener los datos asociados a
entidades de negocio centrales de una empresa.

Un almacén operacional de los datos (ODS) es un tipo de base de datos que se usa
comúnmente como un área lógica provisional para un almacén de datos. Mientras están en el
ODS, los datos pueden ser borrados, arreglados por redundancia y revisados para
cumplimiento con las reglas empresariales correspondientes.

El data quality (DQ )o calidad de los datos engloban un conjunto de reglas que permiten
asegurar un mínimo en la calidad de los datos que se han recibido para ayudar a que los
resultados extraídos sean fiables y de calidad.

28
Arquitectura Top-Down

29
Arquitectura Bottom-Up

30
La visión de Inmon se caracteriza por tener un repositorio central de datos único. Este enfoque se basa en la
metodología top-down, que es aquella que toma las decisiones partiendo de las variables más globales para ir
descendiendo hasta las más específicas. Es decir, Inmon parte de la construcción de un almacén de datos global del
que se irán nutriendo los diferentes Data Marts, evitando así las diferentes inconsistencias que puedan existir entre
diferentes departamentos.

En cuanto a la estructura del Data Warehouse, Inmon defiende tener un modelo normalizado aplicando las 3 formas
normales:

La idea de Kimball comienza con la necesidad de un departamento de construir un Data Warehouse para unirlo a
otros Data Marts de otros departamentos a medida que vayan apareciendo.

La metodología bottom-up se define como el diseño en detalle de partes individuales para luego enlazarlas entre ellas
para formar el sistema completo. Es decir, con la metodología de Kimball se van diseñando a medida, según las
necesidades de los departamentos, los diferentes Data Marts, para unirlos y formar el Data Warehouse de la
empresa.

31
Kimball Vs Immon
La metodología que propone Inmon, top-down, se caracteriza por diseñar de arriba hacia abajo, de lo global a lo
departamental. Mientras que con bottom-up, la metodología que sigue Kimball, se hace lo contrario, diseña cada
departamento su propia estructura para conformar el Data Warehouse global.

En este sentido el enfoque de Inmon tiene la ventaja de que toda la empresa va a tener la misma estructura,
mientras que para Kimball al tener varios Data Marts diferentes podrían diferir unos de otros en aspectos que
podrían ser comunes. Por otro lado, la ventaja que tiene la metodología de Kimball es que cada departamento va a
tener independencia a la hora de crear sus propios Data Marts, eso sí, siguiendo un estándar común, mientras que
Inmon se tiene que amoldar a la estructura global.

Inmon apuesta por una estructura normalizada frente a la desnormalización de Kimball.

A pesar de las diferencias las dos visiones tienen un mismo objetivo, tener un sistema de almacenamiento capaz
de responder a todas las posibles respuestas que puedan surgir en la empresa. Por lo tanto, la elección de un
enfoque u otro tendrá que hacerse en función de las necesidades que surjan. Si lo que se quiere es un sistema en
el que se van a hacer análisis de datos diferenciando los diferentes departamentos de la compañía quizás lo ideal
sería apostar por Kimball mientras que si se quiere tener una visión más global y se debe tener especial cuidado
con la integridad de los datos, hay que decantarse con la visión de Inmon.
32
Modelo estrella
En el esquema de estrella, el centro de la estrella puede tener una tabla de hechos y varias tablas de dimensiones
asociadas. Se conoce como esquema estelar ya que su estructura se asemeja a una estrella. El esquema en estrella
es el tipo más simple de esquema de Data Warehouse. También se conoce como Star Join Schema y está
optimizado para consultar grandes conjuntos de datos.
Las tablas de dimensiones tendrán siempre una clave primaria simple, mientras que en la tabla de hechos, la clave
principal estará compuesta por las claves principales de las tablas dimensionales.

33
Modelo Copo de nieve
Un esquema de copo de nieve es una extensión de un esquema de estrella y agrega dimensiones adicionales.
La finalidad es normalizar las tablas y así reducir el espacio de almacenamiento al eliminar la redundancia de datos,
pero tiene la contrapartida de generar peores rendimientos al tener que crear más tablas de dimensiones y más
relaciones entre las tablas (JOINs) lo que tiene un impacto directo sobre el rendimiento.

34
Elementos que no pueden faltar

35
DataWarehouse vs DataMart

36
DataWarehouse vs DataMart

37
DataWarehouse vs DataMart

38
CRM Customer Relationship Managment

Un CRM es un software que contiene toda la información de los clientes, partners y stakeholders de una
empresa y que es capaz de compartirla con todas las áreas clave de la compañía como ventas,
marketing, atención al cliente o Field Service.

Su principal beneficio es que ayuda a las empresas a obtener más clientes y a retener a los actuales.

39
CRM Customer Relationship Managment

La principal característica de un CRM es que permite centralizar en una única base de datos todas
las interacciones entre los clientes y tu negocio. Al tener toda esta información en un solo sistema,
las empresas pueden recopilar, rastrear y fortalecer las relaciones con los clientes, permitiéndoles
comprender, predecir y satisfacer mejor sus necesidades.

El objetivo final de un CRM es brindar la mejor experiencia de cliente mediante una mejora en la
satisfacción, la retención y el servicio.

Otra característica de un CRM es la visión única que ofrece del cliente. Gracias a esto, las empresas
pueden compartir el conocimiento y maximizar la eficiencia de las ventas, las acciones de
marketing y el servicio de atención al cliente.

Por otro lado, los sistemas de CRM también ayudan a administrar las interacciones no solo con tu
base de clientes, sino también con tus prospects, socios y proveedores externos.

40
CRM Caracteristicas
Gestión de contactos:
Almacena la información de los contactos, como el nombre, la dirección y las
cuentas de redes sociales en una base de datos con opción de búsqueda.

Seguimiento de interacciones:
Incorpora notas y hace un seguimiento del historial de interacciones para
documentar las conversaciones con determinados contactos.

Gestión de oportunidades de venta:


Convertir prospectos en clientes potenciales mediante identificar y puntuarlos.

Gestión de documentos:
Crea y envía presupuestos y propuestas a los clientes.

Gestión de canales:
Consulta una perspectiva general de todo el canal de ventas, así como del
estado y los avances que se llevan a cabo en las diferentes fases del proceso.

41
CRM Características
Automatización del flujo de trabajo:
rea flujos de trabajo que activan diferentes acciones o que envían recordatorios
de las actividades que se deben llevar a cabo a continuación de forma que se
automaticen las tareas más repetitivas.

Elaboración de informes o analíticas:


Genera informes rutinarios resumidos de las cifras de venta o del rendimiento
de los representantes de forma diaria, semanal, mensual, etc.

Predicciones:
Genera predicciones sobre las cifras de venta o los ingresos por proyecto que
obtendrás en el futuro a partir de los datos y las tendencias actuales y del
pasado.

Omnicanalidad:
se refiere a integrar todos los diferentes canales de comunicación que tienes en
tu negocio, en un solo lugar. Comienzo en Home banking y termino el trámite
por teléfono o en una sucursal.
42
Diferencias entre CRM y ERP

La sigla ERP corresponde a Enterprise Resource Planning. Se trata de un sistema


basado en soluciones informáticas de gestión de procesos organizacionales,
especialmente procesos financieros
(como cuentas a pagar, emisión de facturas y planificación).

43
Bases de datos OLTP y OLAP

OLAP y OLTP son ambos sistemas de procesamiento en línea, pero son ligeramente
diferentes. Mientras que OLAP es un sistema de procesamiento analítico, OLTP es un
sistema de procesamiento transaccional.

OLTP - On-Line Transactional Processing:

Consiste en ejecutar una serie de transacciones que ocurren simultáneamente, en la banca en línea, las
compras, la entrada de pedidos o el envío de mensajes de texto podrían ser ejemplos.

Los sistemas OLTP están detrás de muchas transacciones diarias.


Procesa una gran cantidad de transacciones simples, generalmente actualizaciones, eliminaciones de datos
e inserciones.
Admite procesamiento rápido con tiempos de respuesta calculados en milisegundos.

Permanece disponible las 24 horas del día, los 7 días de la semana con copias de
seguridad incrementales constantes.

44
Bases de datos OLTP
Por ejemplo, supongamos que una pareja tiene una cuenta conjunta en un banco. Un
día ambos llegan a diferentes cajeros automáticos simultáneamente e intentan retirar
el monto total presente en la cuenta conjunta.
En este caso, el sistema de software OLTP asegura que el monto retirado sea menor
que el monto presente en el banco. Por lo tanto, el punto clave aquí es que los
sistemas OLTP están diseñados para la superioridad de las transacciones en lugar del
análisis de datos.

Los sistemas OLTP implican tomar información transaccional, procesar datos y


actualizar la base de datos de back-end para mostrar la nueva entrada.

OLTP se usa para ejecutar transacciones de bases de datos que generan los
trabajadores de front-end, por ejemplo, cajeros de un banco.

Las aplicaciones de autoservicio del cliente, como el comercio electrónico, los viajes y
la banca en línea, también generan transacciones en la base de datos en línea.

45
Bases de datos OLAP
El procesamiento analítico en línea (OLAP) es un sistema de procesamiento en línea que realiza análisis
multidimensionales en grandes volúmenes de datos a alta velocidad.

Este análisis suele implicar, generalmente, la lectura de grandes cantidades de datos


para llegar a extraer algún tipo de información útil: tendencias de ventas, patrones de
comportamiento de los consumidores,
elaboración de informes complejos… etc.
Este tipo de datos proviene de un data mart, un almacén de datos centralizado o almacenamiento de datos.

Un sistema OLAP es ideal para cálculos analíticos complejos, inteligencia empresarial ,


extracción de datos y funciones de generación de informes empresariales, como
elaboración de presupuestos, previsión de ventas y análisis financiero.

Además, el cubo OLAP, que es el núcleo de las bases de datos OLAP, le permite
informar, consultar y analizar rápidamente datos multidimensionales. Aquí, la
dimensión de datos puede denominarse el elemento de un conjunto de datos
específico.

46
Bases de datos OLAP
Cubo (OLAP): Información pre-agregada con todas las combinaciones posibles de las perspectivas incluidas
y de esta forma visualizar las métricas que le interesen al usuario.
Las estructuras multidimensionales están compuestas por dimensiones y métricas. Las dimensiones, a su
vez, tienen jerarquías y niveles. Un ejemplo es la dimensión de regiones geográficas, que tiene como nivel
más alto a los continentes, en segundo nivel se encuentran los países, en tercer nivel están los estados y el
nivel más bajo serían los municipios.

47
Modelos de Almacenamientos

Holap: (Híbrido)

Estos sistemas mantienen los registros detallados en la base de datos relacional, mientras
que los datos resumidos o agregados se almacenan en una base de datos multidimensional
separada.

48
Bases de datos OLAP
Video: [Link]

49
Modelos de Almacenamientos
Molap:

En estos sistemas, los datos se encuentran almacenados en una estructura


multidimensional.
Para optimizar los tiempos de respuesta, el resumen de la información es usualmente
calculado por adelantado. Estos valores pre-calculados o agregaciones son la base de
las ganancias de desempeño de este sistema. MOLAP requiere unos cálculos
intensivos de compilación.
Algunos sistemas utilizan técnicas de compresión de datos para disminuir el espacio
de almacenamiento en disco debido a los valores precalculados.

Ventajas Desventajas

50
Modelos de Almacenamientos
Rolap:

Son sistemas en los cuales los datos se encuentran almacenadas en una base de datos
relacional. Típicamente, los datos son detallados, evitando las agregaciones y las tablas se
encuentran normalizadas.
Los esquemas más comunes sobre los que se trabaja son estrella o copo de nieve, aunque
es posible trabajar sobre cualquier base de datos relacional.

Ventajas Desventajas

51
Modelos de Almacenamientos
ROLAP delega la negociación entre tiempo de respuesta y el proceso batch al diseño del
sistema. Mientras, el MOLAP, suele requerir que sus bases de datos se precompilen para
conseguir un rendimiento aceptable en las consultas, incrementando los requerimientos
batch.

Los sistemas con alta volatilidad de los datos (aquellos en los que cambian las reglas de
agregación y consolidación), requieren una arquitectura que pueda realizar esta
consolidación ad-hoc. Los sistemas ROLAP soportan bien esta consolidación dinámica,
mientras que los MOLAP están más orientados hacia consolidaciones batch.

ROLAP pueden crecer hasta un gran número de dimensiones, mientras que los MOLAP
generalmente son adecuados para diez o menos dimensiones.

ROLAP soportan análisis OLAP contra grandes volúmenes de datos elementales, mientras
que los MOLAP se comportan razonablemente en volúmenes más reducidos (menos de 5
Gb).

ROLAP es una arquitectura flexible y general, que crece para dar soporte a amplios
52
requerimientos OLAP. MOLAP es una solución particular, adecuada para soluciones

También podría gustarte