Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
Soluciones de
Inteligencia de
Negocios
Tema Nº2:
TEMA
Base 01
de Datos OLTP –Teoría
OLAP de los
TEMA de
Indicador Nº2:
logro Nº2:
Identifica fundamentos de las bases de datos OLTP y OLAP, diferencia entre un
data Mining y Big Data haciendo uso de los conocimientos impartidos.
1
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
Base de Datos OLTP – OLAP
Subtema 1.1:
Conceptos Base de Datos OLTP – OLAP
MARCO TEÓRICO
OLTP
Se caracteriza por bases de datos transaccionales con una gran cantidad de transacciones cortas (INSERT,
DELETE, UPDATE) on-line. Suelen ser BD de sistemas críticos como ERP, CRM, etc.
OLAP
Se caracteriza por ser un modelo con volumen de transacciones bajo. Hay dos
modelos: multidimensional o tabular y están optimizadas para leer datos que normalmente implican
agregaciones y donde el tiempo de respuesta de consulta de datos debe ser rápido (es una medida de
efectividad). Normalmente hay información histórica agregada almacenada en esquemas multidimensionales
(generalmente esquema en estrella).
Almacén operacional de datos, también llamado ODS (del inglés Operational Data Store), es un
contenedor de datos activos, es decir, está diseñado para integrar datos de múltiples fuentes con los
que realizar operaciones adicionales en los propios datos. A diferencia de un almacén de datos
maestro, los datos no vuelven de nuevo a los sistemas operacionales de origen, sino que se preparan
para la realización de otras operaciones o para ser incorporados a un almacén de datos (o data
warehouse) para ser explotados en la realización de informes. Por tanto, se puede decir que un
sistema ODS estará ubicado entre uno o varios sistemas OLTP (origen) y un sistema OLAP
(destino).
Un sistema OLTP diría qué facturas no han sido liquidadas, el monto que falta por liquidar de cada
una, cuando se espera que se paguen etc.
Un sistema OLAP diría cuanto debe un cliente, cuantas facturas son, el promedio de días que tarda
en pagar.
En un ODS un gerente podría enterarse a grandes rasgos si el cliente está listo para un cambio en los
límites de crédito, si se puede o debe reestructurar la deuda y algunas otras notas que le haya escrito
su predecesor o algún otro empleado.
Hoy día se considera que la estructura informática de una empresa madura contiene OLTPs + ODS +
Data warehouse + OLAPs + Minería de datos.
Subtema 1.2:
Data Mining / BigData
MARCO TEÓRICO
Data Mining
Es un proceso para detectar información de conjuntos grandes de datos, de la manera más
automáticamente posible. Su objetivo es encontrar patrones, tendencias o reglas que expliquen el
comportamiento de los datos en un contexto específico.
Big Data
Es un término que describe el gran volumen de datos, tanto estructurados como no estructurados, que
2
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
inundan los negocios cada día. Pero no es la cantidad de datos lo que es importante. Lo que importa
con el Big Data es lo que las organizaciones hacen con los datos.
1. MATERIALES
Según la experiencia a realizar, de acuerdo al catálogo de equipamiento del taller.
a) EQUIPOS
Computadora personal o Laptop.
b) HERRAMIENTAS
Bloc de Notas, Excel y SQL Server.
c) CONSUMIBLES
a. Archivo Excel, proporcionado por Almacén, conteniendo los datos de los productos,
categorías de productos y proveedor del producto.
b. Archivo Texto, proporcionado por Personal, conteniendo los datos de todos los empleados
que intervienen en el proceso de Ventas.
c. Script SQL con estructuras de las tablas de Ventas, proporcionado por el área de Sistemas.
d. Script SQL con datos de las tablas de Ventas, proporcionado por el área de Sistemas.
2. Abrir el SQL Server Management Studio para crear una Base de Datos de tipo Stage o Landing
3. Crear la estructura de la tabla Personal.
3
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
4. Crear la estructura de la tabla Categorías.
5. Crear la estructura de la tabla Proveedores
4
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
6. Crear la estructura de la tabla Productos.
5
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
7. Luego, abrir el Visual Studio 2019 Data Tools, para crear un nuevo proyecto de Integration
Services.
8. Le damos un nombre a nuestro proyecto: ETL_STG_NW.
9. Seguidamente creamos un objeto de tipo Execute SQL Task, donde colocaremos las instrucciones
necesarias para tener las tablas de la BD STAGE sin datos.
10. En propiedades del objeto le agregamos a la propiedad Connection una conexión a la Base de
Datos STG_NW.:
6
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
11. En la propiedad SQLStatement, le colocamos el siguiente código, para limpiar el contenido de las
tablas existentes:
12. La propiedad BypassPrepare debe de encontrarse en False, luego Aceptar.
13. Creamos un objeto de tipo Data Flow Task, que servirá para recuperar los datos de las Categorías
desde el archivo en Excel.
7
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
14. Ingresamos al objeto Data Flow Task con nombre Categorías y procedemos a crear los siguientes
objetos:
15. El objeto de tipo Excel Source, nos permitirá acceder al archivo en Excel, específicamente a la hoja
que contiene los datos de las categorías, para ello debemos configurar la conexión que utilizará el
archivo en Excel.
8
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
16. Luego especificamos la hoja de la cual tomaremos los datos.
9
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
17. Seguidamente seleccionaremos los campos que serán utilizados.
18. Con el objeto Data Convertion, procederemos a realizar cambios de ajustes en cuanto a tipos
de datos y longitudes de los campos utilizados.
19. En el objeto de tipo OLE DB Destination indicaremos como serán recibidos los datos, en este
10
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
caso apuntaremos a la BD STG_NW, tabla Categorías.
20. Con la opción Mappings procederemos a indicar que campos serán utilizados para la recepción
de datos.
11
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
21. Agregamos un control de tipo Data Flow Task para cargar los datos de los proveedores que se
encuentran en el archivo en Excel.
22. El objeto Excel Source nos permitirá conectarnos al archivo de Excel para recuperar los datos
de proveedor, para este caso no es necesario volver a crear la conexión puesto que se utiliza el
ya existente.
12
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
23. Los campos para utilizar son los siguientes:
24. Con el control Data Convertion procederemos a realizar los ajustes con los datos, como son el tipo y la
longitud.
13
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
25. Finalmente, usamos un objeto de tipo OLE DB Destination para recepcionar los datos en la
tabla Proveedor de la BD STG_NW.
26. Emparejamos los campos de origen con los de destino, considerando aquellos que fueron
convertidos.
14
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
27. Agregamos un nuevo control de tipo Data Flow Task para recuperar los datos de los productos.
28. Este control nos permitirá recibir los datos desde el archivo de Excel hacia la BD STG_NW.
15
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
29. El control de tipo Excel Source apuntará al archivo de Excel para recuperar los datos de los
productos.
16
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
30. Los campos para usar son los siguientes:
31. Se realizará un ajuste en los tipos de datos y las longitudes para que puedan ser recibidos en la
BD.
17
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
32. Ahora usamos un control de tipo OLE DB Destination para que pueda recibir los datos la tabla
Producto.
18
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
33. Seguidamente se enlazan las parejas de datos.
19
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
34. Ahora procederemos a recuperar los datos de los empleados desde el archivo de texto.
35. Se utilizarán los siguientes controles para recuperar los datos desde el archivo de texto hacia la
BD STG_NW.
20
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
36. Desde el control de tipo Flat File Source apuntamos al archivo de texto de empleados.
21
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
37. Se indican las columnas a utilizar, especificando el tipo de salto de registro y delimitador de
columna.
22
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
38. Validamos los campos que serán utilizados.
23
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
39. Con el objeto Data Conversion procedemos a validar los tipos de datos y sus longitudes.
24
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
40. Luego apuntamos a la tabla de destino Employees.
25
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
41. Seguidamente emparejamos los campos de origen con los de destino.
42. Finalmente, ejecutamos el proyecto, debiéndose mostrar de la siguiente manera:
26
Guía 2 Escuela de Soluciones de Inteligencia de Negocios
Tecnología
ACTIVIDAD VIRTUAL:
Ingresa a la plataforma virtual, luego desarrolla la siguiente actividad propuesta:
a) ¿Cuál es el objetivo de tener los datos en una Base de Datos Operacional?
b) ¿Es necesario que todas las tablas se encuentren relacionas? Explique
c) ¿Es necesario que se apliquen restricciones en las tablas ODS? Comente
d) ¿Las Bases de Datos Stage y ODS se pueden encontrar en el mismo servidor?
Explique
e) Con la experiencia obtenida ¿Qué problemas tuvo para implementar el modelo
de BD ODS? Comente
CONCLUSIONES DE LA EXPERIENCIA
__________________________________________________________________________
__________________________________________________________________________
__________________________________________________________________________
__________________________________________
27