DATA WAREHOUSE
Diego Fernando Moreno Valencia - 2220224
Jaime Steven Lopez Vega - 2220222
Johan Edelberto Hurtado Enriquez - 2220752
Juan Jose Rendon Jaramillo - 2221941
FACULTAD DE INGENIERÍA
Ingeniería de Datos e Inteligencia Artificial
Almacenamiento de datos
Lyda Peña Paz
Santiago de Cali, Valle del Cauca
02/08/2023
Data Warehouse
¿Qué es data Warehouse?
Un almacén de datos es un tipo de sistema de gestión de datos diseñado para habilitar y dar
soporte a las tareas de inteligencia empresarial (BI), especialmente las analíticas. Los data
warehouses solo se han diseñado para realizar consultas y tareas de análisis, y suelen contener
grandes cantidades de datos históricos. A menudo, la información dentro de un data warehouse
proviene de una amplia gama de fuentes, como los archivos de registro de aplicaciones o las
aplicaciones de transacciones.
¿Cómo funciona y su arquitectura?
Un almacenamiento de datos es algo más que un solo silo que funciona por sí mismo. En su lugar,
se trata de un sistema muy estructurado y cuidadosamente diseñado compuesto por varios niveles
que interactúan con los datos (y entre ellos) de maneras diferentes. Normalmente, estos niveles
incluyen:
1. El nivel inferior
Los datos se ingieren desde varios orígenes y, a continuación, se limpian y transforman para
que otras aplicaciones los usen en un proceso denominado extracción, transformación y carga
(ETL). El nivel inferior también es donde se almacenan y optimizan los datos, lo que lleva a
tiempos de consulta más rápidos y a un mejor rendimiento general.
2. Nivel intermedio
Aquí encontrará el motor de análisis, también conocido como servidor de procesamiento
analítico en línea (OLAP). Los servidores OLAP acceden a grandes volúmenes de datos del
almacenamiento de datos a alta velocidad, lo que da lugar a resultados muy rápidos.
3. Nivel superior
El nivel superior es donde la interfaz front-end presenta visualmente los datos procesados, a
los que los analistas pueden acceder y usar para todas sus necesidades de inteligencia
empresarial de informes y autoservicio.
Beneficios de la data Warehouse
Los datos confiables, especialmente cuando se agregan con el tiempo, ayudan a los usuarios a
tomar decisiones más inteligentes e informadas sobre la forma en que gestionan su organización, y
los almacenes de datos son lo que hace posible esto. Las ventajas del almacenamiento de datos
empresariales son múltiples, pero algunas de las ventajas más increíbles son:
● Consolidación de datos de varios orígenes en un único origen de verdad
● Almacenamiento y análisis de datos históricos a largo plazo que abarcan meses y años
● Limpieza y transformación de datos para que sean precisos, coherentes y estandarizados
en estructura y forma
● Reducción de los tiempos de consulta al recopilar datos y procesar análisis, lo que mejora
el rendimiento general de todos los sistemas
● Carga eficaz de datos sin tener que hacer frente a los costos de implementación o
infraestructura
● Protección de datos para que sean privados, protegidos y seguros
● Preparación de datos para el análisis mediante minería de datos, herramientas de
visualización y otras formas de análisis avanzado
Tipos de Data Warehouse
Podemos diferenciar 3 categorías principales de Data Warehouses.
1. Los “Data Warehouse de Empresas” (EDW en inglés), son depósitos de datos centralizados
que permiten orientar las decisiones de la empresa. Unifica toda la información de una
organización para que toda la empresa pueda tener acceso. Ofrece un servicio en el que
apoya la toma de decisiones en la empresa. Se enfoca principalmente en organizar y
representar los datos, también se obtiene la capacidad de clasificar los datos según el
usuario y dar acceso de acuerdo a las restricciones internas.
2. Data Stores Operacionales Los datos se actualizan en tiempo real, lo que los hace muy
útiles para actividades cotidianas como el registro de informes y de empleados.
3. Data Mart es una subcategoría de Data Warehouse. Está concebida para empresas de
sectores de la venta o las finanzas. Los datos pueden ser recolectados desde diversas
fuentes. Tiene diversas funciones como organizar la información para posteriormente
analizarla, realizar indicadores (KPI), evaluar los objetivos del sector que se está
analizando, etc. El objetivo es realizar un análisis detallado sobre lo que ocurre en un
negocio.
Creación de un Data Warehouse
Al diseñar y crear un almacenamiento de datos, es importante tener en cuenta los objetivos de la
organización, tanto a largo plazo como ad hoc, así como la naturaleza de los datos. ¿Cuántos
orígenes de datos está integrando? ¿Tiene previsto automatizar los flujos de trabajo? ¿Cómo
explorará y analizará los datos? La compilación variará en función de la complejidad de sus
necesidades, pero un almacén de base de datos empresarial típico podría constar de los siguientes
componentes:
1. fuentes de datos que extraen datos operativos de los sistemas de punto de venta,
aplicaciones empresariales y otras bases de datos relacionales
2. Un área de almacenamiento provisional donde los datos se limpian y transforman para el
almacén o repositorio centralizado
3. Un almacén o repositorio centralizado que almacena datos operativos procesados,
metadatos, datos de resumen y datos sin procesar para facilitar el acceso a los usuarios
4. La adición de data marts, que toman datos del repositorio centralizado y los sirven en
subconjuntos a grupos seleccionados de usuarios
5. Un espacio aislado que pueden usar para probar nuevas formas de exploración de datos
en un entorno protegido
6. Una amplia variedad de herramientas de almacenamiento de datos, marcos y API para la
integración, el almacenamiento, el rendimiento y el análisis
¿Como se podría usar el Data Warehouse en nuestra tienda “Sabor tostado” ?:
1. Gestión de Inventarios: Un Data Warehouse puede almacenar datos sobre el
inventario de café gourmet, incluyendo la cantidad disponible, los niveles de stock, la
rotación de productos y las fechas de vencimiento. Esto permite a la empresa
mantener un control preciso del inventario y optimizar el abastecimiento según la
demanda.
2. Previsión de Demanda: Utilizando técnicas de análisis de datos en el Data Warehouse,
se pueden realizar pronósticos precisos de la demanda futura de café gourmet. Esto
ayuda a planificar la producción y el abastecimiento de manera más eficiente, evitando
faltantes o excesos de inventario.
3. Gestión de Proveedores: Un Data Warehouse puede almacenar datos relacionados
con los proveedores de café gourmet, incluyendo la calidad de los granos, los tiempos
de entrega y los precios. Esto facilita el seguimiento y la evaluación de los proveedores,
asegurando una relación sólida y eficiente con ellos.
4. Seguimiento de Calidad: Almacenar datos sobre la calidad de los granos de café
entregados por cada proveedor permite evaluar la consistencia y la calidad de los
productos recibidos. Esto ayuda a identificar proveedores que proporcionan granos de
alta calidad de manera consistente, lo que es fundamental para mantener la calidad
del café gourmet que ofreces a tus clientes mayoristas.
5. Gestión de Inventarios en Origen: Un Data Warehouse puede rastrear el inventario
disponible en las regiones de origen donde se cultivan los granos de café. Esto ayuda a
tener una visión clara del inventario de los proveedores, facilitando la planificación y la
coordinación de las compras.
6. Colaboración en la Mejora Continua: Un Data Warehouse puede ser utilizado para
compartir información relevante con los proveedores y colaborar en proyectos de
mejora continua. Esto incluye el intercambio de datos sobre la satisfacción de los
clientes, las preferencias del mercado, y la retroalimentación recibida, lo que puede
ayudar a los proveedores a mejorar su producción y ofrecer granos de café que se
adapten mejor a las necesidades del negocio.
7. Seguimiento de Acuerdos Contractuales: El Data Warehouse puede ayudar a
mantener un registro de los acuerdos contractuales y términos negociados con cada
proveedor, incluyendo precios, volúmenes de compra y plazos de entrega. Esto
garantiza que ambas partes cumplan con los términos acordados y facilita el
seguimiento de los compromisos.
Referencias:
Data Warehouse: ¿qué es y cómo utilizarlo? (2022, enero 10). Formation Data Science |
[Link].
[Link]
Mendez, A., & -Martínez, G. (2003). Fundamentos de Data Warehouse. [Link].
[Link]
[Link]
Mendoza, A. (2020, diciembre 10). Tipos de Data Warehouse. [Link]; Business
Intelligence, Data Warehouse, Monterrey, México : Gravitar.
[Link]
(S/f). [Link]. Recuperado el 10 de agosto de 2023, de
[Link]
a-data-warehouse/#data-warehouse-definition