Universidad Católica de Honduras
Nuestra Señora Reina de la Paz
Campus Dios Espíritu Santo
Alumno
0601200500297 Miguel Antonio Flores Cerrato
0601200502177 Astrid Nicoll Gonzáles Herrera
0601200622475 Kenny Daniel Arias Canales
0606200501345 Olman Elías Martínez Muñóz
Docente
Ing. Jarvin Calderón
Clase
Base de datos multidimensional
Fecha
03/02/2025
¿Qué es un data mart?
Un data mart es una forma sencilla de almacén de datos centrado en un único
asunto o línea de negocio. Con un data mart, los equipos pueden acceder a los datos y
obtener información más rápidamente, ya que no tienen que dedicar tiempo a buscar en
un almacén de datos más complejo o consignar manualmente datos de diferentes orígenes.
¿Por qué crear un data mart?
Un data mart proporciona un acceso más fácil a los datos requeridos por un equipo
específico o una línea de negocio dentro de la organización. Por ejemplo, si tu equipo de
marketing busca datos para ayudar a mejorar el rendimiento de la campaña durante la
temporada de vacaciones, eliminar y combinar los datos dispersos en varios sistemas
podría resultar costoso en términos de tiempo, precisión y, en última instancia, dinero.
Los equipos obligados a localizar datos de diversos orígenes dependen con mayor
frecuencia de hojas de cálculo para compartir la información y colaborar. Esto suele dar
lugar a errores humanos, confusión, conciliaciones complejas y múltiples fuentes de
verdad, la llamada "pesadilla de las hojas de cálculo". Los data marts se han vuelto
populares como un lugar centralizado donde se recopilan y organizan los datos necesarios
antes de crear informes, paneles de control y visualizaciones.
La diferencia entre data marts, lagos de datos y almacenes de datos
Los data marts, lagos de datos y almacenes de datos tienen diferentes propósitos
y necesidades.
- Un almacén de datos es un sistema de gestión de datos diseñado para soportar
análisis e inteligencia empresarial para toda una organización. Los almacenes de
datos suelen contener grandes cantidades de datos, incluidos los datos históricos.
Los datos de un almacén de datos normalmente provienen de una amplia gama de
fuentes, como los archivos de registro de aplicaciones y las aplicaciones
transaccionales Un almacén de datos almacena datos estructurados, cuyo objetivo
suele ser bien definido.
- Un lago de datos permite a las organizaciones almacenar grandes cantidades de
datos estructurados y no estructurados (por ejemplo, de redes sociales o datos de
flujo de clics) y ponerlos inmediatamente a disposición para casos de uso de
análisis en tiempo real, ciencia de datos y aprendizaje automático. Con un lago de
datos, los datos se ingresan en su forma original, sin alteraciones.
La diferencia clave entre un lago de datos y un almacén de datos es que los lagos de datos
almacenan grandes cantidades de datos no procesados, sin una estructura predefinida.
Las organizaciones no necesitan saber con antelación cómo se utilizarán los datos.
- Un data mart es una forma sencilla de un almacén de datos que se centra en un
único tema o línea de negocio, como ventas, finanzas o marketing. Dado su
enfoque, los data marts obtienen datos de menos orígenes que los almacenes de
datos. Las fuentes de datos de un data mart pueden incluir sistemas operativos
internos, un almacén de datos central y datos externos.
Beneficios de un data mart
1. Rentabilidad
2. Acceso a datos simplificado
3. Acceso más rápido a insights
4. Mantenimiento de datos más sencillo
5. Implementación más fácil y rápida
Tipos de data marts
1. Data marts dependientes
2. Data marts independientes
3. Data marts híbridos
Estructura de un data mart
Un data mart es una base de datos relacional orientada por temas que almacena
datos transaccionales en filas y columnas, lo que facilita el acceso, la organización y la
comprensión.
Las empresas organizan los data marts en un esquema multidimensional como un
modelo para abordar las necesidades de las personas que utilizan las bases de datos para
tareas analíticas. Los tres tipos principales de esquema son estrella, copo de nieve y
bóveda.
Estrella
El esquema de estrella es una formación lógica de tablas en una base de datos
multidimensional que se asemeja a una forma de estrella. En este plano, una tabla de
hechos (un conjunto de métricas que se relaciona con un evento o proceso empresarial
específico) reside en el centro de la estrella, rodeada de varias tablas de dimensiones
asociadas.
No hay dependencia entre las tablas de dimensiones, por lo que un esquema en
estrella requiere menos combinaciones al escribir consultas. Esta estructura facilita las
consultas, por lo que los esquemas en estrella son muy eficientes para los analistas que
desean acceder a grandes conjuntos de datos y explorarlos.
Copo de nieve
El esquema de copo de nieve es una extensión lógica de un esquema de estrella,
que extiende el plano con tablas de dimensiones adicionales. Las tablas de dimensiones
están normalizadas para proteger la integridad de los datos y minimizar la redundancia de
datos.
Si bien este método requiere menos espacio para almacenar tablas de dimensiones,
es una estructura compleja que puede ser difícil de mantener. El principal beneficio de
usar el esquema de copo de nieve es la baja demanda de espacio en disco, pero puede
tener un impacto negativo en el rendimiento debido a las tablas adicionales.
Bóveda
La bóveda de datos es una técnica moderna de modelado de bases de datos que
permite a los profesionales de TI diseñar almacenes de datos empresariales ágiles. Este
enfoque aplica una estructura en capas y se ha desarrollado específicamente para combatir
los problemas que surgen cuando se utilizan los otros modelos de esquema con agilidad,
flexibilidad y escalabilidad.
La bóveda de datos elimina la necesidad de limpieza del esquema de estrella y
agiliza la adición de nuevas fuentes de datos sin interrumpir el esquema existente.