EXPLORANDO
BASES DE DATOS
RELACIONALES Y NO
RELACIONALES: SU
IMPACTO EN EL MUNDO
DEL BIG DATA.
ELABORADO POR:
• CRISTOPHER SOSA
• JESUS GALLEGOS
• ROBERTO RAMIREZ
• JOSE CAMPOS
¿Que es una
base de
datos?
Una base de datos es un
sistema organizado para
almacenar, gestionar y
recuperar grandes
cantidades de datos de
manera eficiente. Los datos
se guardan de forma
estructurada, lo que permite
que se puedan consultar,
modificar y actualizar de
manera rápida y sencilla.
TIPOS DE BASES DE DATOS
• Base de Datos Relacional (RDBMS) • Base de Datos No Relacional
Son sistemas organizados en tablas que se (NoSQL)
relacionan entre sí mediante claves Son sistemas flexibles que no siguen el
primarias y foráneas. Utilizan un lenguaje modelo de tablas. Están diseñados para
estructurado, como SQL, para manipular manejar grandes volúmenes de datos no
datos. Son ideales para datos estructurados y estructurados o semi estructurados. Ofrecen
transacciones complejas (ej., MySQL, mayor escalabilidad y rendimiento en
PostgreSQL). ambientes distribuidos.
La Big Data: Se refiere al manejo de grandes volúmenes de
datos, tanto estructurados como no estructurados, que son
demasiado grandes o complejos para ser procesados por las
bases de datos tradicionales. Big Data utiliza herramientas
como Hadoop y Spark para almacenar, procesar y analizar estos
datos a gran escala.
Diferencias clave entre BD relacionales y no relacionales.
Característica Relacional (RDBMS) No Relacional (NoSQL)
Tablas, filas y columnas Documentos, clave-valor, columnas,
Modelo de Datos grafos
Esquema rígido y predefinido Esquema flexible y dinámico
Esquema
Escalabilidad vertical (hardware más Escalabilidad horizontal (distribución
Escalabilidad potente) en múltiples servidores)
SQL (lenguaje estructurado de Consultas específicas según el
Consultas consulta) modelo de base de datos
Mejor para datos estructurados y Mejor para grandes volúmenes de
Rendimiento y relaciones complejas datos no estructurados o flexibles
Flexibilidad
Aplicaciones transaccionales, Aplicaciones web, Big Data, redes
Casos de Uso financieras, ERP, etc. sociales, etc.
Las bases de datos no relacionales y las
herramientas de Big Data están diseñadas para
manejar grandes volúmenes de datos de manera
¿Cómo las Bases de eficiente, superando las limitaciones de las bases de
datos tradicionales.
Datos No
•Bases de datos no relacionales (NoSQL):
Relacionales y las Utilizan esquemas flexibles y se distribuyen en
Herramientas de Big múltiples servidores, lo que permite almacenar y
procesar datos no estructurados o semi-
Data Abordan los estructurados, como texto, imágenes o videos, de
Desafíos de los manera rápida y escalable.
Grandes Volúmenes •Herramientas de Big Data: Como Hadoop o
Spark, dividen los datos en fragmentos que se
de Datos? procesan simultáneamente en múltiples máquinas,
acelerando el análisis y permitiendo obtener
resultados incluso con conjuntos de datos masivos.
Ambas tecnologías priorizan velocidad, escalabilidad
y flexibilidad, adaptándose a las necesidades
actuales de las empresas para extraer valor de
USOS PRACTICOS EN
LAS BASES DE DATOS
Bases de Datos Relacionales: Son ideales para
sistemas con datos estructurados y relaciones
definidas, como bancos o inventarios, donde la
integridad y consistencia de los datos son
esenciales.
Bases de Datos No Relacionales: Adecuadas para
manejar datos no estructurados o
semiestructurados y aplicaciones que requieren
escalabilidad, como redes sociales o sistemas de
recomendaciones.
Big Data en Industrias:
• Comercio Electrónico: Personaliza
recomendaciones y optimiza precios.
• Salud: Mejora diagnósticos y tratamientos con
análisis masivos.
• Meteorología: Predice fenómenos climáticos con
datos de sensores y satélites.
VENTAJAS Y
DESVENTAJAS
DE CADA
ENFOQUE
BASE DE DATOS RELACIONAL
VENTAJAS DESVENTAJAS
• Estructura clara: Organización mediante • Rendimiento: Baja eficiencia con grandes
tablas facilita el manejo de datos. volúmenes de datos.
• SQL estándar: Simplifica consultas complejas. • Esquema rígido: Difícil adaptación a cambios.
• Integridad: Garantiza precisión y evita • Escalado limitado: Costoso al aumentar
duplicidades. hardware.
• Transacciones ACID: Fiabilidad en • Complejidad: Requiere optimización
operaciones críticas. especializada para consultas avanzadas.
• Madurez y soporte: Amplia comunidad y
herramientas disponibles.
BASE DE DATOS NO RELACIONAL
VENTAJAS DESVENTAJAS
• Flexibilidad: Manejo de datos no • Sin ACID: Menos consistencia que las
estructurados. relacionales.
• Escalabilidad horizontal: Ideal para grandes • Incompatibilidad con SQL: Uso de lenguajes
volúmenes de información. alternativos.
• Alto rendimiento: Adaptadas a modelos • Sin estándares claros: Problemas de
específicos. compatibilidad.
• APIs exclusivas: Gestión eficiente según el • Soporte limitado: Al ser mayormente de
tipo de datos. código abierto.
BIG DATA
VENTAJAS DESVENTAJAS
• Decisiones rápidas: Análisis en tiempo real. • Costo alto: Infraestructura y personal
especializado.
• Conocimiento de mercado: Identificación de
tendencias y preferencias. • Complejidad: Tecnologías avanzadas difíciles de
manejar.
• Optimización: Mejora de procesos internos y
reducción de costos. • Privacidad: Riesgos en el manejo de datos
personales.
• Personalización: Adaptación de productos a
• Calidad de datos: Información inconsistente
los clientes. puede afectar análisis.
• Detección de fraudes: Identificación de • Sobrecarga: Exceso de datos dificulta la
patrones inusuales. relevancia.
• Innovación: Desarrollo de nuevas • Dependencia tecnológica: Vulnerabilidad ante
oportunidades y productos. fallos y ataques
La Evolución de las Bases de Datos:
Convergencia de SQL y NoSQL en la Era
Bases de datos híbridas: Combinan modelosdel Big
relacionales (SQL) y Data
no
relacionales (NoSQL), permitiendo almacenar y consultar datos
estructurados y no estructurados de manera eficiente.
Ejemplo: Microsoft Azure Cosmos DB, una base de datos multimodelo que
soporta documentos, claves-valor, gráficos y tablas, optimizada para Big
Data.
Sistemas multimodelo: Integran diferentes paradigmas de bases de datos
en un único sistema para mejorar la flexibilidad y eficiencia.
Ejemplo: ArangoDB, que permite trabajar con grafos, documentos y datos
clave-valor en una sola plataforma.
Integración con ecosistemas de Big Data: Las herramientas como Apache
Hive y Presto permiten usar sintaxis SQL en datos almacenados en sistemas
distribuidos como Hadoop o Amazon S3.
Plataformas de análisis avanzado: Google BigQuery utiliza una arquitectura
columnar optimizada para análisis en tiempo real de grandes volúmenes de
datos, facilitando consultas a escala petabyte.
• Netflix
Tecnología usada: Apache Cassandra (NoSQL) para gestionar datos de
usuarios y recomendaciones.
Propósito: Manejar grandes volúmenes de datos no estructurados y
EMPRESAS ofrecer experiencias personalizadas en tiempo real.
• Amazon
POPULARE Tecnología usada: DynamoDB (NoSQL) para catálogos y sistemas de
inventarios. También usa Redshift (SQL) para análisis de datos a gran escala.
S Y SU Propósito: Gestionar compras, inventarios y análisis de comportamiento
del cliente.
RELACION • Uber
Tecnología usada: MySQL (relacional) para datos transaccionales, y Redis
CON LAS (NoSQL) para precios dinámicos en tiempo real.
Propósito: Garantizar una experiencia rápida y eficiente para conductores y
BD
usuarios.
• Spotify
Tecnología usada: PostgreSQL (relacional) para información estructurada y
Cassandra (NoSQL) para almacenar datos de reproducciones de canciones.
Propósito: Gestionar datos de usuarios y personalizar recomendaciones
musicales.