0% encontró este documento útil (0 votos)

142 vistas29 páginas

1 - Introducción A CockroachDB

Cargado por

John Perez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

142 vistas29 páginas

1 - Introducción A CockroachDB

Cargado por

John Perez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Introducción a

CockroachDB
Jordi Conesa i Caralt
Así en groso modo...
- Es un sistema gestor de base de datos NewSQL,
- A nivel de usuario sigue un modelo relacional,
- Garantiza las propiedades ACID,
- Es distribuida
- Permite autosharding y fragmentación manual,
- Usa información geográfica para
- promocionar la localidad de datos, y
- Garantizar la disponilidad / consistencia por
área geográfica.
- Permite replicación, y
- Escala horizontalmente.
- Gestiona los fallos de red de forma automática
Índice
- Origen de CockroachDB
- Características de CockroachDB
- Geoparticionamiento en CockroachDB
- Aspectos de diseño
Los inicios de CockroachDB
- Nace el 2015,
- De 3 ex-empleados de Google

- Inspirada en Google Spanner,

- Y si está basada en Spanner, ¿Por qué crear una nueva

BD?
- Porque Spanner es un producto gestionado por

Google, alojado en su nube y, por lo tanto, no es de

código libre ni descargable ni instalable en entornos
cliente.
- CockroachDB se concibió como alternativa a Spanner
en un entorno más abierto y accesible.
01

Características de
CockroachDB
Características
- Modelo de datos
- Utiliza SQL estándar (estándares ANSI SQL),
- Utiliza el protocolo de conexión de PostgreSQL,
- Utiliza las estrategias de optimización clásicas de los
entornos relacionales.
- A nivel transaccional
- Prima la consistencia antes que la disponibilidad
(consistencia fuerte),
- Garantiza las propiedades ACID (serializable).
- A nivel distribuido
- Ofrece escalabilidad horizontal,
- Ofrece una fragmentación / replicación sensibles a la
ubicación (usando zonas y regiones),
- Ofrece alta disponibilidad,
- Ofrece opciones de optimización adicionales.
- Portabilidad: se puede instalar en cualquier entorno.
Opciones de alojamiento
- Serverless
- Gestionado por Cockroach Labs,
- Acceso como un servicio de la nube,
- Pago por peticiones y almacenamiento
- A día de hoy gratuito hasta 50 millones de
peticiones y 10 GiB de almacenaje.
- Self-hosted
- Desplegable en un entorno propio,
- Existen descargables y ejecutables para Windows, Mac
y Linux,
- Existe una imagen Docker en Docker Hub.
- Cluster dedicado
- Gestionado por Cockroach Labs.

- ¡No se puede utilizar si se ofrece como un servicio!

Estructura interna de los datos
- Los datos se almacenan internamente siguiendo un modelo
clave-valor.
Arquitectura de distribución y replicación
- Utiliza autosharding para distribuir la información de la
base de datos en diferentes nodos,
- Da cierto margen al administrador de la base de

datos para indicar:

- la ubicación de los fragmentos o

- la ubicación de las réplicas destacadas.

- Respecto a la gestión de las réplicas, utiliza un sistema

de quórum basado en el algoritmo Raft.
Arquitectura de distribución

- Por defecto el tamaño de los fragmentos es de

- Un máximo de 512 MB y
- Un mínimo de 128 MB
- Cada fragmento contiene un conjunto de registros ordenado
alfabéticamente por su clave (fragmentación horizontal)
- Cada fragmento puede estar replicado
- El conjunto de réplicas de un fragmento se denomina
grupo de réplicas
Arquitectura de distribución

- Facilita las búsquedas por valor y por rango de la clave

primaria
Gestión de réplicas
- Utiliza el protocolo Raft para consensuar las escrituras
- Utiliza una arquitectura P2P
- Utiliza quórums para garantizar consistencia fuerte
- Un mínimo de 3 réplicas por fragmento,
- El número máximo de caídas que el sistema puede

tolerar es (N-1)/2,
- Si un nodo cae, se escoge otro para gestionar sus

réplicas.
Gestión de réplicas: configuración
- Las réplicas pueden tener un rol
- Líder (leaseholder): recibe las operaciones de lectura y

escritura.
- Seguidor (follower): pueden contener datos obsoletos en
caso de caídas de red.

- La réplica líder y sus seguidores mantienen un contacto

directo de forma periódica (heartbeat)

- ¿Cómo se configura un clúster? Al inicio de la configuración

de un clúster:
1. Todas las réplicas tienen el rol de seguidor,
2. Algunas réplicas se pueden postular como candidatos,
3. Las réplicas votan quien será el líder,
4. Al llegar al consenso, se asigna el rol de líder a la réplica
líder y el resto vuelven a ser seguidores.
Gestión de réplicas: funcionamiento
- Ante una operación de lectura
- La réplica líder recibe y resuelve la operación

mediante la información local

- Ante una operación de escritura

1. La réplica líder recibe la petición,
2. Promueve su escritura síncrona al resto de
réplicas,
3. Cuando la mayoría escribe el valor se acepta la
operación.

- Ante una caída de red

○ Si los nodos seguidores no reciben su
correspondiente heartbeat, se inicia una votación
para escoger un nuevo líder.
02

Geoparticionamiento
Despliegue multiregión
- Permite distribuir los datos considerando la ubicación
geográfica de los nodos à geoparticionamineto
- Promueve la localidad de datos
- La localidad definida tendrá un gran impacto en:
- La disponibilidad, escalabilidad de la base de datos,
- La latencia de sus operaciones, y en general
- la optimización de la base de datos.

- Región y zona:
- Región: área geográfica amplia que distinguimos del
resto de regiones.
- Zonas de disponibilidad: constituidas por centros de
datos ubicados en una región.

- Toda base de datos tiene una región primaria.

Despliegue multiregión
Configuración de disponibilidad
- La disponibilidad en CockroachDB se denomina objetivo de
supervivencia.
- Debe configurarse a nivel de base de datos

- Básicamente hay dos opciones:

- Supervivencia a nivel de zona
- Los datos continúan siendo accesibles en la región
local aunque las otras regiones hayan caído
- Por defecto usan 3 réplicas.
- Supervivencia a nivel de región
- Los datos continúan siendo accesibles aunque
caigan uno o más nodos de cualquiera de las
regiones.
- Por defecto usan 5 réplicas.
Supervivencia a nivel de zona
Supervivencia a nivel de región
¿Cómo gestionar la localidad de datos?
- CockroachDB permite distintas optimizaciones para
promover la localidad de datos y minimizar la latencia de las
operaciones:
- Definir una región por tabla (regional table)
- Distribuir filas entre distintas regiones (regional rows)
- Definir tablas globales (global table)
- Realizar lecturas locales (follower read)
Definir una región por tabla
- Se asigna una región a cada tabla.
- Las réplicas líder de la tabla se ubican en la región de
interés.
- Impacto en las operaciones:
- Lecturas locales à Rápidas
- Escrituras locales à Medianas
- Lecturas no locales à Lentas
- Escrituras no locales à Lentas
Distribuir filas entre distintas regiones
- Distribuye las filas de una tabla en diferentes regiones,
simulando el proceso de fragmentación horizontal.
- La tabla tendrá un atributo que indicará la región a la que se
debe asignar cada fila.
- El rendimiento es parecido al de las tablas locales pero
permite una localidad de datos distinta para cada registro
(más flexibilidad):
- Lecturas locales à Rápidas
- Escrituras locales à Medianas
- Lecturas no locales à Lentas
- Escrituras no locales à Lentas
Realizar lecturas locales (Follower reads)
- El hecho de asignar regiones a las tablas (o filas) puede
penalizar las lecturas que se hagan en regiones distintas a la
de la réplica líder.
- Para realizar una lectura más rápida (o más disponible) se
puede realizar una lectura de una réplica de la región local,
aunque no sea una réplica líder.
- El valor obtenido puede ser inconsistente (obsoleto),
- Una lectura podría generar problemas en la gestión de
concurrencia (rechazar operaciones concurrentes)
- Para evitar interferencias se lee un valor antiguo de
base de datos (stale read)
Definir una tabla de tipo global
- Las follower read permiten lecturas locales a réplicas de tipo
seguidor pero penalizan la consistencia
- Para promover lecturas locales manteniendo la
consistencia se utilizan tablas de tipo global.
- Para ello, se define un marca de tiempo a futuro hasta la que
no se permitirán escrituras. Así, durante ese tiempo, se
pueden realizar lecturas de forma local y consistente en
todas las regiones.
- Mejoramos la velocidad de respuesta de las lecturas a costa
de la velocidad de lectura de las escrituras:
- Lecturas à Rápidas
- Escrituras à Lentas
02

Aspectos de diseño
Aspectos de diseño a considerar
- No utilizar claves primarias autogeneradas (ordenadas)
- Pueden generar hotspots (nodos muy sobrecargados)
- Utilizar UUID o claves compuestas cuando sea posible
- Utilizar índices cuando sea necesario
- En los casos clásicos,
- Para indexar arrays i documentos JSON
- ¡OJO! Sólo permite consultas por valor
- Utilizar columnas computadas
- Pueden ser materializadas
- Para crear valores derivados o acceder a datos de un
array / JSON de forma más eficiente
Referencias
- Cockroach Labs. (2024). CockroachDB Docs.
https://www.cockroachlabs.com/docs/stable

- Seldess, J., Darnell, B., & Harrison, G. (2022). CockroachDB: the Definitive
Guide: Distributed Data at Scale. O’Reilly Media.

- Reid, R. (2022). Practical CockroachDB: Building Fault-Tolerant Distributed

SQL Databases. Apress.

- Rajanna, K. D. K. (2022). Getting Started with CockroachDB: A Guide to

Using a Modern, Cloud-native, and Distributed SQL Database for Your
Data-intensive Apps. Packt Publishing.
Un ejemplo de cómo el modelo relacional
y la consisténcia puede hacerse
extensible en entornos altamente
distribuidos y replicados

[email protected]
jconesac.wordpress.com/

También podría gustarte

Tutorial de CockroachDB
Aún no hay calificaciones
Tutorial de CockroachDB
25 páginas
Gestión de Datos en CockroachDB MOVR
Aún no hay calificaciones
Gestión de Datos en CockroachDB MOVR
7 páginas
Clústeres en CockroachDB: Claves y Réplicas
Aún no hay calificaciones
Clústeres en CockroachDB: Claves y Réplicas
7 páginas
Seguridad en Bases de Datos Distribuidas
Aún no hay calificaciones
Seguridad en Bases de Datos Distribuidas
7 páginas
Introducción a Bases de Datos Distribuidas
Aún no hay calificaciones
Introducción a Bases de Datos Distribuidas
13 páginas
Ventajas de Bases de Datos Distribuidas
Aún no hay calificaciones
Ventajas de Bases de Datos Distribuidas
7 páginas
Optimización y Monitoreo RDS y DynamoDB
Aún no hay calificaciones
Optimización y Monitoreo RDS y DynamoDB
96 páginas
Fundamentos de Bases de Datos Distribuidas
Aún no hay calificaciones
Fundamentos de Bases de Datos Distribuidas
31 páginas
BBDD Distribuidas y Replicadas: Guía Completa
Aún no hay calificaciones
BBDD Distribuidas y Replicadas: Guía Completa
17 páginas
ASGBD. UD6. Bases de Datos Distribuidas
Aún no hay calificaciones
ASGBD. UD6. Bases de Datos Distribuidas
6 páginas
Introducción a Bases de Datos Distribuidas
Aún no hay calificaciones
Introducción a Bases de Datos Distribuidas
3 páginas
SIstemas de BDD Exposicion
Aún no hay calificaciones
SIstemas de BDD Exposicion
17 páginas
Software de Manejo de Datos
Aún no hay calificaciones
Software de Manejo de Datos
6 páginas
Arquitecturas de Bases de Datos Multiusuario
100% (1)
Arquitecturas de Bases de Datos Multiusuario
39 páginas
Tesis de Inteligencia Artificial PDF
Aún no hay calificaciones
Tesis de Inteligencia Artificial PDF
185 páginas
Guía de Clúster y SQL en CockroachDB
Aún no hay calificaciones
Guía de Clúster y SQL en CockroachDB
6 páginas
Sistemas Lógicos de Almacenamiento
Aún no hay calificaciones
Sistemas Lógicos de Almacenamiento
2 páginas
Bases de Datos Distribuidas: Conceptos y Ventajas
Aún no hay calificaciones
Bases de Datos Distribuidas: Conceptos y Ventajas
40 páginas
Syllabus
Aún no hay calificaciones
Syllabus
9 páginas
Curso de Almacenamiento en La Nube Con Google Cloud
Aún no hay calificaciones
Curso de Almacenamiento en La Nube Con Google Cloud
39 páginas
Introducción a Bases de Datos Distribuidas
100% (1)
Introducción a Bases de Datos Distribuidas
57 páginas
BDDEXPO
Aún no hay calificaciones
BDDEXPO
26 páginas
Arquitectura de Bases de Datos Explicada
Aún no hay calificaciones
Arquitectura de Bases de Datos Explicada
21 páginas
Estrategias en Bases de Datos Distribuidas
Aún no hay calificaciones
Estrategias en Bases de Datos Distribuidas
12 páginas
Temario Del Bloque III de TAI
Aún no hay calificaciones
Temario Del Bloque III de TAI
7 páginas
Ut1 SGBD
Aún no hay calificaciones
Ut1 SGBD
30 páginas
Esquemas de Seguridad en Bases de Datos
Aún no hay calificaciones
Esquemas de Seguridad en Bases de Datos
39 páginas
Introducción a Neo4j y sus Ventajas
Aún no hay calificaciones
Introducción a Neo4j y sus Ventajas
10 páginas
Estrategias de Distribución de Datos
Aún no hay calificaciones
Estrategias de Distribución de Datos
3 páginas
Base de Datos Distruibuida
Aún no hay calificaciones
Base de Datos Distruibuida
5 páginas
Características de Bases de Datos Distribuidas
Aún no hay calificaciones
Características de Bases de Datos Distribuidas
13 páginas
Fundamentos de Postgresql
Aún no hay calificaciones
Fundamentos de Postgresql
166 páginas
Investigación Base de Datos
Aún no hay calificaciones
Investigación Base de Datos
28 páginas
Creación de Base de Datos con CockroachDB
Aún no hay calificaciones
Creación de Base de Datos con CockroachDB
20 páginas
Introducción a las bases de datos
Aún no hay calificaciones
Introducción a las bases de datos
26 páginas
Base de Datos Distribuidas Unidad 2
Aún no hay calificaciones
Base de Datos Distribuidas Unidad 2
28 páginas
Resumen Extendido Bases de Datos
Aún no hay calificaciones
Resumen Extendido Bases de Datos
2 páginas
Guía de Bases de Datos: Conceptos Clave
Aún no hay calificaciones
Guía de Bases de Datos: Conceptos Clave
38 páginas
Introducción a MongoDB Atlas
Aún no hay calificaciones
Introducción a MongoDB Atlas
11 páginas
Ventajas y Desafíos de Bases de Datos Distribuidas
Aún no hay calificaciones
Ventajas y Desafíos de Bases de Datos Distribuidas
21 páginas
Diseño de Bases de Datos Distribuidas
Aún no hay calificaciones
Diseño de Bases de Datos Distribuidas
10 páginas
Tipos y Principios de Bases de Datos Distribuidas
Aún no hay calificaciones
Tipos y Principios de Bases de Datos Distribuidas
61 páginas
Introducción a Bases de Datos I - 2025
Aún no hay calificaciones
Introducción a Bases de Datos I - 2025
17 páginas
Diferencias entre Bases de Datos Distribuidas y Paralelas
Aún no hay calificaciones
Diferencias entre Bases de Datos Distribuidas y Paralelas
16 páginas
ZODB: Base de Datos Orientada a Objetos en Python
Aún no hay calificaciones
ZODB: Base de Datos Orientada a Objetos en Python
9 páginas
Componentes y Arquitecturas de DBMS
Aún no hay calificaciones
Componentes y Arquitecturas de DBMS
22 páginas
Fundamentos de Bases de Datos Distribuidas
Aún no hay calificaciones
Fundamentos de Bases de Datos Distribuidas
20 páginas
Introducción a Bases de Datos Distribuidas
Aún no hay calificaciones
Introducción a Bases de Datos Distribuidas
6 páginas
Base de Datos Distribuidas MYSQL
Aún no hay calificaciones
Base de Datos Distribuidas MYSQL
19 páginas
Captura y almacenamiento de datos masivos
Aún no hay calificaciones
Captura y almacenamiento de datos masivos
64 páginas
Diseño de Bases de Datos Distribuidas
Aún no hay calificaciones
Diseño de Bases de Datos Distribuidas
19 páginas
Ensayo Bases de Datos Distribuidas
Aún no hay calificaciones
Ensayo Bases de Datos Distribuidas
5 páginas
Parcial 2
Aún no hay calificaciones
Parcial 2
118 páginas
Bases de Datos Distribuidas y Alta Disponibilidad
Aún no hay calificaciones
Bases de Datos Distribuidas y Alta Disponibilidad
5 páginas
Guía de Almacenamiento de Datos en Google Cloud
Aún no hay calificaciones
Guía de Almacenamiento de Datos en Google Cloud
23 páginas
Escalabilidad en Sistemas Distribuidos
Aún no hay calificaciones
Escalabilidad en Sistemas Distribuidos
6 páginas
Examen Parcial
Aún no hay calificaciones
Examen Parcial
2 páginas
Laboratorio Estrucruras de Datos y Algoritmos I (Ver 2)
Aún no hay calificaciones
Laboratorio Estrucruras de Datos y Algoritmos I (Ver 2)
28 páginas
Syllabus
Aún no hay calificaciones
Syllabus
10 páginas
08 - Procesos ETL - Orquestacion
Aún no hay calificaciones
08 - Procesos ETL - Orquestacion
18 páginas
05 - Procesos ETL - Modelado (I)
Aún no hay calificaciones
05 - Procesos ETL - Modelado (I)
21 páginas
07 - Procesos ETL - Carga
Aún no hay calificaciones
07 - Procesos ETL - Carga
11 páginas
Proceso de Gestión de Vulnerabilidades
Aún no hay calificaciones
Proceso de Gestión de Vulnerabilidades
19 páginas
Manual Técnico de Ciberseguridad y Ciberdefensa
100% (1)
Manual Técnico de Ciberseguridad y Ciberdefensa
56 páginas
Informe de Resultados - Laboratorio de Criptografia Practica
Aún no hay calificaciones
Informe de Resultados - Laboratorio de Criptografia Practica
4 páginas
Auditoría de Sistemas de Información
Aún no hay calificaciones
Auditoría de Sistemas de Información
19 páginas
Evaluación de Cumplimiento PCI DSS
Aún no hay calificaciones
Evaluación de Cumplimiento PCI DSS
9 páginas
Presentaciones Efectivas en PowerPoint
Aún no hay calificaciones
Presentaciones Efectivas en PowerPoint
16 páginas
Manual Samsumg A 14
Aún no hay calificaciones
Manual Samsumg A 14
162 páginas
M6VLR
Aún no hay calificaciones
M6VLR
46 páginas
Paso - 2 - Diagramas de Caso de Uso
Aún no hay calificaciones
Paso - 2 - Diagramas de Caso de Uso
32 páginas
Guía Rápida: Configuración Alarma GSM
Aún no hay calificaciones
Guía Rápida: Configuración Alarma GSM
2 páginas
Evidencia de Aprendizaje Paradigmas y Me
Aún no hay calificaciones
Evidencia de Aprendizaje Paradigmas y Me
15 páginas
SISTEMAS OPERATIVOS - Tarea 1
Aún no hay calificaciones
SISTEMAS OPERATIVOS - Tarea 1
4 páginas
Balanceo
100% (2)
Balanceo
3 páginas
Guía de Aprendizaje: Herramientas TIC en Contabilidad
Aún no hay calificaciones
Guía de Aprendizaje: Herramientas TIC en Contabilidad
14 páginas
Definicion de Xcode
Aún no hay calificaciones
Definicion de Xcode
8 páginas
Plan de Producción en Python: Tarea TDFI102
Aún no hay calificaciones
Plan de Producción en Python: Tarea TDFI102
2 páginas
Allegro MX Manual Del Propietario
Aún no hay calificaciones
Allegro MX Manual Del Propietario
102 páginas
Boletín Cursos ME Agosto 2025
Aún no hay calificaciones
Boletín Cursos ME Agosto 2025
75 páginas
Práctica de E/S en Ensamblador
Aún no hay calificaciones
Práctica de E/S en Ensamblador
13 páginas
Causas del Declive de Nokia en Smartphones
Aún no hay calificaciones
Causas del Declive de Nokia en Smartphones
4 páginas
Formato Informe Proyecto Curso INTHUMCOMP
Aún no hay calificaciones
Formato Informe Proyecto Curso INTHUMCOMP
37 páginas
Introducción a la función print() en Python
Aún no hay calificaciones
Introducción a la función print() en Python
4 páginas
Símbolos de Diagramas de Flujo Explicados
Aún no hay calificaciones
Símbolos de Diagramas de Flujo Explicados
3 páginas
A
Aún no hay calificaciones
A
20 páginas
Vale de Salida de Almacén GPI Perú SAC
Aún no hay calificaciones
Vale de Salida de Almacén GPI Perú SAC
2 páginas
Actividad 3
Aún no hay calificaciones
Actividad 3
11 páginas
Os1087546000 Fat Prot Line1
100% (1)
Os1087546000 Fat Prot Line1
42 páginas
Tarea 2 Creación de Una Infografía
Aún no hay calificaciones
Tarea 2 Creación de Una Infografía
3 páginas
Proyecto
Aún no hay calificaciones
Proyecto
10 páginas
Controladores Wi-Fi y Bluetooth GENGXIN
Aún no hay calificaciones
Controladores Wi-Fi y Bluetooth GENGXIN
7 páginas
Reglas Avanzadas de Bits & Bytes
Aún no hay calificaciones
Reglas Avanzadas de Bits & Bytes
2 páginas
Restablecimiento de Fábrica Del Teclado Roland
Aún no hay calificaciones
Restablecimiento de Fábrica Del Teclado Roland
1 página
Planificación de Proyecto de Software TSP
Aún no hay calificaciones
Planificación de Proyecto de Software TSP
12 páginas
Sesion 20 Word Insertar Formas
Aún no hay calificaciones
Sesion 20 Word Insertar Formas
3 páginas