BigTable
Introducción
Características
modelo de datos
Api cliente
índice Infraestructura subyacente de Google
Ventajas y desventajas
Conclusión
Bibliografía
BigTable es un sistema de almacenamiento
distribuido para administrar datos estructurados.
Diseñado para escalar a un tamaño muy grande
-Petabytes de datos en miles de servidores.
Utilizado para muchos proyectos de Google -
Introducción -Indexación web, búsqueda personalizada,
Google Earth, Google Analytics, Google
Finance, …
Solución flexible y de alto rendimiento para todos
los productos de Google.
El sistema de construcción internamente ayudaría
a usarlo para otros proyectos con un bajo costo
incremental
Se pueden realizar optimizaciones de
almacenamiento de bajo nivel, que pueden ser
útiles para aumentar el rendimiento
Características Gran cantidad de datos (semi) estructurados en
Google URLs: Contenidos, metadatos de rastreo,
enlaces, anclas.
Datos por usuario: Configuración de preferencias
del usuario, consultas recientes / resultados de
búsqueda, Ubicaciones geográficas, carreteras,
datos de imágenes satelitales, anotaciones de
usuarios.
Mapa disperso multidimensional distribuido.
(Fila, columna, marca de tiempo) -> Contenido de
Modelo de la celda.
datos Las claves de fila son cadenas arbitrarias Row es
la unidad de consistencia transaccional.
Las filas con claves consecutivas se agrupan como
"tabletas".
Las claves de columna se agrupan en conjuntos
llamados "familias de columnas", que forman la
unidad de control de acceso.
Modelo de Los datos almacenados en una familia de
columnas suelen ser del mismo tipo.
datos
La clave de columna se nombra con la siguiente
sintaxis: family :qualifier.
El control de acceso y la contabilidad de disco /
memoria se realizan a nivel de columna familiar.
Las API de Bigtable proporcionan funciones
para:
Creación / eliminación de tablas, familias de
columnas.
Modificación de los metadatos de la familia de
clústeres, tablas y columnas, como los derechos
de control de acceso.
Api cliente Soporte para transacciones de una sola fila.
Permite que las celdas se usen como contadores
enteros.
Los scripts suministrados por el cliente se pueden
ejecutar en el espacio de direcciones de los
servidores.
Building
Blocks –
infraestructura
subyacente de
Google
“Chubby” para las siguientes tareas Almacene.
la tableta raíz, información de esquema, listas de
control de acceso.
Building Sincronizar y detectar servidores de tableta.
Blocks – ¿Qué es Chubby?
infraestructura Servicio de bloqueo persistente altamente
subyacente disponible. Sistema de archivos simple con
directorios y archivos pequeños Lee y escribe en
de Google archivos atómicos.
Cuando la sesión finaliza, los clientes pierden
todos los bloqueos.
Un servicio NoSQL escalable de forma masiva
Bigtable ofrece latencia baja y rendimiento alto
sin importar la escala ni el tipo de aplicación.
Escalamiento sin interrupciones
Bigtable puede aprovisionar cientos de
petabytes y ajusta su escala de manera acorde
automáticamente, y puede manejar millones de
Ventajas operaciones por segundo sin ninguna dificultad.
Integración y simplicidad
Bigtable se integra fácilmente a herramientas
populares de macrodatos, como Hadoop, y a
productos de Google Cloud Platform, como
Cloud Dataflow y Dataproc.
La mayoría de las bases de datos NoSQL no
admiten funciones de fiabilidad, que son
soportadas por sistemas de bases de datos
relacionales.
Con el fin de apoyar las características de
fiabilidad y coherencia, los desarrolladores deben
implementar su propio código, lo que agrega más
Desventajas complejidad al sistema.
Esto podría limitar el número de aplicaciones en
las que podemos confiar para realizar
transacciones seguras y confiables, como por
ejemplo los sistemas bancarios.
Otras formas de complejidad encontradas en la
mayoría de las bases de datos NoSQL, incluyen la
incompatibilidad con consultas SQL.
Bigtable ha logrado sus objetivos de alto
rendimiento, disponibilidad de datos y
escalabilidad. Se ha implementado con éxito en
aplicaciones reales (Búsqueda personalizada,
Orkut, GoogleMaps, ...)
Conclusión Las ventajas significativas de construir un sistema
de almacenamiento propio, como la flexibilidad en
el diseño del modelo de datos, el control sobre la
implementación y otra infraestructura en la que
Bigtable confía.
Desventajas:
https://blog.pandorafms.org/es/bases-de-datos-
nosql/
Bibliografía Bigtable en general:
https://cloud.google.com/bigtable/