0% encontró este documento útil (0 votos)
594 vistas13 páginas

Introducción a BigTable y sus características

BigTable es un sistema de almacenamiento distribuido de Google diseñado para escalar a petabytes de datos almacenados en miles de servidores. Usa un modelo de datos multidimensional de clave-valor para almacenar grandes cantidades de datos estructurados y semiestructurados de manera flexible y de alto rendimiento. Se implementa mediante la infraestructura subyacente de Google como Chubby y ha demostrado ser útil para muchos proyectos a gran escala de Google.

Cargado por

Javier Balsas
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
594 vistas13 páginas

Introducción a BigTable y sus características

BigTable es un sistema de almacenamiento distribuido de Google diseñado para escalar a petabytes de datos almacenados en miles de servidores. Usa un modelo de datos multidimensional de clave-valor para almacenar grandes cantidades de datos estructurados y semiestructurados de manera flexible y de alto rendimiento. Se implementa mediante la infraestructura subyacente de Google como Chubby y ha demostrado ser útil para muchos proyectos a gran escala de Google.

Cargado por

Javier Balsas
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

BigTable

 Introducción
 Características
 modelo de datos
 Api cliente
índice  Infraestructura subyacente de Google
 Ventajas y desventajas
 Conclusión
 Bibliografía
BigTable es un sistema de almacenamiento
distribuido para administrar datos estructurados.
Diseñado para escalar a un tamaño muy grande
-Petabytes de datos en miles de servidores.
Utilizado para muchos proyectos de Google -
Introducción -Indexación web, búsqueda personalizada,
Google Earth, Google Analytics, Google
Finance, …
Solución flexible y de alto rendimiento para todos
los productos de Google.
 El sistema de construcción internamente ayudaría
a usarlo para otros proyectos con un bajo costo
incremental
 Se pueden realizar optimizaciones de
almacenamiento de bajo nivel, que pueden ser
útiles para aumentar el rendimiento
Características  Gran cantidad de datos (semi) estructurados en
Google URLs: Contenidos, metadatos de rastreo,
enlaces, anclas.
 Datos por usuario: Configuración de preferencias
del usuario, consultas recientes / resultados de
búsqueda, Ubicaciones geográficas, carreteras,
datos de imágenes satelitales, anotaciones de
usuarios.
 Mapa disperso multidimensional distribuido.
 (Fila, columna, marca de tiempo) -> Contenido de
Modelo de la celda.
datos  Las claves de fila son cadenas arbitrarias Row es
la unidad de consistencia transaccional.
 Las filas con claves consecutivas se agrupan como
"tabletas".
 Las claves de columna se agrupan en conjuntos
llamados "familias de columnas", que forman la
unidad de control de acceso.
Modelo de  Los datos almacenados en una familia de
columnas suelen ser del mismo tipo.
datos
 La clave de columna se nombra con la siguiente
sintaxis: family :qualifier.
 El control de acceso y la contabilidad de disco /
memoria se realizan a nivel de columna familiar.
Las API de Bigtable proporcionan funciones
para:
 Creación / eliminación de tablas, familias de
columnas.
 Modificación de los metadatos de la familia de
clústeres, tablas y columnas, como los derechos
de control de acceso.
Api cliente  Soporte para transacciones de una sola fila.
 Permite que las celdas se usen como contadores
enteros.
 Los scripts suministrados por el cliente se pueden
ejecutar en el espacio de direcciones de los
servidores.
Building
Blocks –
infraestructura
subyacente de
Google
“Chubby” para las siguientes tareas Almacene.
 la tableta raíz, información de esquema, listas de
control de acceso.
Building  Sincronizar y detectar servidores de tableta.
Blocks – ¿Qué es Chubby?
infraestructura  Servicio de bloqueo persistente altamente
subyacente disponible. Sistema de archivos simple con
directorios y archivos pequeños Lee y escribe en
de Google archivos atómicos.
 Cuando la sesión finaliza, los clientes pierden
todos los bloqueos.
 Un servicio NoSQL escalable de forma masiva
Bigtable ofrece latencia baja y rendimiento alto
sin importar la escala ni el tipo de aplicación.
 Escalamiento sin interrupciones
Bigtable puede aprovisionar cientos de
petabytes y ajusta su escala de manera acorde
automáticamente, y puede manejar millones de
Ventajas operaciones por segundo sin ninguna dificultad.
 Integración y simplicidad
Bigtable se integra fácilmente a herramientas
populares de macrodatos, como Hadoop, y a
productos de Google Cloud Platform, como
Cloud Dataflow y Dataproc.
 La mayoría de las bases de datos NoSQL no
admiten funciones de fiabilidad, que son
soportadas por sistemas de bases de datos
relacionales.
 Con el fin de apoyar las características de
fiabilidad y coherencia, los desarrolladores deben
implementar su propio código, lo que agrega más
Desventajas complejidad al sistema.
 Esto podría limitar el número de aplicaciones en
las que podemos confiar para realizar
transacciones seguras y confiables, como por
ejemplo los sistemas bancarios.
 Otras formas de complejidad encontradas en la
mayoría de las bases de datos NoSQL, incluyen la
incompatibilidad con consultas SQL.
 Bigtable ha logrado sus objetivos de alto
rendimiento, disponibilidad de datos y
escalabilidad. Se ha implementado con éxito en
aplicaciones reales (Búsqueda personalizada,
Orkut, GoogleMaps, ...)
Conclusión  Las ventajas significativas de construir un sistema
de almacenamiento propio, como la flexibilidad en
el diseño del modelo de datos, el control sobre la
implementación y otra infraestructura en la que
Bigtable confía.
 Desventajas:
https://blog.pandorafms.org/es/bases-de-datos-
nosql/
Bibliografía  Bigtable en general:
https://cloud.google.com/bigtable/

También podría gustarte