Sistemas de Ficheros Paralelos y Almacenamiento

Este documento describe diferentes tipos de sistemas de almacenamiento paralelos y distribuidos como DAS, NAS, SAN y sistemas de ficheros paralelos. Los sistemas de ficheros paralelos distribuyen los datos y metadatos de los ficheros entre los nodos de almacenamiento y cómputo para aprovechar el paralelismo y la tolerancia a fallos. Google File System (GFS) es un ejemplo temprano que distribuye trozos grandes de 64MB de cada fichero entre nodos para lograr altas prestaciones de E/S.

Cargado por

Loreto Garcia

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

59 vistas1 página

Sistemas de Ficheros Paralelos y Almacenamiento

Cargado por

Loreto Garcia

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

DAS: Direct-attached storage disco asociado a nodo

Tolerancia a fallos SW NAS: Network-attached storage Nodo que gestiona un conjunto de discos
Plataforma basada en commodity HW
No altas prestaciones pero gran paralelismo Conexión de dispos. Red dedicada al almacenamiento Almacenamiento no vinculado a ningún nodo
almacenamiento
Modo de operación batch Redes comunicación separadas para datos de aplicación y ficheros
Perfil de aplicaciones previstas
Millones de ficheros grandes SAN: Storage Area Networks Redes de almacenamiento incluyen hubs, switches, etc.
Intro
Escritor genera fichero completo inmutable Conectividad total entre nodos y dispositivos:
Patrones de acceso típicos
Múltiples escritoresañaden Conectividad directa entre dispositivos

Con gran paralelismo

Google juega con ventaja Datos de ﬁchero distribuidos entre discos del sistema
Por la especialización hacia el éxito Uso de stripping
Especialización: sí pero no demasiada Similar a RAID 0 pero por software y entre varios nodos

Mayoría lecturas grandes (>1MB) y secuenciales shared disk ﬁle systems Nuevo reparto de funcionalidad de SF en 2 niveles

Algunas lecturas pequeñas aleatorias Sistemas de Proporcionado por la SAN

ﬁcheros paralelos Nivel inferior: servicio de almacenamiento distribuido
Mayoría escrituras grandes (>1MB) y secuenciales Perﬁl de aplicaciones Si no SAN, módulo de servicio de disco en cada nodo E/S (NES)

Habitual escrituras pequeñas simultáneas al final del fichero Cada NC accede a los discos como si fueran locales
Carga de trabajo prevista y API
Escrituras pequeñas aleatorias no previstas Nivel superior: sist. ficheros en cada nodo de cómputo (NC) Cada NC gestiona la metainfo. de los datos que accede

API, y modelo de coherencia, no estándar Se requiere un mecanismo de cerrojos distribuido

Tomar como base un SF convencional Gran escala soporte grandes volúmenes, ficheros y directorios
Sistema de ficheros para clusters
Añadir: cada trozo de fichero almacenado en nodo distinto Presente en la mayoría de los Top 500

problema de ﬁabilidad -> réplicas Datos repartidos en discos Soporte para SAN y nodos con discos: Shared disk ﬁle system
Receta para diseñar Una primera aproximación a GFS File System
No usar caché en nodos cliente Sistemas heterogéneos

Único nodo maestro gestiona toda la información del SF Semántica POSIX Escrituras atómicas
Intro
a del nodo maestro Escalabilidad
Sistemas de
Facilidades para implementar biblioteca MPI-IO

Trozos ﬁchero repartidos entre nodos de almacenamiento (NA)

ficheros paralelos
Optimiza acceso para 1 fichero/N procesos y N ficheros/1 proceso
Paralelismo en gestión de datos y metadatos
Tamaño de trozo/chunk/stripe: ¡64MB Ops. administración también con paralelismo y “en caliente”

mejor aprovechamiento discos y red Clásicas Tolerancia a fallos en discos, nodos y comunicación
Ventajas Striping
Menos gasto de memoria Bloques de fichero repartidos round-robin en discos de un SF
Escalabilidad del maestro
Menos trabajo Si SF formado por RAIDs: T múltiplo de tamaño franja de RAID
Tamaño bloque T entre 16K y 1M: típico 256K
relacionadas con fragmentació Clásicas Ficheros pequeños y colas de ficheros: subbloques de hasta T/32
Desventajas
Striping
Menos paralelismo Uso de prefetching en lecturas con detección de patrones de acceso:
Lecturas y escrituras de un nodo aprovechan paralelismo
Evolución de las necesidades Uso de write-behind para escrituras paralelas en discos
Finalmente se nos ha quedado pequeño
Problemas (relación directa/indirecta con maestro único) Configuración maximizando rendimiento o prestaciones
Si discos de un SF no uniformes en tamaño y/o prestaciones
GFS entra en la era de los “múltiples maestros” Reparto de bloques no uniforme

reescritura completa Datos de los ﬁcheros

GFS II/Colossus
Tamaño de bloque 1MB SF gestiona diversos tipos de “objetos” Metadatos del ﬁchero inodo y bloques indirectos

Tiempo de recuperación de pocos segundos Metadatos del sistema de ﬁcheros información de espacio libre, etc.
Todavía poca información
Paralelismo y control
Uso de códigos correctores vs. replicación SF usa caché de “objetos” en nodo de cómputo Necesidad de coherencia en gestión de cachés
de coherencia
Más especialización Si “objeto” se extiende por varios dispositivos Necesidad de coherencia si se requiere actualización atómica

Solución basada en gestor de cerrojos distribuidos se trata de cerrojos internos del SF

Gestor de tokens (GT) único en sistema ejecutando en un NC Posible problema de escalabilidad y punto único de fallo

GeneralParallelFileSystemdeIBM Gestiona tokens lectura/escritura para distintos tipos de objetos Rangos

Control acceso paralelo a objeto

Doble rol del token
Gestor de cerrojos
control de caché del objeto
distribuidos
Operación en NC requiere token para cierto objeto Lo solicita a GT y lo mantiene

Solicitud múltiples tokens en una sola petición

Escalabilidad GT: minimizar su intervención NC que requiere token solicita directamente revocación a NCs

Nuevo ﬁchero reutiliza inodo manteniendo tokens asociados al mismo

Protocolo basado en tokens asociados a rangos de bytes

1. Proceso lee/escribe ﬁchero usando N llamadas: 1 único token

Optimización en la gestión de tokens
2. M proc. escriben ﬁch. (1/M cada uno) con N llamadas/pr.: M tokens
Coherencia en acceso a datos
Rango requerido: el especiﬁcado en operación read/write
Solicitud de token incluye dos rangos:
Rango deseado: al que podría querer acceder en el futuro

Se revocan tokens que entran en conﬂicto con rango requerido

Resolución de solicitud:
Se concede rango deseado que no entre en conﬂicto

Si ningún otro cliente accede a F, no más peticiones de tokens.

Optimización en gestión de tokens En primera escritura/lectura a F, rango deseado [0,∞]
el proceso sólo pide un token

Directas (chmod)
Modificaciones concurrentes a metadatos de fichero
Indirectas: write -> fecha modificación, tamaño y punteros a bloques

Uso de token de acceso exclusivo por inodo no es eﬁciente Solicitud token de inodo por cada escritura aunque no solapadas
Coherencia acceso metadatos ﬁchero
Idea actualización de inodo en paralelo y mezcla de cambios

token de escritura compartida y exclusiva

Solución
Ciertas ops. requieren token escritura exclusiva

También podría gustarte

1024 Paper 1 Resume
Aún no hay calificaciones
1024 Paper 1 Resume
11 páginas
Presentacion de Tema de Unidad
Aún no hay calificaciones
Presentacion de Tema de Unidad
8 páginas
Sistemas de Ficheros y Almacenamiento RAID
Aún no hay calificaciones
Sistemas de Ficheros y Almacenamiento RAID
9 páginas
Protocolo NFS: Funcionamiento y Usos
Aún no hay calificaciones
Protocolo NFS: Funcionamiento y Usos
4 páginas
Sistema de Archivos (Práctica Con USB)
Aún no hay calificaciones
Sistema de Archivos (Práctica Con USB)
8 páginas
NFS y WAFL
Aún no hay calificaciones
NFS y WAFL
13 páginas
Gfs Sosp2003.en - Es
Aún no hay calificaciones
Gfs Sosp2003.en - Es
15 páginas
Sistemas de Ficheros Distribuidos: NFS y CIFS
Aún no hay calificaciones
Sistemas de Ficheros Distribuidos: NFS y CIFS
8 páginas
AVTIVIDADES
Aún no hay calificaciones
AVTIVIDADES
9 páginas
RC301 Grupo1
Aún no hay calificaciones
RC301 Grupo1
11 páginas
Guía Completa sobre NFS: Protocolo y Configuración
Aún no hay calificaciones
Guía Completa sobre NFS: Protocolo y Configuración
16 páginas
Introducción a NFS en Debian Linux
Aún no hay calificaciones
Introducción a NFS en Debian Linux
33 páginas
Google File System: Diseño y Arquitectura
Aún no hay calificaciones
Google File System: Diseño y Arquitectura
3 páginas
Sistemas de Archivos Distribuidos DFS
Aún no hay calificaciones
Sistemas de Archivos Distribuidos DFS
20 páginas
Sistemas de Archivos Distribuidos Aunque La World Wide Web Es El Sistema Distribuido Predominante en Uso Hoy en Día
Aún no hay calificaciones
Sistemas de Archivos Distribuidos Aunque La World Wide Web Es El Sistema Distribuido Predominante en Uso Hoy en Día
13 páginas
Sistemas de Archivo Soportados Por Linux
Aún no hay calificaciones
Sistemas de Archivo Soportados Por Linux
18 páginas
Protocolo NFS: Ventajas y Desventajas
Aún no hay calificaciones
Protocolo NFS: Ventajas y Desventajas
5 páginas
Practico 1 de So2
0% (2)
Practico 1 de So2
7 páginas
Almacenamiento Descentralizado y IPFS
Aún no hay calificaciones
Almacenamiento Descentralizado y IPFS
27 páginas
DSF (Distributed File System)
Aún no hay calificaciones
DSF (Distributed File System)
7 páginas
Sistemas de Ficheros Distribuidos: Guía Completa
Aún no hay calificaciones
Sistemas de Ficheros Distribuidos: Guía Completa
29 páginas
Wepik Explorando El Mundo de Nfs Desvelando Las Caracteristicas de Este Sistema de Archivos en Red 20231016155739jy0s
Aún no hay calificaciones
Wepik Explorando El Mundo de Nfs Desvelando Las Caracteristicas de Este Sistema de Archivos en Red 20231016155739jy0s
17 páginas
Sistemas de Archivos NFS y NTFS
Aún no hay calificaciones
Sistemas de Archivos NFS y NTFS
12 páginas
Sistemas de Archivos Distribuidos
Aún no hay calificaciones
Sistemas de Archivos Distribuidos
28 páginas
Espanol
Aún no hay calificaciones
Espanol
15 páginas
Problemas y beneficios de HDFS
Aún no hay calificaciones
Problemas y beneficios de HDFS
1 página
Sistemas Distribuidos para Elecciones en México
Aún no hay calificaciones
Sistemas Distribuidos para Elecciones en México
6 páginas
Proyecto2 Dfs
Aún no hay calificaciones
Proyecto2 Dfs
3 páginas
Actividad Asincrona 08 Luis González
Aún no hay calificaciones
Actividad Asincrona 08 Luis González
6 páginas
Sistemas de Ficheros en Linux y Windows
Aún no hay calificaciones
Sistemas de Ficheros en Linux y Windows
38 páginas
Control de cintas con OPC UA y IEC 61499
Aún no hay calificaciones
Control de cintas con OPC UA y IEC 61499
20 páginas
Compatibilidad de Sistemas de Ficheros
Aún no hay calificaciones
Compatibilidad de Sistemas de Ficheros
10 páginas
Prensentacion de Sistemas Dristribuidos
Aún no hay calificaciones
Prensentacion de Sistemas Dristribuidos
6 páginas
Sistemas de Archivos y RAID Explicados
Aún no hay calificaciones
Sistemas de Archivos y RAID Explicados
6 páginas
C2 - Administración de Sistemas de Archivos
Aún no hay calificaciones
C2 - Administración de Sistemas de Archivos
24 páginas
Protocolo NFS: Sistema de Archivos en Red
Aún no hay calificaciones
Protocolo NFS: Sistema de Archivos en Red
3 páginas
Diferencias y Similitudes GFS y Hadoop
Aún no hay calificaciones
Diferencias y Similitudes GFS y Hadoop
1 página
Teoria M4
Aún no hay calificaciones
Teoria M4
41 páginas
Tema 2
Aún no hay calificaciones
Tema 2
30 páginas
Guía Completa del Sistema NFS
Aún no hay calificaciones
Guía Completa del Sistema NFS
10 páginas
Sistemas de Archivos
Aún no hay calificaciones
Sistemas de Archivos
7 páginas
Sistemas de Archivos en Paralelo (PFS)
Aún no hay calificaciones
Sistemas de Archivos en Paralelo (PFS)
2 páginas
Sistemas de Archivos: Tipos y Funciones
100% (1)
Sistemas de Archivos: Tipos y Funciones
8 páginas
Sistemas de Archivos Distribuidos
Aún no hay calificaciones
Sistemas de Archivos Distribuidos
50 páginas
Soluciones de Alta Disponibilidad en TI
Aún no hay calificaciones
Soluciones de Alta Disponibilidad en TI
22 páginas
Sistema de Archivos
Aún no hay calificaciones
Sistema de Archivos
103 páginas
BigTable y Sistemas de Bases de Datos NoSQL
Aún no hay calificaciones
BigTable y Sistemas de Bases de Datos NoSQL
19 páginas
Sistemas de Archivos de Bajo Nivel: Guía Práctica
Aún no hay calificaciones
Sistemas de Archivos de Bajo Nivel: Guía Práctica
5 páginas
Tecnologías de Almacenamiento en Sistemas
Aún no hay calificaciones
Tecnologías de Almacenamiento en Sistemas
41 páginas
Resumen
Aún no hay calificaciones
Resumen
26 páginas
Estructura de Almacenamiento Secundario
Aún no hay calificaciones
Estructura de Almacenamiento Secundario
4 páginas
Componentes de un Clúster HPC
Aún no hay calificaciones
Componentes de un Clúster HPC
37 páginas
Introducción al Sistema NFS en Redes
Aún no hay calificaciones
Introducción al Sistema NFS en Redes
13 páginas
Funcionamiento y Alta Disponibilidad de HDFS
Aún no hay calificaciones
Funcionamiento y Alta Disponibilidad de HDFS
8 páginas
Sistemas de Archivos Distribuidos
Aún no hay calificaciones
Sistemas de Archivos Distribuidos
13 páginas
Sistemas de Ficheros Distribuidos y DLT
Aún no hay calificaciones
Sistemas de Ficheros Distribuidos y DLT
67 páginas
Sistema de Archivos Gnu Linux
Aún no hay calificaciones
Sistema de Archivos Gnu Linux
4 páginas
Sistemas de Archivos: Tipos y Funciones
Aún no hay calificaciones
Sistemas de Archivos: Tipos y Funciones
12 páginas
Fundamentos de Apache Hadoop y MapReduce
Aún no hay calificaciones
Fundamentos de Apache Hadoop y MapReduce
27 páginas
Anticodigo - Malicioso
Aún no hay calificaciones
Anticodigo - Malicioso
11 páginas
Comunicación en Sistemas Distribuidos
Aún no hay calificaciones
Comunicación en Sistemas Distribuidos
7 páginas
3-Codigo Malicioso
Aún no hay calificaciones
3-Codigo Malicioso
9 páginas
Gestión Estratégica de Recursos Humanos
Aún no hay calificaciones
Gestión Estratégica de Recursos Humanos
3 páginas
Procesos Sustractivos en la Empresa
Aún no hay calificaciones
Procesos Sustractivos en la Empresa
1 página
Comunicación en Sistemas Distribuidos
Aún no hay calificaciones
Comunicación en Sistemas Distribuidos
7 páginas
Servicio de Nombres y DNS en Internet
Aún no hay calificaciones
Servicio de Nombres y DNS en Internet
10 páginas
Servicio de Directorio PDF
Aún no hay calificaciones
Servicio de Directorio PDF
5 páginas
Curso de Instalacion de Linux Como Servidor Web Apache ElSaber21
Aún no hay calificaciones
Curso de Instalacion de Linux Como Servidor Web Apache ElSaber21
24 páginas
Temario de CMD para 1er Bachillerato
Aún no hay calificaciones
Temario de CMD para 1er Bachillerato
10 páginas
Administración de Usuarios y Permisos en Windows
Aún no hay calificaciones
Administración de Usuarios y Permisos en Windows
2 páginas
Guía Completa de Comandos MS-DOS
Aún no hay calificaciones
Guía Completa de Comandos MS-DOS
31 páginas
Gestión de Procesos y Memoria
67% (6)
Gestión de Procesos y Memoria
4 páginas
Calculadora Rmi Java-Estebil Gomez-Brahayan Diaz Moreno
Aún no hay calificaciones
Calculadora Rmi Java-Estebil Gomez-Brahayan Diaz Moreno
11 páginas
Proceso Recuperacion Clave Swcith 3com 4500 Freddy Beltran
Aún no hay calificaciones
Proceso Recuperacion Clave Swcith 3com 4500 Freddy Beltran
5 páginas
Uso de Cron y Crontab en Linux
Aún no hay calificaciones
Uso de Cron y Crontab en Linux
3 páginas
Crear y convertir partición en Windows
Aún no hay calificaciones
Crear y convertir partición en Windows
4 páginas
Modos de Ejecución de Un CPU..
Aún no hay calificaciones
Modos de Ejecución de Un CPU..
5 páginas
Clasificación de Sistemas Operativos
0% (1)
Clasificación de Sistemas Operativos
1 página
Hilos en Lenguajes de Programacion
Aún no hay calificaciones
Hilos en Lenguajes de Programacion
24 páginas
Examen de Administración en Linux
Aún no hay calificaciones
Examen de Administración en Linux
15 páginas
Guía de Ayuda en Linux: Páginas man
Aún no hay calificaciones
Guía de Ayuda en Linux: Páginas man
12 páginas
Comandos Linux (Listado Completo)
Aún no hay calificaciones
Comandos Linux (Listado Completo)
5 páginas
Curso Basico de Linux
100% (1)
Curso Basico de Linux
53 páginas
Códigos de Error Win32
Aún no hay calificaciones
Códigos de Error Win32
25 páginas
Seguridad y Administración en Linux
Aún no hay calificaciones
Seguridad y Administración en Linux
6 páginas
Tarea Hilos
Aún no hay calificaciones
Tarea Hilos
4 páginas
Curso de Administración GNU/Linux
Aún no hay calificaciones
Curso de Administración GNU/Linux
12 páginas
Tutorial de MHDD
Aún no hay calificaciones
Tutorial de MHDD
8 páginas
Guía de uso de Pack and Go en SOLIDWORKS
Aún no hay calificaciones
Guía de uso de Pack and Go en SOLIDWORKS
3 páginas
PDF. Sistemas Operativos en Red. Tema 2 2º SMR MEDAC
Aún no hay calificaciones
PDF. Sistemas Operativos en Red. Tema 2 2º SMR MEDAC
17 páginas
Manual de Teoria y Practica de Ofimatica 2017
100% (1)
Manual de Teoria y Practica de Ofimatica 2017
39 páginas
Comandos Dump y Restore en Linux
Aún no hay calificaciones
Comandos Dump y Restore en Linux
3 páginas
Instalación de Linux en Máquina Virtual
Aún no hay calificaciones
Instalación de Linux en Máquina Virtual
3 páginas
Gestión de Memoria en Sistemas Operativos
100% (1)
Gestión de Memoria en Sistemas Operativos
25 páginas
Ejercicios sobre Sistemas de Archivos
100% (2)
Ejercicios sobre Sistemas de Archivos
3 páginas
Creación de VMs Linux y Windows Server
Aún no hay calificaciones
Creación de VMs Linux y Windows Server
3 páginas
Cuotas de impresión en Samba y CUPS
Aún no hay calificaciones
Cuotas de impresión en Samba y CUPS
3 páginas