Proyecto2 Dfs

El proyecto consiste en diseñar e implementar un sistema de archivos distribuidos por bloques minimalista, que permita el acceso concurrente a archivos almacenados en diferentes nodos. Se propone una arquitectura que combina características de sistemas de archivos distribuidos basados en bloques y objetos, utilizando protocolos REST API y gRPC para la comunicación. Los entregables incluyen un documento de diseño, implementación de código, validación y un video de sustentación del proceso.

Cargado por

Camilo Hernandez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

31 vistas3 páginas

Proyecto2 Dfs

Cargado por

Camilo Hernandez

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Facultad de Ingeniería de Sistemas e Informática

Arquitecturas de nube y Sistemas distribuidos

Proyecto 2 – mayo 8 de 2025
Fecha de entrega: mayo 25 de 2025 GMT-5

Estudiante: ID:
SISTEMA DE ARCHIVOS DISTRIBUIDOS POR BLOQUES

Objetivo: Diseñar e implementar un sistema de archivos distribuidos por bloques minimalista.

Descripción: Un sistema de archivos distribuidos, permite compartir y acceder de forma concurrente un

conjunto de archivos que se encuentran almacenados en diferentes nodos. Uno de los sistemas más
maduros, vigente y antiguo de estos sistemas es el NFS (Network File System) desarrollado en su momento
por Sun Microsystems y que hoy en día es ampliamente usado en sistemas Linux. Hay otros sistemas de
archivos distribuidos como AFS (Andrew File System) y SMB (Server Message Block) conocido como CIFS.

En general hay dos acercamientos para el diseño e implementación de un DFS: 1) basado en bloques y
basado en objetos.

Los DFS basados en bloques generalmente garantizan 2 aspectos: 1) la unidad de escritura y lectura es a
nivel de bloque, y los bloques pueden ser distribuidos en diferentes nodos, la idea es que los bloques de
un archivo estén distribuidos en un conjunto de nodos. 2) el sistema operativo cliente de un DFS garantiza
transparencia en el sentido de que la API ofrecida desde el SO es igual para acceder archivos locales que
remotos, porque el DFS se integra con el sistema de gestión de archivos del sistema operativo (ej: NFS,
AFS, SMB, etc).

Los DFS basados en objetos (object storage, ej: AWS S3), los dos aspectos anteriores se manejan así: 1) la
unidad de distribución es a nivel de archivo y no de bloque, es decir, y se garantiza que se lee o escribe
un archivo como un todo y no a nivel de bloque. No está diseñado como un sistema de acceso aleatorio al
archivo sino secuencial. No soporta la operación de actualización parcial del archivo, sino que se debe
reemplazar todo el archivo. Son sistemas distribuidos de archivos principalmente diseñado para un
enfoque WORM (Read-Once-Read-Many). Típicamente estos DFS soporta altos niveles de escalabilidad,
redundancia y rendimiento. Si bien desde el cliente tiene una visión de archivo completo, en el sistema
de backend podría tener (y normalmente lo hay) un mecanismo de particionamiento del archivo por
bloques u otro criterio para mejorar la escalabilidad, tolerancia a fallos y rendimiento. 2) el sistema
operativo local del cliente NO integra directamente la gestión de este DFS y en vez de ello se cuenta con
un SDK o API para las diferentes primitivas de la gestión de archivos y normalmente tienen su propio CLI.

A nivel de recomendación para este proyecto2, realizaremos el diseño e implementación del DFS
intermedio principalmente orientado a bloques, pero con la característica de WORM del almacenamiento
por Objetos. Este tipo de DFS es el enfoque de sistemas de archivos como GFS y HDSF. Lo primero que
deberá hacer el equipo de trabajo es leer y comprender los papers fundacionales de estos DFS:

• GFS:
o https://es.wikipedia.org/wiki/Google_File_System
o The Google File System - https://g.co/kgs/XzwmU76
• HDFS:
o https://es.wikipedia.org/wiki/Hadoop_Distributed_File_System
o The Hadoop Distributed File System – link

A nivel minimalista de este DFS, se propone la siguiente arquitectura:

2025 UPB Álvaro Ospina Sanjuan Arquitectura de Nube y sistemas distribuidos 1 de 3

Cliente 1
CLI
DataNode-1

Cliente n
CLI Sync
NameNode
Leader
DataNode-2 Sync

Cliente 1
API/SDK Sync

NameNode
Follower DataNode-N
Cliente n
API/SDK

Especificaciones:
• Se tendrán dos tipos de protocolos o comunicaciones entre procesos donde debe emplear (REST
API y gRPC),:
o Canal de Control:
o Canal de Datos:
• La escritura y lectura de los archivos, debe ser directamente realizado entre el Cliente y el
DataNode. Debe definir un algoritmo para distribución de los bloques y su replicación.
• Cada archivo debe ser particionado en n bloques que se distribuyen por los datanodes (obviamente
referenciados por namenode). Se deja opcional si se pueden cambiar los tamaños de los bloques
en la configuración inicial.
• La unidad mínima de replicación – por facilidad – se tomará como un bloque.
• Un bloque al menos debe estar en dos DataNode, se debe garantizar en todo momento esta
replicación de bloques.
• La transferencia de un archivo se hace desde cada uno de los Datanodes que contengan bloques
principales o replicas. Por facilidad y producto mínimo viable, el namenode entrega al cliente la
lista y el orden donde se encuentran los bloques de un archivo (lista de bloques y URI).
• A nivel de escritura de un archivo en el sistema, se realizará la transferencia directa entre el
cliente y un grupo de DataNode seleccionado con un criterio de optimización del NameNode para
elegir los DataNodes más adecuado de acuerdo a alguna métrica.
• Un DataNode que recibe un bloque de un Cliente se convierte en un Leader del bloque y este será
encargado de replicar a otro DataNode el bloque de este archivo para Tolerancia a fallos, este
segundo DataNode lo conoceremos como Follower para este archivo.
• Se debe implementar a nivel de cliente una interfaz de comandos (CLI) que implemente mínimo
los siguientes comandos:
o ls, cd, put, get, mkdir, rmdir, rm, etc
• (Opcional): Cada cliente puede solo ver y manipular sus propios archivos, para ello implementará
la autenticación básica user/pass, muy básica.

Entregables:
• Documento con el Diseño detallado y especificación de los servicios.
• Códigos y validación: Implementación (códigos) y ejecución (pantallazos de funcionamiento)
• Plantilla de autoevaluación y requisitos del proyecto (Sin autoevaluación se considera un 80% de
alcance del proyecto)
• Video Sustentación: donde participen todos los integrantes del grupo donde explique el proceso de

2025 UPB Álvaro Ospina Sanjuan Arquitectura de Nube y sistemas distribuidos 2 de 3

diseño, desarrollo y ejecución (no más de 30 mins).

(Este enunciado se seguirá actualizando de acuerdo con aclaraciones y retroalimentación recibida, los
cambios o adiciones serán resaltados)

Éxitos !!!

2025 UPB Álvaro Ospina Sanjuan Arquitectura de Nube y sistemas distribuidos 3 de 3

También podría gustarte

Trabajo1 SD
Aún no hay calificaciones
Trabajo1 SD
20 páginas
Sistemas de Archivos Distribuidos Aunque La World Wide Web Es El Sistema Distribuido Predominante en Uso Hoy en Día
Aún no hay calificaciones
Sistemas de Archivos Distribuidos Aunque La World Wide Web Es El Sistema Distribuido Predominante en Uso Hoy en Día
13 páginas
Preguntas Semana 13
Aún no hay calificaciones
Preguntas Semana 13
3 páginas
Sistemas de Archivos Distribuidos
Aún no hay calificaciones
Sistemas de Archivos Distribuidos
28 páginas
RA (Clouds), Emerad, TRIX
Aún no hay calificaciones
RA (Clouds), Emerad, TRIX
10 páginas
Prensentacion de Sistemas Dristribuidos
Aún no hay calificaciones
Prensentacion de Sistemas Dristribuidos
6 páginas
Resumen TASD - 2do Parcial
Aún no hay calificaciones
Resumen TASD - 2do Parcial
17 páginas
Tema 2
Aún no hay calificaciones
Tema 2
30 páginas
Sistemas Distribuidos - Grupo 4 - Capitulo 8 Sistemas de Archivos Distribuidos
Aún no hay calificaciones
Sistemas Distribuidos - Grupo 4 - Capitulo 8 Sistemas de Archivos Distribuidos
79 páginas
Resumen Del Capitulo 12
Aún no hay calificaciones
Resumen Del Capitulo 12
2 páginas
Sistemas Distribuidos: Objetos y Archivos
Aún no hay calificaciones
Sistemas Distribuidos: Objetos y Archivos
2 páginas
Teoria M4
Aún no hay calificaciones
Teoria M4
41 páginas
Tarea 6 Bloque 2 Sistemas de Archivos Distribuidos
Aún no hay calificaciones
Tarea 6 Bloque 2 Sistemas de Archivos Distribuidos
6 páginas
Actividad Aprendizaje 3 - Sistemas Distribuidos
Aún no hay calificaciones
Actividad Aprendizaje 3 - Sistemas Distribuidos
6 páginas
HDFS: Arquitectura y Replicación de Datos
Aún no hay calificaciones
HDFS: Arquitectura y Replicación de Datos
19 páginas
MIA Enunciado Proyecto2 1S2025
Aún no hay calificaciones
MIA Enunciado Proyecto2 1S2025
31 páginas
Sistemas de Ficheros Distribuidos y DLT
Aún no hay calificaciones
Sistemas de Ficheros Distribuidos y DLT
67 páginas
Sistemas Distribuidos: Usos y Tendencias
Aún no hay calificaciones
Sistemas Distribuidos: Usos y Tendencias
10 páginas
Wuolah Free Tema 4 Tecnologias Distribuidas Modernas
Aún no hay calificaciones
Wuolah Free Tema 4 Tecnologias Distribuidas Modernas
15 páginas
Sistemas de Archivos Distribuidos
Aún no hay calificaciones
Sistemas de Archivos Distribuidos
8 páginas
Resumen para Examen Final Sistemas Distribuido
Aún no hay calificaciones
Resumen para Examen Final Sistemas Distribuido
3 páginas
Sistema de Archivos (Práctica Con USB)
Aún no hay calificaciones
Sistema de Archivos (Práctica Con USB)
8 páginas
DSF (Distributed File System)
Aún no hay calificaciones
DSF (Distributed File System)
7 páginas
Multiplicación de Matrices HPC
Aún no hay calificaciones
Multiplicación de Matrices HPC
40 páginas
Sistemas de Archivos Distribuidos: Gestión y Operaciones
Aún no hay calificaciones
Sistemas de Archivos Distribuidos: Gestión y Operaciones
2 páginas
Almacenamiento de Datos Apuntes.
Aún no hay calificaciones
Almacenamiento de Datos Apuntes.
9 páginas
LBSDPA08
Aún no hay calificaciones
LBSDPA08
10 páginas
Pérez - Néstor - R1 - U1
Aún no hay calificaciones
Pérez - Néstor - R1 - U1
10 páginas
Gfs Sosp2003.en - Es
Aún no hay calificaciones
Gfs Sosp2003.en - Es
15 páginas
Memoria
Aún no hay calificaciones
Memoria
66 páginas
Sistemas Distribuidos y NFSv4
Aún no hay calificaciones
Sistemas Distribuidos y NFSv4
15 páginas
Actividad Asincrona 08 Luis González
Aún no hay calificaciones
Actividad Asincrona 08 Luis González
6 páginas
HDFS: Arquitectura y Replicación
Aún no hay calificaciones
HDFS: Arquitectura y Replicación
8 páginas
SD Arquitectura 2021 Parte1
Aún no hay calificaciones
SD Arquitectura 2021 Parte1
119 páginas
Introducción al Protocolo NFS
Aún no hay calificaciones
Introducción al Protocolo NFS
31 páginas
Primera Entrega Sistemas Distribuidos. 1
Aún no hay calificaciones
Primera Entrega Sistemas Distribuidos. 1
23 páginas
SGBD
Aún no hay calificaciones
SGBD
29 páginas
Sistemas Distribuidos: Temario y Conceptos
Aún no hay calificaciones
Sistemas Distribuidos: Temario y Conceptos
8 páginas
Resumen X
Aún no hay calificaciones
Resumen X
12 páginas
Sistemas de Archivos Distribuidos
Aún no hay calificaciones
Sistemas de Archivos Distribuidos
13 páginas
Introducción a Hadoop y Big Data
Aún no hay calificaciones
Introducción a Hadoop y Big Data
39 páginas
NFS y WAFL
Aún no hay calificaciones
NFS y WAFL
13 páginas
Ultima Entrega Semana 7
Aún no hay calificaciones
Ultima Entrega Semana 7
20 páginas
Sistema de Archivos Distribuido
Aún no hay calificaciones
Sistema de Archivos Distribuido
8 páginas
Apuntes Big Data Tema 2
Aún no hay calificaciones
Apuntes Big Data Tema 2
3 páginas
Tesis Zequeira Corregida Final
Aún no hay calificaciones
Tesis Zequeira Corregida Final
117 páginas
S16 - Archivos Distribuidos
Aún no hay calificaciones
S16 - Archivos Distribuidos
16 páginas
SISTEMAS DISTRIBUIDOS UTP - Parcial 1
Aún no hay calificaciones
SISTEMAS DISTRIBUIDOS UTP - Parcial 1
6 páginas
Trabajo Actividad 1
Aún no hay calificaciones
Trabajo Actividad 1
6 páginas
Repaso PC2
Aún no hay calificaciones
Repaso PC2
42 páginas
Sistemas de Archivos Distribuidos
Aún no hay calificaciones
Sistemas de Archivos Distribuidos
50 páginas
Uso Y Tendencia de Sistemas Distribuidos
Aún no hay calificaciones
Uso Y Tendencia de Sistemas Distribuidos
24 páginas
Introducción a Apache Hadoop
Aún no hay calificaciones
Introducción a Apache Hadoop
27 páginas
Nubes Privadas en As Virtualizadas
Aún no hay calificaciones
Nubes Privadas en As Virtualizadas
4 páginas
Libro Programacion Paralela y Distribuida Un Enfoque Práctico
Aún no hay calificaciones
Libro Programacion Paralela y Distribuida Un Enfoque Práctico
160 páginas
Sistemas Distribuidos: Conceptos y Desafíos
Aún no hay calificaciones
Sistemas Distribuidos: Conceptos y Desafíos
11 páginas
Sesion 02 - Introducción A Hadoop
Aún no hay calificaciones
Sesion 02 - Introducción A Hadoop
36 páginas
IPFS
Aún no hay calificaciones
IPFS
27 páginas
RC301 Grupo1
Aún no hay calificaciones
RC301 Grupo1
11 páginas
Listado de Asistencia
Aún no hay calificaciones
Listado de Asistencia
2 páginas
Hojas de Trabajo: Reparaciones en Doctor de Computadores Ocaña
Aún no hay calificaciones
Hojas de Trabajo: Reparaciones en Doctor de Computadores Ocaña
28 páginas
Guía Completa de Trading Cripto
Aún no hay calificaciones
Guía Completa de Trading Cripto
2 páginas
Problemática Y2K y Sistemas Contables
Aún no hay calificaciones
Problemática Y2K y Sistemas Contables
29 páginas
Instalación de Emulador HNC en DOSBox
100% (1)
Instalación de Emulador HNC en DOSBox
4 páginas
Formato Control de Despacho de Materiales
Aún no hay calificaciones
Formato Control de Despacho de Materiales
1 página
Políticas de Acceso a Internet UNAH
Aún no hay calificaciones
Políticas de Acceso a Internet UNAH
13 páginas
Consolas Es Una Fuente Monoespaciada
Aún no hay calificaciones
Consolas Es Una Fuente Monoespaciada
4 páginas
Computación e Informática 2° Año
Aún no hay calificaciones
Computación e Informática 2° Año
5 páginas
Sincronización en Sistemas Distribuidos
Aún no hay calificaciones
Sincronización en Sistemas Distribuidos
19 páginas
Procedimiento Asociar Distribuidores Herbalife
Aún no hay calificaciones
Procedimiento Asociar Distribuidores Herbalife
13 páginas
Tarjetitas Souvenir PDF
Aún no hay calificaciones
Tarjetitas Souvenir PDF
1 página
Cabelado de Red
Aún no hay calificaciones
Cabelado de Red
4 páginas
Susana Ibañez Mientras Vence La Sombra
Aún no hay calificaciones
Susana Ibañez Mientras Vence La Sombra
163 páginas
Método de Intervalo Medio o Bisección
Aún no hay calificaciones
Método de Intervalo Medio o Bisección
4 páginas
Modelo Canvas Powerpoint
Aún no hay calificaciones
Modelo Canvas Powerpoint
1 página
Guía del Patrón Singleton en Software
Aún no hay calificaciones
Guía del Patrón Singleton en Software
14 páginas
Manual Kotlin: Variables y Más
Aún no hay calificaciones
Manual Kotlin: Variables y Más
33 páginas
Python para Todos Tarea 1.14. Ejercicios
Aún no hay calificaciones
Python para Todos Tarea 1.14. Ejercicios
5 páginas
Cuaderno de Ejercicios Power BI
67% (3)
Cuaderno de Ejercicios Power BI
31 páginas
Soluciones de Ecuaciones Lineales
Aún no hay calificaciones
Soluciones de Ecuaciones Lineales
16 páginas
Manifiest Erotube
Aún no hay calificaciones
Manifiest Erotube
4 páginas
Actividad 1. Cuadro Comparativo Paradigmas Cuantitativo y Cualitativo
Aún no hay calificaciones
Actividad 1. Cuadro Comparativo Paradigmas Cuantitativo y Cualitativo
3 páginas
Medios Tradicionales y Digitales: Comparativa
100% (2)
Medios Tradicionales y Digitales: Comparativa
4 páginas
Propuesta de Valor y Prototipos Ágiles
100% (1)
Propuesta de Valor y Prototipos Ágiles
67 páginas
Guía de Limpieza de Equipos Informáticos
Aún no hay calificaciones
Guía de Limpieza de Equipos Informáticos
4 páginas
Pruebas y Planchas de Impresión
Aún no hay calificaciones
Pruebas y Planchas de Impresión
3 páginas
Examen Final Resuelto
Aún no hay calificaciones
Examen Final Resuelto
25 páginas
Evidencia Final Codificacion de Los Modulos Del Sistema de Informacion
Aún no hay calificaciones
Evidencia Final Codificacion de Los Modulos Del Sistema de Informacion
26 páginas