0% encontró este documento útil (0 votos)
160 vistas43 páginas

Temas Específicos para La Preparación de La Oposición Al Cuerpo Superior de Sistemas y Tecnologías de La Información de La Administración Del Estado

Este documento resume los principales tipos de sistemas de almacenamiento para grandes sistemas e información, incluyendo discos, cintas, arquitecturas de almacenamiento como SAN, NAS y DAS, y arquitecturas de backup como cintas y virtual tape libraries. Explica las tecnologías subyacentes de discos y cintas, y describe las arquitecturas de almacenamiento, backup y políticas de backup comúnmente utilizadas.

Cargado por

jjig
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
160 vistas43 páginas

Temas Específicos para La Preparación de La Oposición Al Cuerpo Superior de Sistemas y Tecnologías de La Información de La Administración Del Estado

Este documento resume los principales tipos de sistemas de almacenamiento para grandes sistemas e información, incluyendo discos, cintas, arquitecturas de almacenamiento como SAN, NAS y DAS, y arquitecturas de backup como cintas y virtual tape libraries. Explica las tecnologías subyacentes de discos y cintas, y describe las arquitecturas de almacenamiento, backup y políticas de backup comúnmente utilizadas.

Cargado por

jjig
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Asociación Profesional del Cuerpo Superior

de Sistemas y Tecnologías de la Información


de la Administración del Estado

Temas Específicos para la preparación de la Oposición al Cuerpo


Superior de Sistemas y Tecnologías de la Información de la
Administración del Estado.

TEMAS ESPECÍFICOS II: Tecnología Básica

048. Sistemas de almacenamiento para sistemas grandes y


departamentales. Dispositivos para tratamiento de información
multimedia. Virtualización del almacenamiento.

AUTOR: Juan Guevara


Actualizado 2014

1
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Indice
1. Introducción ............................................................................................................................ 3
2. Tecnología básica de almacenamiento ................................................................................. 4
2.1. Discos ............................................................................................................................ 6
2.1.1. Tecnologías y Características ............................................................................... 8
2.1.2. Redundant Array of Independent Disks (RAID) .................................................. 10
2.1.3. Cabina ................................................................................................................. 17
2.2. Cintas .......................................................................................................................... 19
2.2.1. Tecnologías y características .............................................................................. 20
2.2.2. Librerías ............................................................................................................... 21
2.3. Tabla resumen de Soportes ........................................................................................ 22
3. Arquitecturas de Almacenamiento ....................................................................................... 23
3.1. Discos internos ............................................................................................................ 23
3.2. Direct Attached Storage (DAS) ................................................................................... 25
3.3. Storage Area Network (SAN) ...................................................................................... 26
3.3.1. SAN FibreChannel (SAN FC) .............................................................................. 28
3.3.2. Internet SCSI (iSCSI) .......................................................................................... 29
3.3.3. Fibre Channel sobre Ethernet (FCoE) ................................................................. 30
3.3.4. SAN para Mainframe (ESCON y FICON) ............................................................ 31
3.3.5. Seguridad en redes SAN ..................................................................................... 31
3.3.6. Mecanismos de Replicación ................................................................................ 33
3.3.7. Mecanismo de Virtualización (VSAN) ................................................................. 35
3.4. Network Attached Storage(NAS)................................................................................. 36
3.4.1. Red LAN .............................................................................................................. 37
3.4.2. Red WAN ............................................................................................................. 37
4. Arquitecturas de Backup ...................................................................................................... 38
4.1. Virtualización (VTL) ..................................................................................................... 39
4.2. Resumen arquitecturas de backup.............................................................................. 40
5. Políticas de backup .............................................................................................................. 41
5.1. Tipos de backup .......................................................................................................... 41
5.2. Rotación de medios ..................................................................................................... 42
5.3. InformationLifecycle Management (ILM) ..................................................................... 43

2
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
1. Introducción
El presente tema aborda una de las necesidades de sistemas informáticos que más crecen con
el tiempo, el almacenamiento, y la manera de disponer de manera segura de los datos de una
organización. Se inicia partiendo de la tecnología subyacente (discos y cintas), para a
continuación especificar las arquitecturas de almacenamiento y de respaldo del mismo, esto es,
las soluciones de backup

Discos
Tecnología de
base
Cintas

Discos internos

DAS
Arquitecturas
Almacenamiento almacenamiento SAN

NAS

Cintas y VTL
Arquitecturas de
Backup Políticas de
Backup

3
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
2. Tecnología básica de almacenamiento
Si nos centramos en el tipo de soporte de los datos, los dispositivos de almacenamiento para
grandes sistemas pueden dividirse básicamente en dos grandes bloques.

Por un lado existen dispositivos basados en tecnología electromagnética, en los que los datos
se almacenan en forma de campos magnéticos inducidos en el soporte por medio de
dispositivos electromagnéticos y por otro lado existen dispositivos ópticos, en los que los datos
se almacenan provocando variaciones en las características ópticas, utilizando en general
dispositivos laser para la grabación y la lectura.

 Dentro de los dispositivos magnéticos encontramos las cintas y los discos. Las
cintas están básicamente orientadas a almacenamiento de grandes cantidades de
datos en los que el tiempo de acceso no es crítico, como backups, mientras que los
discos son el soporte adecuado para el almacenamiento de datos con acceso “on-line”,
representando el soporte primario de la información.

 Los dispositivos ópticos existen en diversos formatos, desde los dispositivos tipo cd
o dvd orientados al mercado de consumo aunque con posibles usos en segmentos
empresariales en forma de librerías automáticas, hasta los sistemas MO (magneto-
ópticos) y UDO (Ultra Density Optical disk) orientados a aplicaciones empresariales.

Los dispositivos ópticos presentan unas características intermedias entre los discos y
las cintas, estando orientados al igual que las cintas a aplicaciones de almacenamiento
masivo de datos, backups, archivado, etc., con capacidades menores que las cintas
pero tiempos de acceso más cercanos a los de los discos.

4
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Otra clasificación de los soportes de almacenamiento se basa en el modo y tiempo de
acceso, referidos a las operaciones de lectura y escritura. En este caso, se pueden diferenciar
entre los siguientes tipos de soportes:

Modo de
lectura / Descripción
escritura

Acceso “on- Este es el tipo de acceso normal a la información, en el que las aplicaciones
line”, lectura- pueden acceder a los datos tanto para lectura como para escritura y en el que el
escritura tiempo de acceso a los mismos debe ser corto ya que se trata de datos
accedidos con frecuencia. En este caso se trata en general de dispositivos de
disco.

Cuando los datos dejan de ser accedidos con una frecuencia elevada, debido
principalmente al paso del tiempo, pueden utilizarse dispositivos de
almacenamiento que proporcionen una mayor capacidad, o un menor coste del
Archivado almacenamiento, siendo tolerable una penalización en el tiempo de acceso ya
que los datos no son accedidos con frecuencia.

Este tipo de almacenamiento puede estar basado en cinta, dispositivos ópticos o


estructuras especiales de discos magnéticos que priman la capacidad frente al
tiempo de acceso.

Si los datos almacenados no cambian (por ejemplo, imágenes de escaneo de


documentos) o la misma información puede estar duplicada en muchos sitios
(por ejemplo, ficheros adjuntos en correos reenviados a múltiples destinatarios)
pueden utilizarse sistemas de almacenamiento optimizados para almacenar este
Almacenamient tipo de información.
o contenido
estático. CAS Los sistemas CAS (Content Address Storage) permiten almacenar una única
copia de la información duplicada, sustituyendo las duplicaciones por referencias
al documento original, que al ser de tipo estático, no cambiará a lo largo del
tiempo y no invalidará las referencias.

De esta forma es posible reducir el espacio de almacenamiento requerido.

Existen situaciones en las que la regulación hace necesario garantizar que los
datos que han sido almacenados no sean modificados, se mantengan
almacenados durante un tiempo determinado e incluso que posteriormente sean
destruidos sin dejar ninguna huella en el sistema.
Escritura única:
WORM Los dispositivos de almacenamiento de tipo WORM (Write Once Read Many)
permiten garantizar que la información no es modificada una vez escrita y que,
una vez pasado el periodo de retención, es destruida.

Los dispositivos WORM están basados en cinta o en almacenamiento óptico,


aunque también existen sistemas especiales basados en disco.

5
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
2.1. Discos
Como se ha citado antes, el almacenamiento en disco se basa en tecnología
electromagnética. Los discos están compuestos de una serie de platos circulares recubiertos
de una capa de material magnético sobre los que se sitúan las cabezas de lectura/escritura.

Mediante una corriente eléctrica en las cabezas de escritura se induce un campo magnético
sobre la superficie del plato, cuya polarización depende de las características de la corriente
eléctrica. En función de la polarización inducida se producirá la grabación de un cero o un uno.

Para la lectura de los datos, la cabeza lectora se sitúa sobre la posición a leer, induciéndose en
la misma una corriente eléctrica que dependerá de las características del campo magnético
creado en la superficie del plato durante el proceso de escritura. En función de la corriente
inducida se leerá un cero o un uno.

Los componentes básicos de un disco son los siguientes:

Elemento Descripción

Constituyen el soporte básico de la información. En la superficie magnética


de los mismos es donde se almacenan los datos.

La capacidad de almacenamiento del disco dependerá del número de platos


existentes en el mismo, de la densidad de datos por unidad de superficie,
dependiente del material magnético y de la tecnología de escritura, y del
tamaño de los platos.
Platos
Cuanto mayor sea el diámetro del plato mayor será la capacidad (a igualdad
de tecnología de escritura y de densidad), pero también será mayor el
tiempo de búsqueda, al tener que desplazarse más las cabezas, la energía
necesaria para hacer girar el disco y las vibraciones generadas por el giro.

Cuanto mayor sea la velocidad de giro de los platos mayor será la velocidad
de transferencia de datos y menor el tiempo de búsqueda, pero será
necesaria más energía para hacerlo girar y se producirán más vibraciones.
Cabezas de Las cabezas de lectura/escritura se sitúan sobre los platos, sin estar en
lectura/escrit contacto con los mismos, desplazándose radialmente sobre los platos
ura mientras estos giran.

6
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Elemento Descripción

Existirá al menos una cabeza sobre cada plato, pudiendo existir más de una
cabeza sobre un mismo plato para reducir el tiempo de posicionamiento de
las mismas, al tener que atender una superficie menor del plato.

Es la parte que da soporte a los platos y las cabezas, sobre la que giran los
Eje
platos y se desplazan las cabezas.

Es elemento que realiza el desplazamiento de las cabezas, mediante un


Actuador electroimán gestionado por el controlador del disco e imanes fijos situados
sobre el soporte de las cabezas de lectura/escritura.
Para mejorar el rendimiento tanto en lectura como en escritura, los discos
incorporan memoria interna. Los datos se almacenan inicialmente en la
memoria interna y de esta pasan a las cabezas y a los platos y viceversa.

En una escritura los datos son depositados en primer lugar en la memoria


interna y posteriormente se trasladan a los platos, de forma que desde el
Memoria punto de vista del dispositivo que ordena la escritura, esta finaliza en el
interna momento en el que se graban los datos en la memoria interna, aumentando
el rendimiento de escritura.

En el caso de las lecturas, si el disco dispone de un algoritmo de gestión de


caché que intenta cargar en memoria los datos que prevea que van a ser
leídos, se puede acelerar el tiempo de acceso en lectura siempre que se
produzcan aciertos de caché.
Este componente o componentes son los que proporcionan la “inteligencia”
al disco, gestionando el movimiento de los platos y las cabezas, la memoria
interna, los protocolos de comunicación con los dispositivos que ordenan las
Controlador
lecturas y las escrituras, ordenación temporal de las operaciones, etc.
interno
Puede existir un único controlador que se ocupe de todas las actividades o
varios controladores especializados en las distintas tareas.
Constituye el mecanismo de comunicación entre los dispositivos que
realizan operaciones de entrada/salida y el disco.

Incluye desde las características físicas de conexión hasta los protocolos de


comunicación y gestión de las operaciones de entrada/salida.

En función de la mayor o menor complejidad de la interfaz, serán necesarios


más o menos componentes electrónicos en el disco, variando con ello el
Interfaz
coste del mismo.

En general cuanto más compleja sea la interfaz, mayor rendimiento se


podrá obtener de un mismo disco. Por ejemplo, si una interfaz permite la
gestión de colas de E/S por parte del disco, el controlador podrá ordenar las
lecturas/escrituras de forma que se minimicen los desplazamientos de las
cabezas, disminuyendo el tiempo de servicio, aunque ello requerirá un
controlador más complejo, con más capacidad de proceso, de memoria, etc.

Existen por lo tanto muchos elementos dentro de los componentes de un disco que influirán en
el rendimiento del mismo. En general cuanto más rendimiento se pretenda obtener de un disco
mayor será la complejidad mecánica, electromagnética y electrónica del mismo y mejores
deberán ser las características de la interfaz para poder aprovechar al máximo las
capacidades, todo ello contribuyendo a un mayor coste del dispositivo.

7
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
2.1.1. Tecnologías y Características
A la hora de evaluar un medio de almacenamiento se tienen en cuenta parámetros como los
siguientes:

 Tiempo medio de acceso: tiempo medio que tarda la aguja en situarse en la pista y el
sector deseado; es la suma del Tiempo medio de búsqueda (situarse en la pista),
Tiempo de lectura/escritura y la Latencia media (situarse en el sector).

 Tiempo medio de búsqueda: tiempo medio que tarda la aguja en situarse en la pista
deseada; es la mitad del tiempo empleado por la aguja en ir desde la pista más
periférica hasta la más central del disco.

 Tiempo de lectura/escritura: tiempo medio que tarda el disco en leer o escribir nueva
información. Depende de la cantidad de información que se quiere leer o escribir, el
tamaño de bloque, el número de cabezales, el tiempo por vuelta y la cantidad de
sectores por pista.

 Latencia media: tiempo medio que tarda la aguja en situarse en el sector deseado; es
la mitad del tiempo empleado en una rotación completa del disco.

 Velocidad de rotación: revoluciones por minuto de los platos. A mayor velocidad de


rotación, menor latencia media.

 Tasa de transferencia: velocidad a la que puede transferir la información a la


computadora una vez que la aguja está situada en la pista y sector correctos. Puede
ser velocidad sostenida o de pico.

Los discos suelen clasificarse haciendo referencia al tipo de interfaz, aunque esta
denominación lleva implícitas las demás características del disco, ya que en general los discos
con interfaz basada en SCSI (SCSI paralelo, FC, SAS) están orientados a rendimiento en
entorno empresarial, teniendo un mayor precio y unas características mecánicas y electrónicas
más complejas, mientras que los discos con interfaz basada en ATA (ATA paralelo, SATA)
están orientados a capacidad, siendo menor el precio por GB.

8
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
A continuación se detallan las características más importantes de cada una de las tecnologías
mencionadas

Tecnología
Características de últimas
de Disco Descripción
versiones
(interfaz)
Se inician en el entorno doméstico, como discos de Su última versión, ATA-8,
ATA / IDE bajo coste y alta capacidad, con un interfaz mucho soporta velocidades de hasta
más sencillo que SCSI y un bus paralelo 1,33 Gbps
Interfaz serie cuyos niveles altos son compatibles
con ATA. Las mejores características de este
interfaz así como la necesidad del entorno
empresarial de almacenar grandes cantidades de
datos lleva a la aparición de discos SATA orientados
al entorno empresarial, con un menor precio por GB
El último estándar, SATA 3,
que los discos basados en SCSI, con características
soporta transferencias de hasta
SATA mecánicas y electromagnéticas inferiores a los
4.8 Gbps, además de conexión
discos orientados a rendimiento pero orientadas
en caliente.
también a dicho entorno empresarial.

Existe una variante, los discos FATA, que mantienen


la interfaz ATA y la estructura interna básica de un
disco SATA pero incorporan como interfaz física una
interfaz Fibre Channel
Interfaz paralelo orientado a alto rendimiento en Progresivamente sustituido por
entornos empresariales, pero el interfaz paralelo SAS, sus últimas versiones han
SCSI
impone restricciones en cuanto a distancia, llegado a entornos de velocidad
velocidades máximas, complejidad del cableado máxima de 800 Mbps
Su última evolución, SAS 600,
SAS (Serial Attached SCSI) surge como evolución
consigue velocidades de hasta 6
del SCSI paralelo ofreciendo una interfaz serie de
SAS Gbps, mientras que se espera
alto rendimiento posicionada en un entorno
llegar a una velocidad de
intermedio entre FC y SCSI
alrededor de 12 Gbps
Las implementaciones están
disponibles a 1 Gbps, 2 Gbps y 4
mantienen las capas altas del protocolo SCSI y se Gbps. Un estándar a 8 Gbps
FC sustituye el cableado paralelo por una interfaz física está en desarrollo. Un desarrollo
serie de alto rendimiento a 10 Gbps ha sido ratificado,
pero en este momento sólo se
usa para interconectar switches

9
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
A modo de resumen, en función del tipo de uso del disco y del mercado objetivo, se combinan
las distintas características del mismo, pudiendo establecerse básicamente dos grupos de
discos: orientado s a rendimiento y orientados a capacidad

 Discos de altas prestaciones, orientados a rendimiento, interfaces SCSI, FC, SAS

Velocidad de giro: 10000/15000 r.p.m.


Tamaños: 36/73/146/300 GBytes aproximadamente (dependiendo del fabricante)
Velocidades medias de búsqueda: 3-4 ms

 Discos de alta capacidad, interfaces: ATA, SATA, FATA

Velocidad de giro: 7200 r.p.m.


Tamaños: 250/320/400/500/750/1000 GBytes aproximadamente (dependiendo del
fabricante)
Velocidades medias de búsqueda: 8-9 ms

Aunque no se trata de un disco en el sentido hasta aquí explicado, a continuación se describe


una tecnología llamada a sustituir a los discos. Son las unidades de estado sólido o SSD.

Una unidad de estado sólido o SSD (acrónimo en inglés de solid-state drive) es un dispositivo
de almacenamiento de datos que puede estar construido con memoria no volátil. Al no tener
piezas móviles, una unidad de estado sólido reduce drásticamente el tiempo de búsqueda,
latencia y otros, diferenciándose así de los discos duros.

Las unidades de estado sólido tienen el mismo uso que los discos duros y emplean las mismas
interfaces, pero no están formadas por discos mecánicos, sino por memorias de circuitos
integrados para almacenar la información. El uso de esta clase de dispositivos anteriormente
se limitaba a las supercomputadoras, por su elevado precio, aunque hoy en día ya son más
asequibles para el mercado doméstico

Esos soportes son muy rápidos ya que no tienen partes móviles y consumen menos energía.
Todo esto les hace muy fiables y físicamente duraderos. Sin embargo su costo por GB es aún
muy elevado respecto al mismo coste de GB en un formato de tecnología de Disco Duro siendo
un índice muy importante cuando hablamos de las altas necesidades de almacenamiento que
hoy se miden en orden de Terabytes

2.1.2. Redundant Array of Independent Disks (RAID)


El objetivo de las arquitecturas RAID (Redundant Array of Independant/Inexpensive Disks) es el
de mejorar las capacidades (prestaciones, capacidad de almacenamiento, seguridad de los
datos, etc.) que es posible alcanzar con un único disco mediante la combinación de varios
discos, que gestionados por el controlador RAID aparecen ante el servidor como uno único.

Los distintos niveles de RAID son combinaciones de dos mecanismos básicos, el particionado
o “stripping” y la duplicación o “mirroring”.

Mediante el particionado, una escritura o lectura dirigida a un disco se divide en varias partes,
siendo atendida cada una de ellas por un disco distinto, obteniendo de esta forma mejoras en
rendimiento, ya que el acceso se realiza en paralelo por varios discos, y en capacidad del
disco, ya que se suma la de los diferentes discos.

Mediante la duplicación, una escritura o lectura dirigida a un disco se envía simultáneamente


a varios discos, obteniendo de esta forma mejoras en seguridad de los datos, al estar estos
almacenados en varios discos. Una variante de este esquema consiste en no duplicar toda la
información, sino en obtener alguna función resumen (por ejemplo paridad) que permita
reconstruir los datos en caso de pérdida y grabar los datos más el resumen.

10
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Los distintos niveles RAID que se pueden encontrar son, entre otros, los siguientes:

Tipo
Descripción
de
RAID
Consiste en hacer “stripping” de la información.

Un bloque escrito a disco se divide en tantas partes como discos físicos formen el
RAID y se envía una parte a cada disco de forma simultánea.

RAID 0

Consiste en hacer “mirroring” de la información.

Cada bloque escrito a disco se escribe simultáneamente en dos discos físicos.

No mejora el rendimiento en escritura (puede mejorarlo en lectura según el


controlador, al poder leer simultáneamente de dos discos) y pierde el 50% de la
capacidad bruta de almacenamiento, pero garantiza la alta disponibilidad al tener
totalmente duplicados los datos.

RAID 1

11
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Tipo
Descripción
de
RAID
Este nivel de RAID divide los bloques a nivel de bit. Por cada “palabra” enviada a
escritura calcula un código de Hamming que permite recuperar la información en
caso de fallo de un disco y envía posteriormente cada bit (de la palabra y del
código de Hamming) a un disco distinto.

Los códigos Hamming permiten no solo la detección de errores sino también la


corrección de los mismos, pero requieren más de un bit para ello (en función del
número de bytes que formen la palabra), por lo que el número de discos
requeridos es grande.

Este nivel de RAID no es implementado en la práctica.


RAID 2

Consiste en hacer “stripping” a nivel de byte más un disco de paridad dedicado.

Al calcular la paridad a nivel de byte, requiere que los discos estén completamente
sincronizados y se acceda simultáneamente a todos ellos.

Ofrece un gran rendimiento para aplicaciones que accedan a grandes bloques de


datos de forma secuencial. Este nivel de RAID no es muy común.

RAID 3

12
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Tipo
Descripción
de
RAID
Consiste en hacer “stripping” a nivel de bloque, como RAID 0 más un disco de
paridad dedicado. Cada bloque escrito es dividido en partes, se obtiene un bloque
de paridad que permite recomponer el bloque inicial en caso de pérdida de alguna
de las partes. Cada parte en la que se descompuso el bloque inicial se graba en
un disco y el bloque de paridad en otro disco dedicado en exclusiva a la paridad.

De esta forma se obtienen mejoras en rendimiento frente a RAID 3 al calcular la


paridad para todo el bloque en lugar de para cada byte y mejoras en disponibilidad
al poder recuperarse del fallo de un disco utilizando la información de paridad.

El principal inconveniente de este tipo de RAID es que el disco de paridad puede


resultar limitante, al tener que escribir siempre en él.
RAID 4

Este nivel de RAID es similar a RAID 4, salvo que no utiliza un disco de paridad
dedicado, sino que distribuye los bloques de paridad por todos los discos del
array, eliminando el potencial cuello de botella del disco de paridad, que en RAID
4 y RAID 3 debía ser accedido en cada escritura.

Al igual que RAID 2, 3 y 4, permite recuperarse de la pérdida de un disco, al poder


recuperar la información utilizando el disco de paridad (o reconstruir el disco de
paridad si es este el que falla)

Es uno de los niveles de RAID más comunes.

RAID 5

13
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Tipo
Descripción
de
RAID
RAID 6 es similar a RAID 5, salvo que calcula dos bloques de paridad
independientes por cada escritura, mandando cada uno de los bloques de paridad
a un disco diferente.

El rendimiento es ligeramente inferior a RAID 5 al tener que calcular dos veces la


paridad, pero permite recuperarse del fallo simultáneo de dos discos. Al utilizar
dos discos en lugar de uno para la paridad, la capacidad neta es menor que en
caso de utilizar RAID 5.

Este nivel es utilizado en sustitución de RAID 5 cuando el RAID está basado en


discos con una mayor tasa de fallos, como los discos SATA.

RAID 6

Este esquema es una mezcla de RAID 0 y RAID [Link] en hacer un


“mirroring” (1) de dos conjuntos de “stripes” (1).

La implementación más común es disponer un controlador de RAID 1 al que se


conectan dos controladores de RAID 0 en lugar de discos individuales. Un bloque
de datos escrito al RAID es duplicado por el controlador del RAID 1 y cada réplica
es enviada a uno de los controladores de RAID 0, que divide cada bloque en
varias partes y graba cada una de ellas en un disco distinto.

RAID
0+1

14
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Tipo
Descripción
de
RAID
Este esquema es una mezcla de RAID 1 y RAID 0. Consiste en hacer un “stripe”
(0) en el que cada disco está espejado (1).

La implementación más común es disponer un controlador de RAID 0 al que se


conectan varios controladores de RAID 1 (uno por cada “stripe”) en lugar de discos
individuales. Un bloque de datos escrito al RAID es troceado por el controlador del
RAID 0 y cada “trozo” es duplicado por cada uno de los controladores de RAID 1 y
grabado en un disco distinto.

Este esquema soporta fallos en más de un disco (siempre que no se produzcan en


la misma pareja de “mirror”), mientras que el esquema anterior solamente soporta
fallo en más de un disco siempre que se produzcan dentro del mismo conjunto de
RAID “stripes”
1+0

Este esquema es una mezcla de RAID 0 y RAID 3, aunque a veces recibe el


nombre de RAID 53.

Consiste en el uso de un controlador de RAID 3 realizando “stripping” a nivel de


byte seguido de controladores de RAID 0 realizando “stripping” a nivel de bloque.

RAID
0+3

15
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Tipo
Descripción
de
RAID
Este esquema es una mezcla de RAID 3 y RAID 0.

Consiste en el uso de un controlador de RAID 0 realizando “stripping” a nivel de


bloque seguido de controladores de RAID 3 realizando “stripping” a nivel de byte.
Este nivel es algo más común que RAID 0+3.

RAID
3+0

Este esquema es una mezcla de RAID 0 y RAID 5.


RAID
0+5 Consiste en el uso de un controlador de RAID 5 realizando “stripping” a nivel de
bloque con paridad distribuida seguido de controladores de RAID 0 realizando
“stripping” a nivel de bloque.
Este esquema es una mezcla de RAID 5 y RAID 0.

Consiste en el uso de un controlador de RAID 0 realizando “stripping” a nivel de


bloque seguido de controladores de RAID 5 realizando “stripping” a nivel de
bloque con paridad distribuida.

RAID
5+0

16
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Tipo
Descripción
de
RAID
Este esquema es una mezcla de RAID 1 y RAID 5.

Consiste en el uso de un controlador de RAID 5 realizando “stripping” a nivel de


bloque con paridad distribuida seguido de controladores de RAID 1 realizando
“mirroring” a nivel de bloque.

Este tipo de esquema, igual que el 5+1, alcanza las mayores tasas de tolerancia a
fallos, al combinar paridad con espejado, a costa de tener una eficiencia menor
que el resto de niveles, al utilizar más discos para información redundante.

RAID
1+5

Este esquema es una mezcla de RAID 1 y RAID 5.

Consiste en el uso de un controlador de RAID 1 realizando “mirroring” seguido de


RAID controladores de RAID 5 realizando “stripping” a nivel de bloque con paridad
5+1 distribuida.

Este tipo de esquema, igual que el 1+5, alcanza las mayores tasas de tolerancia a
fallos, al combinar paridad con espejado, a costa de tener una eficiencia menor
que el resto de niveles, al utilizar más discos para información redundante.

Aunque todas las implementaciones de RAID difieren en algún grado de la especificación


idealizada, algunas compañías han desarrollado implementaciones RAID completamente
propietarias que difieren sustancialmente de todas las demás.

Existen multitud de ejemplos y fabricantes:RAID 50EE, Paridad doble,RAID 1.5, RAID 7, RAID
S o RAID de paridad, Matrix RAID, Linux MD RAID 10, IBM ServeRAID 1E o RAID Z

2.1.3. Cabina
En general en los entornos empresariales el almacenamiento en disco se presenta integrado
dentro de cabinas de discos, que incluyen los elementos de conectividad a los servidores, los
controladores (protocolos de acceso, RAID, caché, mecanismos de copia, etc) y los discos
individuales.

17
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Las cabinas pueden conectarse a los servidores directamente (DAS) o a través de redes,
dando acceso a los datos a nivel de bloque (red SAN) o a nivel de fichero (red NAS).

Las partes más importantes de una cabina son:

 Los front-ends dedicados a proporcionar conectividad implementan las distintas interfaces


de la cabina, FC, SAS, iSCSI, FICON, ficheros (NFS, CIFS,…), etc. Un parámetro
importante de los front-ends es el número de puertos que presentan para cada uno de los
protocolos que soportan, así como la velocidad de los mismos.

 Los back-ends son los componentes que dan acceso a los discos. Dependiendo del tipo
de discos que utilicen dispondrán de una arquitectura distinta: Bucle arbitrado de FC,
conmutador de FC, conexiones SAS basadas en extensores, conexiones SATA, etc. En
general el número de discos en cada cabina será variable. En cabinas de gama alta cada
conjunto de discos forma parte de su propia agrupación, siendo necesario ampliar de forma
conjunta los back-ends y los discos, mientras que en las cabinas de gama media o baja
todos los discos forman parte de una misma agrupación, que se amplía introduciendo más
bandejas de discos en la cabina pero manteniendo la estructura de control del back-end.

 Finalmente las controladoras son los elementos que proveen la “inteligencia” de las
cabinas, gestionando los niveles de RAID, la caché interna de la cabina, las
funcionalidades software avanzadas (copias instantáneas, remotas, etc) así como la
conexión entre front-ends y back-ends.

Las cabinas de alto rendimiento tienen controladoras con más caché y más funcionalidades
que las cabinas de gama media o baja. Para garantizar la redundancia, las cabinas tienen
varias controladoras, pero en función de la gama de la cabina la redundancia puede ser
proporcionada mediante varias controladoras activas o mediante una controladora activa y
otra de respaldo. Así mismo la memoria caché de las controladoras puede estar espejada
entre ellas para garantizar la máxima disponibilidad.

Un elemento diferenciador entre los distintos tipos de cabinas es la arquitectura interna de


conexión entre front-end, controladora y back-end.

Las cabinas de gama alta presentan en general arquitecturas internas conmutadas, en las
que existe conectividad total entre todos los elementos sin compartición de ancho de banda,
mientras que las cabinas de gama media o baja presentan arquitecturas internas basadas en
bus, en las que existe compartición de ancho de banda entre elementos. Las cabinas de gama
baja pueden tener todos los elementos unidos en un único módulo o presentar una arquitectura
similar a las de gama media pero con menos elementos redundantes.

18
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
2.2. Cintas
La tecnología de almacenamiento basada en cintas está orientada principalmente a
proporcionar gran capacidad de almacenamiento a un coste inferior al de los discos, a
costa de perder rendimiento en la grabación y el acceso a los datos.

Las cintas presentan un modo secuencial de acceso a los datos frente al modo aleatorio de
los discos, por lo que la tecnología de cintas es intrínsecamente más lenta que la de disco,
aunque si la aplicación solamente requiere acceso secuencia (por ejemplo, un backup) esa
diferencia puede verse reducida.

Dentro de los distintos modelos de cintas se puede hacer una división entre

 Cintas orientadas a trabajo “on-line” en el que la cinta se utiliza directamente por el


servidor como un dispositivo de almacenamiento más y

 Cintas orientadas a backups, en cuyo caso la cinta se utiliza solamente para


almacenar backups.

La principal diferencia entre ambos modos de trabajo consiste en que en el caso de utilización
de las cintas para trabajo “on-line” esta debe parar, arrancar, rebobinar, etc., muchas veces
durante su utilización, mientras que en la modalidad backup, los datos son transferidos a la
cinta de forma continua, sin necesidad de parar y rearrancar la cinta ni de rebobinarla en una
misma sesión de escritura.

El uso “on-line” impone requisitos mecánicos en las cintas mucho más restrictivos que en el
caso de las cintas destinadas a [Link] uso de cintas “on-line” es casi exclusivo del entorno
mainframe, mientras que en el entorno de sistemas abiertos las cintas se utilizan
principalmente para backup.

Otra diferencia sustancial entre las cintas y los discos es la mayor degradación de las primeras,
debido por una parte a los mecanismos de acceso a los datos, que implican enrollar y
desenrollar la cinta, sacarla del cartucho, arrastrarla por los lectores, falta de aislamiento frente
a humedad, calor, etc, y por otra parte a que el medio (la cinta en si misma) tiene peores
características que los platos de los discos. Esto lleva a que las cintas tengan un tiempo de
vida limitado y deban ser sustituidas tras un número de grabaciones así como a que es
necesario comprobar cada cierto tiempo las cintas para evitar la pérdida de los datos grabados.

En cuanto a la tecnología de grabación, existen principalmente dos tipos de cintas, las que
graban longitudinalmente en la cinta, en varias pistas en función del tipo, y las que graban
diagonalmente (grabación helicoidal).

Las cintas de grabación longitudinal tienen menor capacidad que las de grabación helicoidal,
pero son más rápidas, debido a que es más sencillo el acceso a lo largo de la cinta que en
pistas diagonales.

La conectividad de las unidades o librerías de cintas a los servidores depende del entorno,
utilizándose generalmente SCSI o FC en entornos abiertos y ESCON o FICON en entornos
mainframe.

19
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
2.2.1. Tecnologías y características
Al igual que los grabadores de cassette, las unidades de cinta disponen de una propulsión para
dos bobinas, un botón para reproducir y grabar y otro para borrar. Los datos se leen o escriben
en serie. La capacidad de almacenamiento no sólo depende de la longitud de la cinta, también
del estándar que se emplea

A continuación se describen las principales tecnologías de cintas y sus características

Tipo de
Descripción Características
Cinta
Las cintas DAT surgieron inicialmente como
cintas de grabación de audio digital, pero
posteriormente SONY y HP definieron el
estándar para grabación de datos. Inicialmente surgieron con una
capacidad de 2GB y una tasa de
Utilizan cinta de 4mm y grabación helicoidal. El transferencia de 55KB/s y
cartucho dispone de dos carretes, de forma que actualmente se dispone de
la cinta sale del cartucho para ser accedida y cintas DAT de 12 o 24 GB y
DAT
se vuelve a enrollar en el mismo cartucho en el velocidades de acceso de 1,1
otro carrete, como las cintas de audio o de MB/s o 2,2 MB/s.
video.
Las cintas deben renovarse tras
Utiliza 4 cabezas, dos grabadoras y dos unas 2000 pasadas.
lectoras. Las lectoras están situadas detrás de
las escritoras de forma que en una escritura
verifican lo que la cabeza de escritura ha
grabado.
Inicialmente se trataba de un estándar para Existen dos formatos de 8MM, el
grabación de video que, al igual que las cintas formato Mammoth que alcanza
DAT se transformó para la grabación de datos. los 20 GB por cinta y
velocidades de transferencia de
La tecnología es similar a la de las cintas DAT 6 MB/s y el formato AIT que
8MM pero con mayor capacidad y mayor velocidad alcanza 25 GB por cinta y
de acceso. velocidades de transferencia de
Estas cintas tienen memoria interna que 6 MB/s.
almacena datos sobre índices en la cinta,
estado de la misma, etc, que acelera los La cinta de 8MM es la cinta SCSI
tiempos de búsqueda de la información y el más común.
mantenimiento de la cinta.
Los últimos modelos permiten
almacenar, sin utilizar
compresión, entre 2 y 4 GB por
Este tipo de cintas es de grabación lineal, cinta y alcanzan velocidades de
QIC
frente a la grabación helicoidal de las DAT y las transferencia de hasta 800 KB/s.
8MM.
Las cintas deben renovarse tras
unas 5000 pasadas.

Tienen una tecnología similar a


las QIC, ofreciendo las últimas
Las unidades TRAVAN surgen a partir de las
TRAVAN versiones capacidades de 2,5
QIC para eliminar problemas de
GB a 4 GB por cinta y
incompatibilidades entre diferentes fabricantes.
velocidades de 1MB/s.

20
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Tipo de
Descripción Características
Cinta
Utiliza grabación lineal, con entre
128 y 208 pistas por cinta según
la unidad, permitiendo alcanzar
hasta 300 GB por cinta y
velocidades de transferencia de
DLT La tecnología DLT utiliza cintas alojadas en 36 MB/s.
cartuchos de un solo carrete. La tecnología de acceso a la
cinta minimiza el desgaste de la
misma, pudiendo tener unas
30000 horas de vida útil cada
cinta.

Las cintas LTO surgen de un proyecto de


colaboración entre HP, IBM y Certane con el
objetivo de conseguir un formato estándar y
garantizar la compatibilidad entre los productos
de los distintos fabricantes. Presenta una duración superior
al millón de pasadas,
Es una tecnología de grabación lineal que se velocidades de acceso de 40
divide en dos tipos de cintas, las LTO Accelis MB/s u 80 MB/s con compresión
LTO orientadas a velocidad de acceso y las LTO y capacidades de
Ultrium orientadas a capacidad de la cinta. almacenamiento de 400 GB por
cartucho u 800 GB con
Los cartuchos tienen memoria interna que compresión.
almacena información de posicionamiento para
un acceso rápido a los ficheros e información
de estado de la cinta que permite a las
unidades detectar un cartucho degradado antes
de que se produzca el fallo.
Para el entorno mainframe, utilizando las
unidades de cinta como almacenamiento “on-
line”, parando y arrancando muchas veces la
cinta, se requieren cintas con características
superiores a las anteriores, sobre todo desde el Ejemplos de este tipo de
punto de vista mecánico y de duración. entornos son las cintas T10000
de Sun-STK que alcanza
Unidades
En este entorno los formatos son propietarios capacidades de 500 GB y
entorno
de cada fabricante e incompatibles en general velocidades de 120 MB/s o las
mainframe
con unidades y librerías-robots de cintas de cintas TS1120 de IBM que
otros fabricantes. alcanzan capacidades de 500
GB y velocidades de 104 MB/s
La velocidad de transferencia y la capacidad de
las cintas son solo ligeramente superiores a las
de las cintas LTO o DLT, pero sus
características mecánicas y de durabilidad para
entornos “on-line” son muy superiores.

2.2.2. Librerías
Las unidades de cinta pueden estar agrupadas en librerías, de forma que un servidor
dispone de varias unidades sobre las que cargar los cartuchos.

Las librerías pueden ser manuales, en las que deben ser operadores los que introduzcan las
cintas en las unidades, limitándose la librería a indicar la cinta que debe ser cargada en cada
momento en cada una de las unidades. Algunos modelos de librerías manuales tienen
21
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
mecanismos para detectar si la cinta que se ha introducido en la unidad es la solicitada, dando
un error en caso contrario.

Las librerías manuales están en desuso en los centros de datos, siendo sustituidas por librerías
automáticas, o robots, en los que un brazo mecánico selecciona las cintas y las introduce o
saca de las unidades de cinta.

Las cintas están alojadas en el interior del robot, son clasificadas, seleccionadas y montadas
en las unidades por el robot y según el modelo su integridad puede ser periódicamente
comprobada por la propia librería.

Existen dos tipos de productos de automatización, los cargadores automáticos que contienen
una o dos unidades de cinta y un número limitado de cartuchos normalmente no más de 30, y
los robots o librerías automáticas, que disponen de varias unidades y varios cientos o incluso
miles de cartuchos.

En las librerías automáticas las cintas no salen en general del interior del robot, lo que aumenta
su duración al estar sometidas siempre a las mismas condiciones de temperatura y humedad.

2.3. Tabla resumen de Soportes

Discos básicos Discos de altas Cintas


ATA, SATA, FATA prestaciones
FC, SCSI, SAS
Velocidad de giro: 7200 r.p.m. Velocidad de giro: Modo secuencial de acceso
10000/15000 r.p.m. a los datos frente al modo
Tamaños: aleatorio de los discos, por
250/320/400/500/750/1000 Tamaños: 36/73/146/300 lo que la tecnología es más
GBytes aproximadamente GBytes aproximadamente lenta que la de disco

Velocidades medias de Velocidades medias de Si la aplicación solamente


búsqueda: 8-9 ms búsqueda: 3-4 ms requiere acceso secuencia
(por ejemplo, un backup)
esa diferencia puede verse
reducida.

22
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
3. Arquitecturas de Almacenamiento
La primera diferenciación necesaria al referirse a recursos de almacenamiento es la unidad en
la que se sirve este almacenamiento:

- Si el cliente requiere acceso a disco, éste se le presenta directamente con discos


internos, por medio de una cabina dedicada (DAS) o mediante una red específica de
almacenamiento (SAN)

- La otra opción es que el cliente trabaje a nivel de archivo. En este caso el sistema de
ficheros es creado y gestionado por el sistema operativo del servidor (NAS), que a su
vez tendrá asociado un determinado espacio en discos

En el siguiente diagrama se muestran los principales elementos de cada una de las


arquitecturas de almacenamiento señaladas, que se desarrollarán a continuación

3.1. Discos internos


El modo más básico de conectividad del almacenamiento a los servidores es el
almacenamiento interno, en el que los discos están conectados a un bus interno del servidor.

Este modelo de conectividad presenta dos variantes, la conectividad basada en el bus SCSI
para sistemas empresariales y la basada en el bus ATA para sistemas domésticos, cada uno

23
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
de ellos con características distintas, siendo el SCSI más avanzado y consecuentemente más
complejo y caro.

Ambos buses son de tipo paralelo, lo que conlleva ciertas dificultades y limitaciones que han
llevado a la aparición de conexiones serie en ambos tipos de bus, SAS como evolución de
SCSI y SATA como evolución de ATA. Ambas evoluciones modifican las capas bajas de los
protocolos pasando a un protocolo serie en lugar de paralelo pero conservan las capas altas,
de forma que aseguran la compatibilidad a nivel software.

El almacenamiento interno conlleva una serie de problemas que hacen preferible en un entorno
empresarial el almacenamiento externo. Entre los problemas de esta opción se encuentran:

- la falta de escalabilidad, ya que una vez consumidas las posibilidades de expansión


del servidor no es posible ampliar el almacenamiento
- la dificultad de una ampliación de capacidad, ya que implica conexiones internas al
servidor,
- la dificultad de protección de los datos, ya que en general el almacenamiento interno
no cuenta con las capacidades de replicación y la redundancia de las cabinas de
discos de almacenamiento externo,
- la infrautilización de la capacidad, ya que el almacenamiento sobrante en un servidor
no puede ser utilizada por otro servidor

Los datos de aplicaciones con un mínimo de criticidad no deberían ubicarse en los discos
internos del servidor, quedando éstos relegados a alojar la instalación del sistema operativo y
de la aplicación.

Sin embargo, hasta el uso de esta opción se está limitando aún más debido a la virtualización
de servidores, puesto que también la instalación reside en una red separada de
almacenamiento, en forma de máquina virtual que puede ubicarse en un servidor u otro de
manera rápida
24
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
3.2. Direct Attached Storage (DAS)
Consiste en conectar el dispositivo de almacenamiento directamente al servidor o estación de
trabajo, es decir, físicamente conectado al dispositivo que hace uso de él.

Este tipo de conectividad extiende el protocolo SCSI más allá de los buses internos del
servidor, permitiendo conectar un dispositivo externo (cabina de discos) al servidor.

La conectividad más común entre servidores y almacenamiento está basada en SCSI o en FC,
que sustituye las capas bajas de SCSI por el protocolo serie FC y utiliza las capas altas de
SCSI para enviar comandos de almacenamiento. El protocolo SAS, de reciente aparición,
también sustituye la capa física paralela de SCSI por un protocolo serie y podría ser utilizado
para conectar las cabinas de almacenamiento directamente a los servidores.

Desde el punto de vista del software del servidor, al usar siempre las capas altas del protocolo
SCSI, el almacenamiento externo es utilizado igual que el almacenamiento interno, sin que las
capas de S.O. más allá del driver que gestiona la conectividad distingan entre almacenamiento
interno y externo.

El uso del almacenamiento externo dedicado resuelve los problemas de escalabilidad y


seguridad del almacenamiento interno, ya que en general las cabinas de discos son ampliables
y tienen una capacidad máxima muy superior, al poder albergar muchos más discos, que la
que tienen los discos internos del servidor y además presentan características de alta
disponibilidad, como redundancia de componentes, niveles de RAID espejados o con paridad
para recuperarse del fallo de un disco, software de copia de datos que permite replicar los
datos en tiempo real en otra cabina distinta, etc.

El rendimiento de las cabinas de discos es superior al del almacenamiento interno, ya que las
cabinas están diseñadas exclusivamente para ello e incluyen caché interna y controladores

25
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
sofisticados para gestionar los discos y las colas de I/O que no están presentes en los
servidores.

A pesar de solventar algunos de los problemas del almacenamiento interno, el almacenamiento


externo dedicado aún presenta algunas deficiencias, como la infrautilizaciónde la capacidad
de almacenamiento, ya que al estar conectado directamente a un servidor no se puede utilizar
la capacidad sobrante en otro servidor o lacreación de clústeres, ya que si bien las cabinas
pueden permitir la conexión simultanea de varios servidores y la compartición de discos lógicos
entre ellos, la escalabilidad de los mismos (número de servidores que forman el clúster) está
limitada por la conectividad física de la cabina.

3.3. Storage Area Network (SAN)


Una SAN es una red dedicada al almacenamiento que está conectada a las redes de
comunicación de una organización. Además de contar con interfaces de red tradicionales, los
equipos con acceso a la SAN tienen una interfaz de red específica que se conecta a la SAN.

Se trata de una arquitectura de acceso a bloques y los protocolos de alto nivel que circulan por
la red son los mismos que se utilizan en las conexiones internas de los discos a los servidores
o de las cabinas externas dedicadas. De esta forma, los drivers del servidor dedicados al
acceso a la red de almacenamiento ocultan al resto del S.O. el hecho de que los discos no
están conectados internamente al servidor y el S.O. accede a los mismos como si la conexión
fuese interna.

26
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
La unidad de almacenamiento que provee una red SAN se denomina LUN(Logical Unit
Number) y es un disco virtual proporcionado por la SAN. El administrador del sistema tiene el
mismo acceso y los derechos a la LUN que los que tendría si fuera un disco directamente
conectado al servidor. Por tanto, puede particionar y formatear el disco en cualquier formato
que requiera.

Las SAN se componen de tres capas:

 Capa Cliente. Esta capa consiste principalmente en Servidores, dispositivos o


componentes (interfaz de red, de fibra HBA…) y software (sistemas operativos).

 Capa Red. Esta capa la conforman los cables (Fibra óptica) así como los SAN Hubs y
los SAN switches como punto central de conexión para la SAN. Otra posibilidad es la
utilización de redes basadas en Ethernet

 Capa Disco. Esta capa la componen las formaciones de discos (Disk Arrays, Memoria
Caché, RAIDs) y cintas empleados para almacenar datos.

27
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
La red de almacenamiento puede ser de varios tipos, lo cual va a originar los diferentes
estándares existentes

3.3.1. SAN FibreChannel (SAN FC)


Las redes SAN FC están formadas por un conjunto de switches que conmutan las tramas FC
permitiendo la conectividad de los servidores y los sistemas de almacenamiento conectados a
los mismos.

Los equipos pertenecientes a una red FC se identifican mediante un WWN (World Wide Name),
dirección de 64 bits asignada unívocamente a cada dispositivo.

Cuando el dispositivo realiza su registro en la red, esta le asigna un identificativo de 24 bits


(FCID) que utilizará el dispositivo en sustitución de su WWN cada vez que envíe una trama por
la red. De esta forma se optimiza la conmutación de las tramas, al utilizar un identificativo FCID
más pequeño que el WWN y asignado por los conmutadores de la red en función de la

28
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
topología de la misma y no utilizar un WWN asignado al equipo en el proceso de fabricación y
que lógicamente no corresponderá con la topología de la red.

Con los 24 bits del FCID se pueden direccionar unos 16 millones de dispositivos en una misma
red FC. Los switches dentro de una red SAN se identifican mediante el DomainID, que es
asignado de forma dinámica al registrase los equipos en la red.

Al igual que en redes LAN, existen diferentes categorías de switches FC, desde pequeños
switches de 8 puertos hasta grandes equipos modulares con cientos de puertos (denominados
directores en la terminología de FC) y con distintas características de redundancia,
prestaciones, disponibilidad, etc.

La conexión entre dos switches se realiza mediante ISL (Inter Switch Links) a través de los
cuales los switches se intercambian información sobre la topología de la red.

Dentro de una red FC existen una serie de servicios básicos para su correcto funcionamiento y
que son implementados automáticamente de forma distribuida entre todos los switches que
componen la red. Estos servicios son los siguientes:

- SNS : Servidor que nombres que asigna los FCID y permite traducir de FCID a WWN
- RSCN: Notificación de cambios en la topología de la red. Informa al resto de equipos
de la aparición o desaparición de equipos en la red.
- Login : Servicio al que se registra un equipo al ser conectado a la red FC.
- Servicio de gestión: Servicio que permite la gestión in-band de la red FC utilizando los
mismos enlaces FC por los que se transmite el tráfico.
- Servicio de tiempos: Servidor de tiempos. Está definido en los estándares pero no
suele ser implementado en los equipos.

Cuando dos switches de FC se conectan pasan automáticamente a formar parte de la misma


red SAN, se intercambian la información necesaria para implementar los servicios anteriores
así como información de rutado de tramas basada en FSPF (FabricShortestPathFirst), versión
de OSPF (Open ShortestPathFirst) adaptada a las redes FC.

La tecnología FC está basada en estándares, pero cada fabricante implementa sus propias
variaciones, lo que hace que en general dos switches de distinto fabricante no sean
compatibles en modo nativo. Para hacer compatibles switches de distintos fabricantes existe el
mono interoperatividad, consistente en rebajar la funcionalidad de los equipos hasta el
cumplimiento del estándar.

3.3.2. Internet SCSI (iSCSI)


iSCSI (Internet SCSI) es un estándar que permite el uso del protocoloSCSI sobre redes
TCP/IP. iSCSI es un protocolo de la capa de transporte definido en las especificaciones SCSI-
3. Otros protocolos en la capa de transporte son SCSI Parallel Interface y canal de fibra.

Este tipo de redes SAN permiten el intercambio de tramas SCSI pero sobre TCP/IP, en lugar
de sobre FC.

El objetivo es utilizar la infraestructura LAN existente, u otra dedicada exclusivamente a


almacenamiento, aprovechando de esta forma los menores costes económicos y el mayor
conocimiento de la tecnología frente a FC, que presenta un coste mayor y cuyo conocimiento
está menos extendido entre los recursos humanos.

29
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Al utilizar las capas altas de SCSI igual que FC, a nivel funcional puede ofrecer las mismas
capacidades que las redes FC.

Frente al uso de FC, iSCSI presenta la desventaja de utilizar protocolos “genéricos” de


transporte, como TCP/IP, que no están tan optimizados para el tipo de tráfico requerido en
redes de almacenamiento, por lo que a igualdad de ancho de banda “bruto” para el transporte
las redes iSCSI son menos eficientes que las redes FC. Por el contrario, la evolución
tecnológica de las redes ethernet, con la aparición de interfaces a 10Gbps antes que las
interfaces FC a 8 Gbps, puede hacer que esta menor eficiencia se solvente disponiendo de
mayor ancho de banda a un precio más económico.

En principio es posible implementar iSCSI en software, haciendo uso de tarjetas NIC ethernet
normales, pero de esta forma aumenta el consumo de CPU de los servidores y disminuye el
rendimiento de iSCSI. Para solventar este problema es necesario utilizar tarjetas de red
similares a las HBAs (Host Bus Adapter) de FC, que implementen en hardware tanto el
protocolo iSCSI como el TCP/IP, liberando al servidor de estas tareas y aumentando el
rendimiento, a costa de perder algo de la ventaja competitiva en costes, al ser estas tarjetas
más caras que las NIC ethernet normales.

3.3.3. Fibre Channel sobre Ethernet (FCoE)


Fibre Channel sobre Ethernet (FCoE) permite consolidar una estructura Ethernet para
satisfacer las necesidades de las redes de área local y de almacenamiento. Sin embargo, esto
también significa que ahora dispone de dos opciones de SAN que puede usar en redes
Ethernet: FCoE e iSCSI

FCoE ha sido diseñado sin la capa Protocolo de Internet (IP), no se puede enrutar de forma
intrínseca mediante IP. Sin embargo, se pueden realizar enrutamientos FCoE por medio de
protocolos ya establecidos como FCIP.

30
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
3.3.4. SAN para Mainframe (ESCON y FICON)
En el entorno Mainframe de IBM apareció a mediados de los 90 la tecnología ESCON como
sustituta de la antigua tecnología de conexión paralela por cables de cobre 370.

ESCON introdujo los canales de fibra con un interfaz serie semidúplex con tasas de
transferencia de 20 MBs.

La tecnología ESCON permite conexiones punto a punto directas, en la que el almacenamiento


estaría dedicado a un servidor, y conexiones punto a punto conmutadas, en las que los
distintos servidores y cabinas de almacenamiento están conectadas a un conmutador ESCON
Director, que puede establecer de forma dinámica conexiones dedicadas entre ellos. La
tecnología ESCON no permite la interconexión de conmutadores, por lo que una red está
formada por un único conmutador al que se conectan los servidores y el almacenamiento.

Como evolución de la tecnología ESCON, IBM introdujo la tecnología FICON que utiliza como
medio de transporte FibreChannel, pero no utiliza en capas superiores SCSI como las redes
FC de sistemas abiertos, sino la tecnología propietaria de IBM.

Los canales FICON permiten una tasa de transferencia de 100 MBytes por segundo en canales
de 1Gbps y de 200 MBytes por segundo en canales FibreChannel de 2Gbps.

La tecnología FICON permite la interconexión de FICON Director mediante ISLs creando redes
SAN con más de un conmutador, pero el camino entre el servidor y los discos solo puede
contener dos directores.

Al igual que FC, FICON es una tecnología dúplex, no semidúplex como en el caso de ESCON.

3.3.5. Seguridad en redes SAN


La seguridad en las SAN ha sido desde el principio un factor fundamental, desde su creación
se notó la posibilidad de que un sistema accediera a un dispositivo que no le correspondiera o
interfiriera con el flujo de información

Es por ello que se ha implementado la tecnología de zonificación, la cual consiste en que un


grupo de elementos se aíslen del resto para evitar estos problemas, la zonificación puede
llevarse a cabo por hardware, software o ambas, siendo capaz de agrupar por puerto o por
31
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
WWN (World Wide Name), una técnica adicional se implementa a nivel del dispositivo de
almacenamiento que es la Presentación, consiste en hacer que una LUN (Logical Unit Number)
sea accesible sólo por una lista predefinida de servidores o nodos.

 LUN Masking

El almacenamiento disponible en las cabinas de una red SAN se divide en discos lógicos o
LUNs. Este concepto pertenece a la interfaz SCSI, cuyas capas altas son transportadas
mediante FC, que es el protocolo por excelencia para conectar cabinas de discos y servidores,
bien sea directamente o bien mediante redes SAN.

Si una cabina de discos está conectada a varios servidores mediante una red SAN o
directamente si la cabina dispone de varios puertos de comunicaciones, podrá ofrecer los
discos lógicos, o LUNs, a los servidores que sean configurados.

Si una LUN no es presentada por la cabina a un servidor concreto este no podrá acceder a la
misma, no teniendo constancia ni siquiera de su [Link] esta forma se evita que un
servidor pueda acceder a una LUN que pertenece a otro servidor.

En el caso de servidores en clúster, es normal que tengan acceso simultáneo a un conjunto de


LUNs comunes, para almacenar la información del clúster. En ese caso la cabina de discos
debe permitir el acceso a las mismas LUNs por todos los servidores del clúster.

 Zoning

Las redes SANs de fibrechannel pueden interconectar miles de dispositivos entre sí. Los
conmutadores FC tienen la capacidad de segmentar la red SAN en distintas zonas, en base al
WWN (World Wide Name) de los dispositivos (cabinas de discos o servidores) de forma que
cada dispositivo solo es capaz de comunicarse con el resto de dispositivos que pertenezcan a
su misma zona. Cada zona se comporta como si en la red SAN solo existiesen los dispositivos
que forman parte de ella.

Por lo tanto, para que un servidor pueda acceder a una LUN en una cabina, el servidor y la
cabina deben estar en la misma zona y adicionalmente la cabina debe permitir el acceso del
servidor a dicha LUN.

El concepto de zoning es perteneciente a las redes SAN de FC, mientras que el concepto de
LUN pertenece a las capas altas del protocolo SCSI.

 Fabric/switch/portbinding

Un mecanismo adicional de seguridad ofrecido por las redes SAN es el de portbinding,


mediante el cual se puede limitar la conectividad de un determinado equipo (mediante la
identificación de su WWN) a un determinado puerto de un switch dentro del fabric (red SAN). El
dispositivo solo podrá acceder a la SAN si se conecta físicamente al puerto permitido y
solamente un dispositivo con el WWN indicado podrá conectarse a dicho puerto. De esta forma
se evita que un dispositivo no perteneciente a la SAN pueda conectarse a la misma y obtener
información.

32
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
3.3.6. Mecanismos de Replicación
La replicación es el proceso de copiar y mantener actualizados los datos en varios nodos de
bases de datos ya sean estos persistentes o no. Gracias a este proceso se genera una copia
exacta de parte del sistema. Esa parte puede ser desde un archivo hasta una carpeta, una
partición, un disco o incluso varios discos

En el caso de una red de almacenamiento, es imprescindible disponer de un mecanismo de


este tipo para que la organización no pierda datos en caso de fallos en una de las cabinas

Debido a la vital importancia de garantizar la seguridad de los datos, tanto ante desastres como
ante errores humanos, sabotajes, etc, se hace necesario mantener copias de los datos en
tiempo real en distintos sistemas de almacenamiento y en distintas localizaciones físicas, de
forma que el fallo de uno de los sistemas no implique la pérdida de los datos.

Las capacidades del almacenamiento en red, tanto SAN como NAS, permiten ofrecer réplica
automática de información de forma transparente a los servidores y las aplicaciones.

En función de los requisitos de seguridad, distancia, rendimiento, etc, es posible elegir entre
distintos procedimientos para realizar la replicación en tiempo real de los datos.

Dentro de este tipo de réplica, podemos diferenciar entre copia remota y copia local.

33
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
 Copia remota

Mediante la copia remota se replican los datos que los servidores escriben en los sistemas de
almacenamiento en dos o más instalaciones de forma simultánea.

Si se necesita garantizar que los sistemas de almacenamiento remotos son en todo momento
una copia de los sistemas locales se debe utilizar copia remota síncrona, en la que el servidor
no recibe confirmación de la escritura en el sistema de almacenamiento hasta que el dato ha
sido escrito tanto en el sistema local como en el remoto.

Cuando un servidor escribe un dato en almacenamiento en SAN este es enviado de forma


transparente al servidor tanto a un sistema de almacenamiento local como a uno remoto y solo
cuando ha sido escrito en ambos se devuelve al servidor la confirmación de la escritura. En
caso de no poderse escribir en ambos se deshace la escritura y se devuelve un error al
servidor. De esta forma, en todo momento se puede garantizar que el estado del sistema de
almacenamiento local y remoto es el mismo y además coherente con la visión que de ello tiene
el servidor.

Al tener que esperar a que se produzca la escritura en el sistema remoto, el tiempo de duración
de la escritura es el tiempo de acceso al sistema de almacenamiento más la latencia de las
líneas de comunicaciones entre el centro local y el remoto. Este hecho, junto con la exigencia
de ancho de banda entre ambas localizaciones, hace que la distancia a la que se puede
realizar una réplica síncrona sin que afecte significativamente al rendimiento sea limitada, no
pudiendo alcanzar distancias de centenares de kilómetros.

Para solventar este problema se puede utilizar copia asíncrona, en la que el servidor recibe la
confirmación de la escritura en cuanto esta se ha realizado en el centro local y posteriormente
la red de almacenamiento se encarga de transmitir los datos de forma asíncrona al centro
remoto.

Los mecanismos de copia asíncrona deben garantizar que las escrituras en el centro remoto
conservan el orden en el que el servidor las hizo, mediante la definición de grupos de
consistencia, de forma que se garantice que el estado del sistema remoto sea una réplica del
estado del sistema local pero con un cierto desfase en el tiempo.

En función del desfase temporal que se pueda tolerar es posible extender la copia asíncrona a
grandes distancias, pudiendo incluso situar los centros remotos en continentes distintos.

Una situación posible es el uso simultaneo de copias síncronas situadas a decenas de


kilómetros para garantizar la persistencia total de los datos en caso de desastres locales, junto
con una copia asíncrona simultánea, que aunque mantenga un desfase temporal con el centro
local, permita situar un centro de respaldo a centenares de kilómetros, garantizando la

34
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
persistencia de los datos frente a desastres de mayor alcance a costa de perder las
transacciones de los últimos segundos.

 Copia local

Si no se requiere protección frente a fallos completos de los sistemas de almacenamiento, sino


que se desea protegerse frente a fallos humanos o del software, o se requiere una copia de los
datos para hacer pruebas, es posible utilizar sistemas de copia local.

Estos sistemas permiten disponer, prácticamente sin pérdida de prestaciones y de forma


instantánea, de una copia de los datos residiendo en mismo dispositivo de almacenamiento.

Un fallo hardware del sistema de almacenamiento invalidaría ambas copias, pero no así un
fallo humano o un fallo del software, ya que ambas copias son lógicamente distintas, siendo
una de ellas accedida por los sistemas de producción y estados la otra reservada para pruebas
o para recuperación de desastres.

3.3.7. Mecanismo de Virtualización (VSAN)


En el acceso a bloques la virtualización consiste en eliminar la relación entre el servidor y la
cabina física que le proporciona el espacio en disco, de forma que sea posible cambiar la
cabina o mover los datos de una cabina a otra sin que el servidor sea consciente de ello.

Este tipo de virtualización puede implementarse de tres formas distintas:

 en servidor

En el servidor se debe instalar un software especial de virtualización que oculta al resto


del S.O. la cabina física en la que residen los datos. La capa del S.O. que se encarga
de acceder a los discos lo hace haciendo referencia a dispositivos “virtuales”, que
luego la capa inferior se encarga de transformar en los dispositivos reales.

El principal inconveniente de este tipo de virtualización es que requiere instalaciones


en todos los servidores que vayan a participar en el esquema de virtualización y que
consume ciclos de CPU de los servidores.

35
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
 en red

En este esquema es la propia red SAN, mediante conmutadores inteligentes, la que


proporciona la virtualización. El servidor accede a los discos utilizando direcciones de
cabina “virtuales”. La red SAN se encarga de transformar todas las tramas que circulan
por la red sustituyendo la dirección de las cabinas “virtuales” que utilizan los servidores
por la dirección de las cabinas “reales” en las que residen los datos en cada momento.

De esta forma es posible cambiar el repositorio físico de los datos sin que los
servidores sean conscientes de ello, ya que siguen solicitando los datos a las cabinas
“virtuales”.

 en cabina

En este esquema una cabina con capacidades avanzadas se encarga de reenviar las
peticiones de los servidores a las cabinas en las que realmente residen los datos. Los
servidores utilizan siempre a la cabina virtualizadora como destino de sus peticiones,
como si todos los discos residiesen en ella, pero luego el dispositivo de virtualización
envía los datos a la cabina que corresponda en cada caso.

3.4. Network Attached Storage(NAS)


A diferencia de lo visto hasta este punto, en soluciones NASse realiza acceso a ficheros
directamente contra el servidor de ficheros o la cabina de almacenamiento con capacidad NAS
donde se gestiona el sistema de ficheros.

El S.O. del servidor “monta” un sistema de ficheros externo a través de alguno de los
protocolos destinados a ese fin (NFS, CIFS, Novell, etc) y delega la transformación de fichero a
bloque de bits en la red de almacenamiento.

36
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
3.4.1. Red LAN
El acceso al almacenamiento en red basado en redes SAN permite el acceso a bloques, en el
que el servidor utiliza el disco como si fuese interno, pero este tipo de almacenamiento no
permite el acceso de varios servidores a los mismos datos a no ser que estos formen parte de
un clúster de servidores y se coordinen para el acceso a los datos. Al tratarse de un acceso a
bloques, el sistema de ficheros es creado por el servidor, por lo que dos servidores
independientes no pueden acceder a los mismos bloques, ya que ambos tratarían de mantener
el sistema de ficheros, causando la corrupción del mismo.

Los sistemas de acceso a ficheros solventan este problema delegando la gestión del sistema
de ficheros en el equipo de red que sirve los datos. Los servidores montan los sistemas de
ficheros exportados (por ejemplo, unidades de red en sistemas Windows montadas a través de
CIFS, montaje por NFS en sistemas UNIX/Linux, etc) que son utilizados por las aplicaciones
como si fuesen discos locales pero que para el sistema operativo son discos remotos con el
sistema de ficheros delegado en otro sistema.

Los sistemas que actúan de servidores de ficheros pueden ser servidores de propósito general
en los que se ejecuta un software (que puede ser parte o no del sistema operativo) que actúa
como servidor de ficheros o puede tratarse de dispositivos especiales, denominados NAS,
dedicados en exclusiva a servir ficheros y diseñados especialmente para ello.

Los principales protocolos para el acceso a ficheros son NFS para entornos UNIX/Linux y CIFS
para entornos Microsoft, junto con los protocolos de Novell utilizados en servidores de ficheros
basados en NetWare.

Los servidores de ficheros, tanto los implementados mediante servidores de propósito general
como los implementados mediante dispositivos NAS dedicados, pueden utilizar
almacenamiento interno, externo dedicado o compartido en red SAN para almacenar los
sistemas de ficheros y sus datos asociados.

El servidor de ficheros o NAS tiene como principales funciones la implementación de los


protocolos que permiten compartir los ficheros y la gestión de la estructura de ficheros. El
almacenamiento final de los datos se realiza lógicamente mediante bloques de bits que por lo
tanto pueden residir tanto internamente en el servidor de ficheros como externamente en una
cabina de la red SAN.

3.4.2. Red WAN


Los protocolos de compartición de ficheros están diseñados para utilizarse en una red LAN,
con gran ancho de banda y baja latencia, por lo que su uso a través de redes WAN donde el
ancho de banda es menor y, especialmente, la latencia es mayor presenta problemas que
pueden hacer inviable la compartición de ficheros a grandes distancias (por ejemplo con
oficinas remotas desde un servidor central consolidado).

Para evitar estos problemas está surgiendo el concepto de WAFS (Wide Area File Services),
basado en la compresión de las tramas de datos de los protocolos CIFS y NFS, la
simplificación de ambos protocolos para evitar un excesivo número de mensajes y el uso de
caché local en las oficinas remotas.

Un número elevado de mensajes entre cliente y servidor puede provocar problemas cuando la
latencia de la red es elevada, ya que el tiempo necesario para acceder a un fichero será la
suma del tiempo de ida y vuelta de todos los mensajes necesarios.

Mediante la compresión de los datos se evita el problema del menor ancho de banda de las
redes WAN frente a las redes LAN.

Al utilizar caché de ficheros en las oficinas remotas se evita el acceso a ficheros de las oficinas
centrales siempre que los mismos no hayan sido modificados.

37
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
4. Arquitecturas de Backup
Los sistemas de backup permiten grabar en cinta los datos en un determinado instante de
tiempo.A diferencia de las copias en tiempo real, los datos no se copian en las cintas a medida
que se escriben en los sistemas de almacenamiento “on-line”, sino que se realiza una copia
completa con la periodicidad que se desee y con las aplicaciones paradas, sin realizar
escrituras en los sistemas de almacenamiento.

Una situación típica es la de parar la producción todas las noches durante el tiempo que dure la
realización del backup y volcar todos los datos en cinta.

Frente a los sistemas de réplica en tiempo real presenta la desventaja de tener una imagen de
los datos de un instante fijo anterior en el tiempo, pero tiene como principales ventajas la
posibilidad de mantener varias copias de varios instantes de tiempo (por ejemplo, todas las
noches del último mes) en distintas cintas y poder recuperar la que se desee y además la de
representar un estado coherente de los datos a nivel de aplicación, al detener las aplicaciones
antes de hacer el backup.

En el caso de la réplica síncrona en tiempo real se garantiza que el estado de los datos en el
centro remoto es idéntico al local a nivel de bloque, pero no a nivel de S.O. o aplicación. Un
fallo en el centro local es similar a una parada brusca de un servidor respecto a sus discos
internos. Todo aquello que las aplicaciones y el S.O. tuviesen en caché y no hubiesen volcado
aún al disco se pierde y por lo tanto la imagen del disco tanto local como remoto, a pesar de
ser idénticos a nivel de bit, pueden no ser coherentes a nivel de aplicación.

En cambio en un backup, al haber parado las aplicaciones (o forzado que escriban todos los
datos a disco) la copia que se realiza es consistente a nivel de operación de E/S y a nivel de
aplicación.

El tener que mantener las aplicaciones paradas durante la realización del backup, en lo que se
denomina ventana de backup, hace que la duración del mismo sea crítica. Esta es una de las
razones que potencian la existencia de los virtualizadores de cinta. Estos dispositivos reciben el
backup como si fuesen cintas pero en realidad lo están enviando a disco, con lo que el tiempo
de respuesta es mucho mayor. Cuando acaba el backup se reanuda la producción y a partir de
ese momento el virtualizador puede volcar los datos a cinta sin restricciones temporales.

Para la realización automática de backups de dispositivos NAS o de servidores de ficheros


existe un protocolo estándar denominado NDMP (Network Data Management Protocol) que
permite separación de los caminos de control y de datos, de forma que el backup puede ser
gestionado desde un servidor central de backup mientras que los datos viajan directamente del
servidor de ficheros a las unidades de cinta, pudiendo pasar directamente por la SAN sin tener
que hacer uso de la LAN, como ocurriría en el caso de que el servidor de backup tuviese que
recabar los datos de los servidores de ficheros para posteriormente enviarlos a las unidades de
cinta.

38
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Las cintas presentan un modo secuencial de acceso a los datos frente al modo aleatorio de los
discos, por lo que la tecnología de cintas es intrínsecamentemás lenta que la de disco , aunque
si la aplicación solamente requiere acceso secuencia (por ejemplo, un backup) esa diferencia
puede verse reducida.

Las unidades de cinta pueden estar agrupadas en librerías, de forma que un servidor dispone
de varias unidades sobre las que cargar los cartuchos. Las librerías manuales están en desuso
en los centros de datos, siendo sustituidas por libreríasautomáticas, o robots, en los que un
brazo mecánico selecciona las cintas y las introduce o saca de las unidades de cinta. También
está la opción de Librería de Cintas Virtual, que realmente son discos de bajo coste como
soporte intermedio para un backup más rápido

4.1. Virtualización (VTL)


La virtualización de cintas está enfocada a simular el comportamiento de una libraría de cintas
pero almacenando los datos en disco.

El virtualizador implementa los mismos protocolos que las librerías de cintas, de forma que el
servidor trabaja exactamente igual que lo haría contra una cinta real, pero guarda los datos en
disco, de forma que el tiempo de respuesta es mucho menor y los trabajos (por ejemplo,
backups) finalizan mucho antes.

Posteriormente el virtualizador de cinta puede encargarse de pasar los datos de disco a cinta,
de forma que se mantienen las ventajas de las cintas en cuanto a capacidad de
almacenamiento y menor coste que los discos, pero sin la penalización en rendimiento que
presenta el uso directo de cintas.

Adicionalmente puede aumentarse el ratio de utilización de las cintas, ya que el virtualizador


pasa los datos a cinta en posproceso, de forma que puede acumular en una misma cinta datos
procedentes de distintas sesiones del servidor y que habrían sido grabados en cintas distintas
en el caso de escribir directamente en la librería.

39
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
La virtualización de cintas puede realizarse de distintas formas:

 En servidor

Es un tipo de virtualización similar a la de acceso a disco. Una capa software en el


servidor redirige las operaciones de E/S destinadas a la cinta hacia discos visibles
desde el propio servidor, bien internos o bien externos a través de una red SAN.

 En “appliance”

Un appliance es un pequeño dispositivo dedicado a una función concreta. En este caso


se trata de un dispositivo que implementa los protocolos de las librerías, pero que no
dispone de cintas reales ni de almacenamiento en disco, sino que redirige las
operaciones de E/S a cinta hacia discos que deben estar en la red SAN y hacia
librerías reales también conectadas a la red SAN.

 En dispositivo virtualizador

Este esquema es similar a la virtualización en cabina para acceso a bloques. Un


dispositivo virtualizador implementa los protocolos de las librerías virtuales de cara a
los servidores, pero es mucho más potente que una appliance, incluyendo su propio
espacio de almacenamiento en disco, caché, capacidades de gestión de los datos,
politicas de migración de datos de disco a cinta, replicación de datos en localidades
remotas, etc.

4.2. Resumen arquitecturas de backup

Cintas Cintas con VTL

Capacidad elevada
Crecimiento elevado
Cantidad Intermediación con cabina de cintas
Depende de la tecnología: LTO,
DDS, DLT
Rendimiento bajo
Calidad Depende de la tecnología: LTO, Mejora el rendimiento
DDS, DLT

Mayor, puesto que necesita cabina


Coste Medio
igualmente

40
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
5. Políticas de backup
La política de backup es la definición de los diferentes aspectos de las copias de seguridad:
¿de qué se debe hacer backup? ¿Cada cuánto se realiza la copia de seguridad? ¿Qué
retención deben tener? ¿Dónde se guardan las copias? ¿Cuánto tiempo es aceptable que se
pueda tardar en recuperar datos?

En los sucesivos apartados se analizarán los puntos clave que requieren concretarse para
estableces una política de backup adecuada a las necesidades de cada sistema

5.1. Tipos de backup


En forma general y a grandes rasgos, existen 4 tipos distintos de backups, y son los siguientes:

 Copia de seguridad normal: copia de seguridad total de todos los archivos y


directorios seleccionados en Copia de Seguridad de Windows. El programa borra el bit
de modificado de cada archivo. Es la base para futuras tareas que solo realizan copias
de seguridad de los archivos modificados

 Copia de seguridad incremental: el programa examina el bit de modificado y hace


una copia de seguridad solo de los archivos que han cambiado desde la última copia
de seguridad incremental o normal. Esta tarea borrar el bit de modificado de cada
archivo que copia. Utilizan la mínima cantidad de cinta y ahorran tiempo, sin embargo,
realizar una restauración es un inconveniente

 Copia de seguridad diferencial: es lo mismo que una copia de seguridad incremental


exceptuando que el programa no elimina el bit de modificación. Requiere más espacio
en cinta y tiempo que las incrementales pero su ventaja radica en que cuando se
realiza una restauración se necesitan solo las cintas que contengan la copia de
seguridad normal y la más reciente diferencial.

 Copia de seguridad intermedia: equivalente a una copia de seguridad normal,


excepto que el programa no desactiva el bit de modificado.

Como caso especial de copia normal se puede hacer una copia de seguridad diaria:
solo copia los archivos que han sido modificados en el día en que se ejecuta la tarea
sin tener en cuenta el estado del bit de modificación. Tampoco borra el bit de
modificación. Útiles cuando se quiere realizar una copia de seguridad extra en un día
determinado, sin afectar a la estrategia de copia de seguridad establecida

41
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
5.2. Rotación de medios
Un esquema de rotación de medios dicta cuantas cintas se usan ara realizar las copias de
seguridad. Un esquema popular es el método del abuelo-padre-hijo, utiliza tres generaciones
de cintas que representan copias de seguridad mensual, semanal y diaria.

 Se realiza una copia de seguridad completa cada mes y se guarda la cinta durante un
año (abuela).
 Se realiza una copia de seguridad completa semanalmente y se guarda durante un
mes (padre).
 Las copias de seguridad hijo se realizan diariamente y se guardan durante una semana
(12+4+7=23 cintas). Las tareas diarias pueden ser copias de seguridad completa,
incremental o diferencial.

En función de la criticidad de los datos, del espacio y del tiempo disponible, y una vez
concretado el tipo de backup y la rotación de medios, se podrá establecer la política de backup
correspondiente.

En este momento se ha de tener en cuenta aspectos legales de retención, entorno que se


salvaguarda y, en general, criticidad de la información a respaldar

En la figura se muestra un ejemplo de una política de backup en función del entorno


(productivo, preproductivo, test…)

42
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
5.3. InformationLifecycle Management (ILM)
En el concepto de ILM (InformationLifecycle Management) se centra en dos puntos
complementarios.

Desde el lado de la lógica de negocio, la información cambia de valor con el tiempo. La


información más antigua deja en general de ser accedida y en caso de que lo sea no se
necesitan tiempos de acceso tan cortos como en el caso de la información más reciente, que
es accedida con mayor frecuencia. Adicionalmente cada vez es necesario mantener los datos
disponibles durante más tiempo, debido bien a necesidades de negocio o bien a regulaciones
que imponen la retención de los datos por largos periodos de tiempo.

Desde el lado puramente tecnológico existen, como se muestra en los apartados anteriores,
una gran variedad de dispositivos y tecnologías para el almacenamiento de la información,
cada una de ellas con un nivel de rendimiento y un coste asociado. En general, cuanto mayor
sea el rendimiento del sistema mayor será su coste, tanto de adquisición como de
mantenimiento en la forma de soporte, licencias, etc.

Teniendo en cuenta estos dos elementos, surge el concepto de ILM, en el que se pretende
hacer residir los datos en el nivel de almacenamiento adecuado a cada momento.

Para que un sistema ILM sea realizable en la práctica, es necesario que el movimiento de
datos entre sistemas de almacenamiento sea automático, basado en políticas y sobre todo
transparente a los servidores y las aplicaciones, que siempre deberían acceder al dato de la
misma forma, siendo el sistema de ILM el encargado tanto de proporcionar el dato desde
donde se encuentre como de moverlo de un almacenamiento a otro en función de las políticas
establecidas.

El concepto de ILM se apoya por tanto en el de virtualización, para ocultar a los servidores y
aplicaciones la ubicación real del dato, pero va mucho más allá, ya que debe permitir la
definición y ejecución de políticas de movimiento de datos que estarán más relacionadas con el
negocio y el valor del dato en cada momento que con el puro componente tecnológico.

En los entornos Mainframe el concepto de ILM está más desarrollado y es posible la definición
de migrado automático de datos desde niveles de almacenamiento de alto rendimiento hasta
cintas, pasando por almacenamiento de más bajo nivel o de cinta virtual.

En sistemas abiertos tipo unix/Windows el concepto de ILM está en pleno desarrollo y aún no
existen sistemas globales que permitan una implantación en todos los entornos. Donde más
desarrollados están actualmente los productos es en el tratamiento del correo electrónico,
existiendo sistemas de archivado de correo que son capaces de mover los datos de los
buzones de correo de un sistema de almacenamiento de más rendimiento a otro de menor
rendimiento sin que el usuario sea consciente de ello, salvo por el mayor tiempo de acceso a
correos antiguos que han sido archivados. También existen en el mercado productos para
implementar una política similar en servidores de ficheros.

43
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.

También podría gustarte