Temas Específicos para La Preparación de La Oposición Al Cuerpo Superior de Sistemas y Tecnologías de La Información de La Administración Del Estado
Temas Específicos para La Preparación de La Oposición Al Cuerpo Superior de Sistemas y Tecnologías de La Información de La Administración Del Estado
1
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Indice
1. Introducción ............................................................................................................................ 3
2. Tecnología básica de almacenamiento ................................................................................. 4
2.1. Discos ............................................................................................................................ 6
2.1.1. Tecnologías y Características ............................................................................... 8
2.1.2. Redundant Array of Independent Disks (RAID) .................................................. 10
2.1.3. Cabina ................................................................................................................. 17
2.2. Cintas .......................................................................................................................... 19
2.2.1. Tecnologías y características .............................................................................. 20
2.2.2. Librerías ............................................................................................................... 21
2.3. Tabla resumen de Soportes ........................................................................................ 22
3. Arquitecturas de Almacenamiento ....................................................................................... 23
3.1. Discos internos ............................................................................................................ 23
3.2. Direct Attached Storage (DAS) ................................................................................... 25
3.3. Storage Area Network (SAN) ...................................................................................... 26
3.3.1. SAN FibreChannel (SAN FC) .............................................................................. 28
3.3.2. Internet SCSI (iSCSI) .......................................................................................... 29
3.3.3. Fibre Channel sobre Ethernet (FCoE) ................................................................. 30
3.3.4. SAN para Mainframe (ESCON y FICON) ............................................................ 31
3.3.5. Seguridad en redes SAN ..................................................................................... 31
3.3.6. Mecanismos de Replicación ................................................................................ 33
3.3.7. Mecanismo de Virtualización (VSAN) ................................................................. 35
3.4. Network Attached Storage(NAS)................................................................................. 36
3.4.1. Red LAN .............................................................................................................. 37
3.4.2. Red WAN ............................................................................................................. 37
4. Arquitecturas de Backup ...................................................................................................... 38
4.1. Virtualización (VTL) ..................................................................................................... 39
4.2. Resumen arquitecturas de backup.............................................................................. 40
5. Políticas de backup .............................................................................................................. 41
5.1. Tipos de backup .......................................................................................................... 41
5.2. Rotación de medios ..................................................................................................... 42
5.3. InformationLifecycle Management (ILM) ..................................................................... 43
2
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
1. Introducción
El presente tema aborda una de las necesidades de sistemas informáticos que más crecen con
el tiempo, el almacenamiento, y la manera de disponer de manera segura de los datos de una
organización. Se inicia partiendo de la tecnología subyacente (discos y cintas), para a
continuación especificar las arquitecturas de almacenamiento y de respaldo del mismo, esto es,
las soluciones de backup
Discos
Tecnología de
base
Cintas
Discos internos
DAS
Arquitecturas
Almacenamiento almacenamiento SAN
NAS
Cintas y VTL
Arquitecturas de
Backup Políticas de
Backup
3
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
2. Tecnología básica de almacenamiento
Si nos centramos en el tipo de soporte de los datos, los dispositivos de almacenamiento para
grandes sistemas pueden dividirse básicamente en dos grandes bloques.
Por un lado existen dispositivos basados en tecnología electromagnética, en los que los datos
se almacenan en forma de campos magnéticos inducidos en el soporte por medio de
dispositivos electromagnéticos y por otro lado existen dispositivos ópticos, en los que los datos
se almacenan provocando variaciones en las características ópticas, utilizando en general
dispositivos laser para la grabación y la lectura.
Dentro de los dispositivos magnéticos encontramos las cintas y los discos. Las
cintas están básicamente orientadas a almacenamiento de grandes cantidades de
datos en los que el tiempo de acceso no es crítico, como backups, mientras que los
discos son el soporte adecuado para el almacenamiento de datos con acceso “on-line”,
representando el soporte primario de la información.
Los dispositivos ópticos existen en diversos formatos, desde los dispositivos tipo cd
o dvd orientados al mercado de consumo aunque con posibles usos en segmentos
empresariales en forma de librerías automáticas, hasta los sistemas MO (magneto-
ópticos) y UDO (Ultra Density Optical disk) orientados a aplicaciones empresariales.
Los dispositivos ópticos presentan unas características intermedias entre los discos y
las cintas, estando orientados al igual que las cintas a aplicaciones de almacenamiento
masivo de datos, backups, archivado, etc., con capacidades menores que las cintas
pero tiempos de acceso más cercanos a los de los discos.
4
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Otra clasificación de los soportes de almacenamiento se basa en el modo y tiempo de
acceso, referidos a las operaciones de lectura y escritura. En este caso, se pueden diferenciar
entre los siguientes tipos de soportes:
Modo de
lectura / Descripción
escritura
Acceso “on- Este es el tipo de acceso normal a la información, en el que las aplicaciones
line”, lectura- pueden acceder a los datos tanto para lectura como para escritura y en el que el
escritura tiempo de acceso a los mismos debe ser corto ya que se trata de datos
accedidos con frecuencia. En este caso se trata en general de dispositivos de
disco.
Cuando los datos dejan de ser accedidos con una frecuencia elevada, debido
principalmente al paso del tiempo, pueden utilizarse dispositivos de
almacenamiento que proporcionen una mayor capacidad, o un menor coste del
Archivado almacenamiento, siendo tolerable una penalización en el tiempo de acceso ya
que los datos no son accedidos con frecuencia.
Existen situaciones en las que la regulación hace necesario garantizar que los
datos que han sido almacenados no sean modificados, se mantengan
almacenados durante un tiempo determinado e incluso que posteriormente sean
destruidos sin dejar ninguna huella en el sistema.
Escritura única:
WORM Los dispositivos de almacenamiento de tipo WORM (Write Once Read Many)
permiten garantizar que la información no es modificada una vez escrita y que,
una vez pasado el periodo de retención, es destruida.
5
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
2.1. Discos
Como se ha citado antes, el almacenamiento en disco se basa en tecnología
electromagnética. Los discos están compuestos de una serie de platos circulares recubiertos
de una capa de material magnético sobre los que se sitúan las cabezas de lectura/escritura.
Mediante una corriente eléctrica en las cabezas de escritura se induce un campo magnético
sobre la superficie del plato, cuya polarización depende de las características de la corriente
eléctrica. En función de la polarización inducida se producirá la grabación de un cero o un uno.
Para la lectura de los datos, la cabeza lectora se sitúa sobre la posición a leer, induciéndose en
la misma una corriente eléctrica que dependerá de las características del campo magnético
creado en la superficie del plato durante el proceso de escritura. En función de la corriente
inducida se leerá un cero o un uno.
Elemento Descripción
Cuanto mayor sea la velocidad de giro de los platos mayor será la velocidad
de transferencia de datos y menor el tiempo de búsqueda, pero será
necesaria más energía para hacerlo girar y se producirán más vibraciones.
Cabezas de Las cabezas de lectura/escritura se sitúan sobre los platos, sin estar en
lectura/escrit contacto con los mismos, desplazándose radialmente sobre los platos
ura mientras estos giran.
6
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Elemento Descripción
Existirá al menos una cabeza sobre cada plato, pudiendo existir más de una
cabeza sobre un mismo plato para reducir el tiempo de posicionamiento de
las mismas, al tener que atender una superficie menor del plato.
Es la parte que da soporte a los platos y las cabezas, sobre la que giran los
Eje
platos y se desplazan las cabezas.
Existen por lo tanto muchos elementos dentro de los componentes de un disco que influirán en
el rendimiento del mismo. En general cuanto más rendimiento se pretenda obtener de un disco
mayor será la complejidad mecánica, electromagnética y electrónica del mismo y mejores
deberán ser las características de la interfaz para poder aprovechar al máximo las
capacidades, todo ello contribuyendo a un mayor coste del dispositivo.
7
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
2.1.1. Tecnologías y Características
A la hora de evaluar un medio de almacenamiento se tienen en cuenta parámetros como los
siguientes:
Tiempo medio de acceso: tiempo medio que tarda la aguja en situarse en la pista y el
sector deseado; es la suma del Tiempo medio de búsqueda (situarse en la pista),
Tiempo de lectura/escritura y la Latencia media (situarse en el sector).
Tiempo medio de búsqueda: tiempo medio que tarda la aguja en situarse en la pista
deseada; es la mitad del tiempo empleado por la aguja en ir desde la pista más
periférica hasta la más central del disco.
Tiempo de lectura/escritura: tiempo medio que tarda el disco en leer o escribir nueva
información. Depende de la cantidad de información que se quiere leer o escribir, el
tamaño de bloque, el número de cabezales, el tiempo por vuelta y la cantidad de
sectores por pista.
Latencia media: tiempo medio que tarda la aguja en situarse en el sector deseado; es
la mitad del tiempo empleado en una rotación completa del disco.
Los discos suelen clasificarse haciendo referencia al tipo de interfaz, aunque esta
denominación lleva implícitas las demás características del disco, ya que en general los discos
con interfaz basada en SCSI (SCSI paralelo, FC, SAS) están orientados a rendimiento en
entorno empresarial, teniendo un mayor precio y unas características mecánicas y electrónicas
más complejas, mientras que los discos con interfaz basada en ATA (ATA paralelo, SATA)
están orientados a capacidad, siendo menor el precio por GB.
8
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
A continuación se detallan las características más importantes de cada una de las tecnologías
mencionadas
Tecnología
Características de últimas
de Disco Descripción
versiones
(interfaz)
Se inician en el entorno doméstico, como discos de Su última versión, ATA-8,
ATA / IDE bajo coste y alta capacidad, con un interfaz mucho soporta velocidades de hasta
más sencillo que SCSI y un bus paralelo 1,33 Gbps
Interfaz serie cuyos niveles altos son compatibles
con ATA. Las mejores características de este
interfaz así como la necesidad del entorno
empresarial de almacenar grandes cantidades de
datos lleva a la aparición de discos SATA orientados
al entorno empresarial, con un menor precio por GB
El último estándar, SATA 3,
que los discos basados en SCSI, con características
soporta transferencias de hasta
SATA mecánicas y electromagnéticas inferiores a los
4.8 Gbps, además de conexión
discos orientados a rendimiento pero orientadas
en caliente.
también a dicho entorno empresarial.
9
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
A modo de resumen, en función del tipo de uso del disco y del mercado objetivo, se combinan
las distintas características del mismo, pudiendo establecerse básicamente dos grupos de
discos: orientado s a rendimiento y orientados a capacidad
Una unidad de estado sólido o SSD (acrónimo en inglés de solid-state drive) es un dispositivo
de almacenamiento de datos que puede estar construido con memoria no volátil. Al no tener
piezas móviles, una unidad de estado sólido reduce drásticamente el tiempo de búsqueda,
latencia y otros, diferenciándose así de los discos duros.
Las unidades de estado sólido tienen el mismo uso que los discos duros y emplean las mismas
interfaces, pero no están formadas por discos mecánicos, sino por memorias de circuitos
integrados para almacenar la información. El uso de esta clase de dispositivos anteriormente
se limitaba a las supercomputadoras, por su elevado precio, aunque hoy en día ya son más
asequibles para el mercado doméstico
Esos soportes son muy rápidos ya que no tienen partes móviles y consumen menos energía.
Todo esto les hace muy fiables y físicamente duraderos. Sin embargo su costo por GB es aún
muy elevado respecto al mismo coste de GB en un formato de tecnología de Disco Duro siendo
un índice muy importante cuando hablamos de las altas necesidades de almacenamiento que
hoy se miden en orden de Terabytes
Los distintos niveles de RAID son combinaciones de dos mecanismos básicos, el particionado
o “stripping” y la duplicación o “mirroring”.
Mediante el particionado, una escritura o lectura dirigida a un disco se divide en varias partes,
siendo atendida cada una de ellas por un disco distinto, obteniendo de esta forma mejoras en
rendimiento, ya que el acceso se realiza en paralelo por varios discos, y en capacidad del
disco, ya que se suma la de los diferentes discos.
10
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Los distintos niveles RAID que se pueden encontrar son, entre otros, los siguientes:
Tipo
Descripción
de
RAID
Consiste en hacer “stripping” de la información.
Un bloque escrito a disco se divide en tantas partes como discos físicos formen el
RAID y se envía una parte a cada disco de forma simultánea.
RAID 0
RAID 1
11
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Tipo
Descripción
de
RAID
Este nivel de RAID divide los bloques a nivel de bit. Por cada “palabra” enviada a
escritura calcula un código de Hamming que permite recuperar la información en
caso de fallo de un disco y envía posteriormente cada bit (de la palabra y del
código de Hamming) a un disco distinto.
Al calcular la paridad a nivel de byte, requiere que los discos estén completamente
sincronizados y se acceda simultáneamente a todos ellos.
RAID 3
12
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Tipo
Descripción
de
RAID
Consiste en hacer “stripping” a nivel de bloque, como RAID 0 más un disco de
paridad dedicado. Cada bloque escrito es dividido en partes, se obtiene un bloque
de paridad que permite recomponer el bloque inicial en caso de pérdida de alguna
de las partes. Cada parte en la que se descompuso el bloque inicial se graba en
un disco y el bloque de paridad en otro disco dedicado en exclusiva a la paridad.
Este nivel de RAID es similar a RAID 4, salvo que no utiliza un disco de paridad
dedicado, sino que distribuye los bloques de paridad por todos los discos del
array, eliminando el potencial cuello de botella del disco de paridad, que en RAID
4 y RAID 3 debía ser accedido en cada escritura.
RAID 5
13
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Tipo
Descripción
de
RAID
RAID 6 es similar a RAID 5, salvo que calcula dos bloques de paridad
independientes por cada escritura, mandando cada uno de los bloques de paridad
a un disco diferente.
RAID 6
RAID
0+1
14
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Tipo
Descripción
de
RAID
Este esquema es una mezcla de RAID 1 y RAID 0. Consiste en hacer un “stripe”
(0) en el que cada disco está espejado (1).
RAID
0+3
15
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Tipo
Descripción
de
RAID
Este esquema es una mezcla de RAID 3 y RAID 0.
RAID
3+0
RAID
5+0
16
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Tipo
Descripción
de
RAID
Este esquema es una mezcla de RAID 1 y RAID 5.
Este tipo de esquema, igual que el 5+1, alcanza las mayores tasas de tolerancia a
fallos, al combinar paridad con espejado, a costa de tener una eficiencia menor
que el resto de niveles, al utilizar más discos para información redundante.
RAID
1+5
Este tipo de esquema, igual que el 1+5, alcanza las mayores tasas de tolerancia a
fallos, al combinar paridad con espejado, a costa de tener una eficiencia menor
que el resto de niveles, al utilizar más discos para información redundante.
Existen multitud de ejemplos y fabricantes:RAID 50EE, Paridad doble,RAID 1.5, RAID 7, RAID
S o RAID de paridad, Matrix RAID, Linux MD RAID 10, IBM ServeRAID 1E o RAID Z
2.1.3. Cabina
En general en los entornos empresariales el almacenamiento en disco se presenta integrado
dentro de cabinas de discos, que incluyen los elementos de conectividad a los servidores, los
controladores (protocolos de acceso, RAID, caché, mecanismos de copia, etc) y los discos
individuales.
17
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Las cabinas pueden conectarse a los servidores directamente (DAS) o a través de redes,
dando acceso a los datos a nivel de bloque (red SAN) o a nivel de fichero (red NAS).
Los back-ends son los componentes que dan acceso a los discos. Dependiendo del tipo
de discos que utilicen dispondrán de una arquitectura distinta: Bucle arbitrado de FC,
conmutador de FC, conexiones SAS basadas en extensores, conexiones SATA, etc. En
general el número de discos en cada cabina será variable. En cabinas de gama alta cada
conjunto de discos forma parte de su propia agrupación, siendo necesario ampliar de forma
conjunta los back-ends y los discos, mientras que en las cabinas de gama media o baja
todos los discos forman parte de una misma agrupación, que se amplía introduciendo más
bandejas de discos en la cabina pero manteniendo la estructura de control del back-end.
Finalmente las controladoras son los elementos que proveen la “inteligencia” de las
cabinas, gestionando los niveles de RAID, la caché interna de la cabina, las
funcionalidades software avanzadas (copias instantáneas, remotas, etc) así como la
conexión entre front-ends y back-ends.
Las cabinas de alto rendimiento tienen controladoras con más caché y más funcionalidades
que las cabinas de gama media o baja. Para garantizar la redundancia, las cabinas tienen
varias controladoras, pero en función de la gama de la cabina la redundancia puede ser
proporcionada mediante varias controladoras activas o mediante una controladora activa y
otra de respaldo. Así mismo la memoria caché de las controladoras puede estar espejada
entre ellas para garantizar la máxima disponibilidad.
Las cabinas de gama alta presentan en general arquitecturas internas conmutadas, en las
que existe conectividad total entre todos los elementos sin compartición de ancho de banda,
mientras que las cabinas de gama media o baja presentan arquitecturas internas basadas en
bus, en las que existe compartición de ancho de banda entre elementos. Las cabinas de gama
baja pueden tener todos los elementos unidos en un único módulo o presentar una arquitectura
similar a las de gama media pero con menos elementos redundantes.
18
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
2.2. Cintas
La tecnología de almacenamiento basada en cintas está orientada principalmente a
proporcionar gran capacidad de almacenamiento a un coste inferior al de los discos, a
costa de perder rendimiento en la grabación y el acceso a los datos.
Las cintas presentan un modo secuencial de acceso a los datos frente al modo aleatorio de
los discos, por lo que la tecnología de cintas es intrínsecamente más lenta que la de disco,
aunque si la aplicación solamente requiere acceso secuencia (por ejemplo, un backup) esa
diferencia puede verse reducida.
Dentro de los distintos modelos de cintas se puede hacer una división entre
La principal diferencia entre ambos modos de trabajo consiste en que en el caso de utilización
de las cintas para trabajo “on-line” esta debe parar, arrancar, rebobinar, etc., muchas veces
durante su utilización, mientras que en la modalidad backup, los datos son transferidos a la
cinta de forma continua, sin necesidad de parar y rearrancar la cinta ni de rebobinarla en una
misma sesión de escritura.
El uso “on-line” impone requisitos mecánicos en las cintas mucho más restrictivos que en el
caso de las cintas destinadas a [Link] uso de cintas “on-line” es casi exclusivo del entorno
mainframe, mientras que en el entorno de sistemas abiertos las cintas se utilizan
principalmente para backup.
Otra diferencia sustancial entre las cintas y los discos es la mayor degradación de las primeras,
debido por una parte a los mecanismos de acceso a los datos, que implican enrollar y
desenrollar la cinta, sacarla del cartucho, arrastrarla por los lectores, falta de aislamiento frente
a humedad, calor, etc, y por otra parte a que el medio (la cinta en si misma) tiene peores
características que los platos de los discos. Esto lleva a que las cintas tengan un tiempo de
vida limitado y deban ser sustituidas tras un número de grabaciones así como a que es
necesario comprobar cada cierto tiempo las cintas para evitar la pérdida de los datos grabados.
En cuanto a la tecnología de grabación, existen principalmente dos tipos de cintas, las que
graban longitudinalmente en la cinta, en varias pistas en función del tipo, y las que graban
diagonalmente (grabación helicoidal).
Las cintas de grabación longitudinal tienen menor capacidad que las de grabación helicoidal,
pero son más rápidas, debido a que es más sencillo el acceso a lo largo de la cinta que en
pistas diagonales.
La conectividad de las unidades o librerías de cintas a los servidores depende del entorno,
utilizándose generalmente SCSI o FC en entornos abiertos y ESCON o FICON en entornos
mainframe.
19
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
2.2.1. Tecnologías y características
Al igual que los grabadores de cassette, las unidades de cinta disponen de una propulsión para
dos bobinas, un botón para reproducir y grabar y otro para borrar. Los datos se leen o escriben
en serie. La capacidad de almacenamiento no sólo depende de la longitud de la cinta, también
del estándar que se emplea
Tipo de
Descripción Características
Cinta
Las cintas DAT surgieron inicialmente como
cintas de grabación de audio digital, pero
posteriormente SONY y HP definieron el
estándar para grabación de datos. Inicialmente surgieron con una
capacidad de 2GB y una tasa de
Utilizan cinta de 4mm y grabación helicoidal. El transferencia de 55KB/s y
cartucho dispone de dos carretes, de forma que actualmente se dispone de
la cinta sale del cartucho para ser accedida y cintas DAT de 12 o 24 GB y
DAT
se vuelve a enrollar en el mismo cartucho en el velocidades de acceso de 1,1
otro carrete, como las cintas de audio o de MB/s o 2,2 MB/s.
video.
Las cintas deben renovarse tras
Utiliza 4 cabezas, dos grabadoras y dos unas 2000 pasadas.
lectoras. Las lectoras están situadas detrás de
las escritoras de forma que en una escritura
verifican lo que la cabeza de escritura ha
grabado.
Inicialmente se trataba de un estándar para Existen dos formatos de 8MM, el
grabación de video que, al igual que las cintas formato Mammoth que alcanza
DAT se transformó para la grabación de datos. los 20 GB por cinta y
velocidades de transferencia de
La tecnología es similar a la de las cintas DAT 6 MB/s y el formato AIT que
8MM pero con mayor capacidad y mayor velocidad alcanza 25 GB por cinta y
de acceso. velocidades de transferencia de
Estas cintas tienen memoria interna que 6 MB/s.
almacena datos sobre índices en la cinta,
estado de la misma, etc, que acelera los La cinta de 8MM es la cinta SCSI
tiempos de búsqueda de la información y el más común.
mantenimiento de la cinta.
Los últimos modelos permiten
almacenar, sin utilizar
compresión, entre 2 y 4 GB por
Este tipo de cintas es de grabación lineal, cinta y alcanzan velocidades de
QIC
frente a la grabación helicoidal de las DAT y las transferencia de hasta 800 KB/s.
8MM.
Las cintas deben renovarse tras
unas 5000 pasadas.
20
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Tipo de
Descripción Características
Cinta
Utiliza grabación lineal, con entre
128 y 208 pistas por cinta según
la unidad, permitiendo alcanzar
hasta 300 GB por cinta y
velocidades de transferencia de
DLT La tecnología DLT utiliza cintas alojadas en 36 MB/s.
cartuchos de un solo carrete. La tecnología de acceso a la
cinta minimiza el desgaste de la
misma, pudiendo tener unas
30000 horas de vida útil cada
cinta.
2.2.2. Librerías
Las unidades de cinta pueden estar agrupadas en librerías, de forma que un servidor
dispone de varias unidades sobre las que cargar los cartuchos.
Las librerías pueden ser manuales, en las que deben ser operadores los que introduzcan las
cintas en las unidades, limitándose la librería a indicar la cinta que debe ser cargada en cada
momento en cada una de las unidades. Algunos modelos de librerías manuales tienen
21
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
mecanismos para detectar si la cinta que se ha introducido en la unidad es la solicitada, dando
un error en caso contrario.
Las librerías manuales están en desuso en los centros de datos, siendo sustituidas por librerías
automáticas, o robots, en los que un brazo mecánico selecciona las cintas y las introduce o
saca de las unidades de cinta.
Las cintas están alojadas en el interior del robot, son clasificadas, seleccionadas y montadas
en las unidades por el robot y según el modelo su integridad puede ser periódicamente
comprobada por la propia librería.
Existen dos tipos de productos de automatización, los cargadores automáticos que contienen
una o dos unidades de cinta y un número limitado de cartuchos normalmente no más de 30, y
los robots o librerías automáticas, que disponen de varias unidades y varios cientos o incluso
miles de cartuchos.
En las librerías automáticas las cintas no salen en general del interior del robot, lo que aumenta
su duración al estar sometidas siempre a las mismas condiciones de temperatura y humedad.
22
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
3. Arquitecturas de Almacenamiento
La primera diferenciación necesaria al referirse a recursos de almacenamiento es la unidad en
la que se sirve este almacenamiento:
- La otra opción es que el cliente trabaje a nivel de archivo. En este caso el sistema de
ficheros es creado y gestionado por el sistema operativo del servidor (NAS), que a su
vez tendrá asociado un determinado espacio en discos
Este modelo de conectividad presenta dos variantes, la conectividad basada en el bus SCSI
para sistemas empresariales y la basada en el bus ATA para sistemas domésticos, cada uno
23
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
de ellos con características distintas, siendo el SCSI más avanzado y consecuentemente más
complejo y caro.
Ambos buses son de tipo paralelo, lo que conlleva ciertas dificultades y limitaciones que han
llevado a la aparición de conexiones serie en ambos tipos de bus, SAS como evolución de
SCSI y SATA como evolución de ATA. Ambas evoluciones modifican las capas bajas de los
protocolos pasando a un protocolo serie en lugar de paralelo pero conservan las capas altas,
de forma que aseguran la compatibilidad a nivel software.
El almacenamiento interno conlleva una serie de problemas que hacen preferible en un entorno
empresarial el almacenamiento externo. Entre los problemas de esta opción se encuentran:
Los datos de aplicaciones con un mínimo de criticidad no deberían ubicarse en los discos
internos del servidor, quedando éstos relegados a alojar la instalación del sistema operativo y
de la aplicación.
Sin embargo, hasta el uso de esta opción se está limitando aún más debido a la virtualización
de servidores, puesto que también la instalación reside en una red separada de
almacenamiento, en forma de máquina virtual que puede ubicarse en un servidor u otro de
manera rápida
24
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
3.2. Direct Attached Storage (DAS)
Consiste en conectar el dispositivo de almacenamiento directamente al servidor o estación de
trabajo, es decir, físicamente conectado al dispositivo que hace uso de él.
Este tipo de conectividad extiende el protocolo SCSI más allá de los buses internos del
servidor, permitiendo conectar un dispositivo externo (cabina de discos) al servidor.
La conectividad más común entre servidores y almacenamiento está basada en SCSI o en FC,
que sustituye las capas bajas de SCSI por el protocolo serie FC y utiliza las capas altas de
SCSI para enviar comandos de almacenamiento. El protocolo SAS, de reciente aparición,
también sustituye la capa física paralela de SCSI por un protocolo serie y podría ser utilizado
para conectar las cabinas de almacenamiento directamente a los servidores.
Desde el punto de vista del software del servidor, al usar siempre las capas altas del protocolo
SCSI, el almacenamiento externo es utilizado igual que el almacenamiento interno, sin que las
capas de S.O. más allá del driver que gestiona la conectividad distingan entre almacenamiento
interno y externo.
El rendimiento de las cabinas de discos es superior al del almacenamiento interno, ya que las
cabinas están diseñadas exclusivamente para ello e incluyen caché interna y controladores
25
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
sofisticados para gestionar los discos y las colas de I/O que no están presentes en los
servidores.
Se trata de una arquitectura de acceso a bloques y los protocolos de alto nivel que circulan por
la red son los mismos que se utilizan en las conexiones internas de los discos a los servidores
o de las cabinas externas dedicadas. De esta forma, los drivers del servidor dedicados al
acceso a la red de almacenamiento ocultan al resto del S.O. el hecho de que los discos no
están conectados internamente al servidor y el S.O. accede a los mismos como si la conexión
fuese interna.
26
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
La unidad de almacenamiento que provee una red SAN se denomina LUN(Logical Unit
Number) y es un disco virtual proporcionado por la SAN. El administrador del sistema tiene el
mismo acceso y los derechos a la LUN que los que tendría si fuera un disco directamente
conectado al servidor. Por tanto, puede particionar y formatear el disco en cualquier formato
que requiera.
Capa Red. Esta capa la conforman los cables (Fibra óptica) así como los SAN Hubs y
los SAN switches como punto central de conexión para la SAN. Otra posibilidad es la
utilización de redes basadas en Ethernet
Capa Disco. Esta capa la componen las formaciones de discos (Disk Arrays, Memoria
Caché, RAIDs) y cintas empleados para almacenar datos.
27
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
La red de almacenamiento puede ser de varios tipos, lo cual va a originar los diferentes
estándares existentes
Los equipos pertenecientes a una red FC se identifican mediante un WWN (World Wide Name),
dirección de 64 bits asignada unívocamente a cada dispositivo.
28
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
topología de la misma y no utilizar un WWN asignado al equipo en el proceso de fabricación y
que lógicamente no corresponderá con la topología de la red.
Con los 24 bits del FCID se pueden direccionar unos 16 millones de dispositivos en una misma
red FC. Los switches dentro de una red SAN se identifican mediante el DomainID, que es
asignado de forma dinámica al registrase los equipos en la red.
Al igual que en redes LAN, existen diferentes categorías de switches FC, desde pequeños
switches de 8 puertos hasta grandes equipos modulares con cientos de puertos (denominados
directores en la terminología de FC) y con distintas características de redundancia,
prestaciones, disponibilidad, etc.
La conexión entre dos switches se realiza mediante ISL (Inter Switch Links) a través de los
cuales los switches se intercambian información sobre la topología de la red.
Dentro de una red FC existen una serie de servicios básicos para su correcto funcionamiento y
que son implementados automáticamente de forma distribuida entre todos los switches que
componen la red. Estos servicios son los siguientes:
- SNS : Servidor que nombres que asigna los FCID y permite traducir de FCID a WWN
- RSCN: Notificación de cambios en la topología de la red. Informa al resto de equipos
de la aparición o desaparición de equipos en la red.
- Login : Servicio al que se registra un equipo al ser conectado a la red FC.
- Servicio de gestión: Servicio que permite la gestión in-band de la red FC utilizando los
mismos enlaces FC por los que se transmite el tráfico.
- Servicio de tiempos: Servidor de tiempos. Está definido en los estándares pero no
suele ser implementado en los equipos.
La tecnología FC está basada en estándares, pero cada fabricante implementa sus propias
variaciones, lo que hace que en general dos switches de distinto fabricante no sean
compatibles en modo nativo. Para hacer compatibles switches de distintos fabricantes existe el
mono interoperatividad, consistente en rebajar la funcionalidad de los equipos hasta el
cumplimiento del estándar.
Este tipo de redes SAN permiten el intercambio de tramas SCSI pero sobre TCP/IP, en lugar
de sobre FC.
29
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Al utilizar las capas altas de SCSI igual que FC, a nivel funcional puede ofrecer las mismas
capacidades que las redes FC.
En principio es posible implementar iSCSI en software, haciendo uso de tarjetas NIC ethernet
normales, pero de esta forma aumenta el consumo de CPU de los servidores y disminuye el
rendimiento de iSCSI. Para solventar este problema es necesario utilizar tarjetas de red
similares a las HBAs (Host Bus Adapter) de FC, que implementen en hardware tanto el
protocolo iSCSI como el TCP/IP, liberando al servidor de estas tareas y aumentando el
rendimiento, a costa de perder algo de la ventaja competitiva en costes, al ser estas tarjetas
más caras que las NIC ethernet normales.
FCoE ha sido diseñado sin la capa Protocolo de Internet (IP), no se puede enrutar de forma
intrínseca mediante IP. Sin embargo, se pueden realizar enrutamientos FCoE por medio de
protocolos ya establecidos como FCIP.
30
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
3.3.4. SAN para Mainframe (ESCON y FICON)
En el entorno Mainframe de IBM apareció a mediados de los 90 la tecnología ESCON como
sustituta de la antigua tecnología de conexión paralela por cables de cobre 370.
ESCON introdujo los canales de fibra con un interfaz serie semidúplex con tasas de
transferencia de 20 MBs.
Como evolución de la tecnología ESCON, IBM introdujo la tecnología FICON que utiliza como
medio de transporte FibreChannel, pero no utiliza en capas superiores SCSI como las redes
FC de sistemas abiertos, sino la tecnología propietaria de IBM.
Los canales FICON permiten una tasa de transferencia de 100 MBytes por segundo en canales
de 1Gbps y de 200 MBytes por segundo en canales FibreChannel de 2Gbps.
La tecnología FICON permite la interconexión de FICON Director mediante ISLs creando redes
SAN con más de un conmutador, pero el camino entre el servidor y los discos solo puede
contener dos directores.
Al igual que FC, FICON es una tecnología dúplex, no semidúplex como en el caso de ESCON.
LUN Masking
El almacenamiento disponible en las cabinas de una red SAN se divide en discos lógicos o
LUNs. Este concepto pertenece a la interfaz SCSI, cuyas capas altas son transportadas
mediante FC, que es el protocolo por excelencia para conectar cabinas de discos y servidores,
bien sea directamente o bien mediante redes SAN.
Si una cabina de discos está conectada a varios servidores mediante una red SAN o
directamente si la cabina dispone de varios puertos de comunicaciones, podrá ofrecer los
discos lógicos, o LUNs, a los servidores que sean configurados.
Si una LUN no es presentada por la cabina a un servidor concreto este no podrá acceder a la
misma, no teniendo constancia ni siquiera de su [Link] esta forma se evita que un
servidor pueda acceder a una LUN que pertenece a otro servidor.
Zoning
Las redes SANs de fibrechannel pueden interconectar miles de dispositivos entre sí. Los
conmutadores FC tienen la capacidad de segmentar la red SAN en distintas zonas, en base al
WWN (World Wide Name) de los dispositivos (cabinas de discos o servidores) de forma que
cada dispositivo solo es capaz de comunicarse con el resto de dispositivos que pertenezcan a
su misma zona. Cada zona se comporta como si en la red SAN solo existiesen los dispositivos
que forman parte de ella.
Por lo tanto, para que un servidor pueda acceder a una LUN en una cabina, el servidor y la
cabina deben estar en la misma zona y adicionalmente la cabina debe permitir el acceso del
servidor a dicha LUN.
El concepto de zoning es perteneciente a las redes SAN de FC, mientras que el concepto de
LUN pertenece a las capas altas del protocolo SCSI.
Fabric/switch/portbinding
32
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
3.3.6. Mecanismos de Replicación
La replicación es el proceso de copiar y mantener actualizados los datos en varios nodos de
bases de datos ya sean estos persistentes o no. Gracias a este proceso se genera una copia
exacta de parte del sistema. Esa parte puede ser desde un archivo hasta una carpeta, una
partición, un disco o incluso varios discos
Debido a la vital importancia de garantizar la seguridad de los datos, tanto ante desastres como
ante errores humanos, sabotajes, etc, se hace necesario mantener copias de los datos en
tiempo real en distintos sistemas de almacenamiento y en distintas localizaciones físicas, de
forma que el fallo de uno de los sistemas no implique la pérdida de los datos.
Las capacidades del almacenamiento en red, tanto SAN como NAS, permiten ofrecer réplica
automática de información de forma transparente a los servidores y las aplicaciones.
En función de los requisitos de seguridad, distancia, rendimiento, etc, es posible elegir entre
distintos procedimientos para realizar la replicación en tiempo real de los datos.
Dentro de este tipo de réplica, podemos diferenciar entre copia remota y copia local.
33
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Copia remota
Mediante la copia remota se replican los datos que los servidores escriben en los sistemas de
almacenamiento en dos o más instalaciones de forma simultánea.
Si se necesita garantizar que los sistemas de almacenamiento remotos son en todo momento
una copia de los sistemas locales se debe utilizar copia remota síncrona, en la que el servidor
no recibe confirmación de la escritura en el sistema de almacenamiento hasta que el dato ha
sido escrito tanto en el sistema local como en el remoto.
Al tener que esperar a que se produzca la escritura en el sistema remoto, el tiempo de duración
de la escritura es el tiempo de acceso al sistema de almacenamiento más la latencia de las
líneas de comunicaciones entre el centro local y el remoto. Este hecho, junto con la exigencia
de ancho de banda entre ambas localizaciones, hace que la distancia a la que se puede
realizar una réplica síncrona sin que afecte significativamente al rendimiento sea limitada, no
pudiendo alcanzar distancias de centenares de kilómetros.
Para solventar este problema se puede utilizar copia asíncrona, en la que el servidor recibe la
confirmación de la escritura en cuanto esta se ha realizado en el centro local y posteriormente
la red de almacenamiento se encarga de transmitir los datos de forma asíncrona al centro
remoto.
Los mecanismos de copia asíncrona deben garantizar que las escrituras en el centro remoto
conservan el orden en el que el servidor las hizo, mediante la definición de grupos de
consistencia, de forma que se garantice que el estado del sistema remoto sea una réplica del
estado del sistema local pero con un cierto desfase en el tiempo.
En función del desfase temporal que se pueda tolerar es posible extender la copia asíncrona a
grandes distancias, pudiendo incluso situar los centros remotos en continentes distintos.
34
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
persistencia de los datos frente a desastres de mayor alcance a costa de perder las
transacciones de los últimos segundos.
Copia local
Un fallo hardware del sistema de almacenamiento invalidaría ambas copias, pero no así un
fallo humano o un fallo del software, ya que ambas copias son lógicamente distintas, siendo
una de ellas accedida por los sistemas de producción y estados la otra reservada para pruebas
o para recuperación de desastres.
en servidor
35
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
en red
De esta forma es posible cambiar el repositorio físico de los datos sin que los
servidores sean conscientes de ello, ya que siguen solicitando los datos a las cabinas
“virtuales”.
en cabina
En este esquema una cabina con capacidades avanzadas se encarga de reenviar las
peticiones de los servidores a las cabinas en las que realmente residen los datos. Los
servidores utilizan siempre a la cabina virtualizadora como destino de sus peticiones,
como si todos los discos residiesen en ella, pero luego el dispositivo de virtualización
envía los datos a la cabina que corresponda en cada caso.
El S.O. del servidor “monta” un sistema de ficheros externo a través de alguno de los
protocolos destinados a ese fin (NFS, CIFS, Novell, etc) y delega la transformación de fichero a
bloque de bits en la red de almacenamiento.
36
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
3.4.1. Red LAN
El acceso al almacenamiento en red basado en redes SAN permite el acceso a bloques, en el
que el servidor utiliza el disco como si fuese interno, pero este tipo de almacenamiento no
permite el acceso de varios servidores a los mismos datos a no ser que estos formen parte de
un clúster de servidores y se coordinen para el acceso a los datos. Al tratarse de un acceso a
bloques, el sistema de ficheros es creado por el servidor, por lo que dos servidores
independientes no pueden acceder a los mismos bloques, ya que ambos tratarían de mantener
el sistema de ficheros, causando la corrupción del mismo.
Los sistemas de acceso a ficheros solventan este problema delegando la gestión del sistema
de ficheros en el equipo de red que sirve los datos. Los servidores montan los sistemas de
ficheros exportados (por ejemplo, unidades de red en sistemas Windows montadas a través de
CIFS, montaje por NFS en sistemas UNIX/Linux, etc) que son utilizados por las aplicaciones
como si fuesen discos locales pero que para el sistema operativo son discos remotos con el
sistema de ficheros delegado en otro sistema.
Los sistemas que actúan de servidores de ficheros pueden ser servidores de propósito general
en los que se ejecuta un software (que puede ser parte o no del sistema operativo) que actúa
como servidor de ficheros o puede tratarse de dispositivos especiales, denominados NAS,
dedicados en exclusiva a servir ficheros y diseñados especialmente para ello.
Los principales protocolos para el acceso a ficheros son NFS para entornos UNIX/Linux y CIFS
para entornos Microsoft, junto con los protocolos de Novell utilizados en servidores de ficheros
basados en NetWare.
Los servidores de ficheros, tanto los implementados mediante servidores de propósito general
como los implementados mediante dispositivos NAS dedicados, pueden utilizar
almacenamiento interno, externo dedicado o compartido en red SAN para almacenar los
sistemas de ficheros y sus datos asociados.
Para evitar estos problemas está surgiendo el concepto de WAFS (Wide Area File Services),
basado en la compresión de las tramas de datos de los protocolos CIFS y NFS, la
simplificación de ambos protocolos para evitar un excesivo número de mensajes y el uso de
caché local en las oficinas remotas.
Un número elevado de mensajes entre cliente y servidor puede provocar problemas cuando la
latencia de la red es elevada, ya que el tiempo necesario para acceder a un fichero será la
suma del tiempo de ida y vuelta de todos los mensajes necesarios.
Mediante la compresión de los datos se evita el problema del menor ancho de banda de las
redes WAN frente a las redes LAN.
Al utilizar caché de ficheros en las oficinas remotas se evita el acceso a ficheros de las oficinas
centrales siempre que los mismos no hayan sido modificados.
37
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
4. Arquitecturas de Backup
Los sistemas de backup permiten grabar en cinta los datos en un determinado instante de
tiempo.A diferencia de las copias en tiempo real, los datos no se copian en las cintas a medida
que se escriben en los sistemas de almacenamiento “on-line”, sino que se realiza una copia
completa con la periodicidad que se desee y con las aplicaciones paradas, sin realizar
escrituras en los sistemas de almacenamiento.
Una situación típica es la de parar la producción todas las noches durante el tiempo que dure la
realización del backup y volcar todos los datos en cinta.
Frente a los sistemas de réplica en tiempo real presenta la desventaja de tener una imagen de
los datos de un instante fijo anterior en el tiempo, pero tiene como principales ventajas la
posibilidad de mantener varias copias de varios instantes de tiempo (por ejemplo, todas las
noches del último mes) en distintas cintas y poder recuperar la que se desee y además la de
representar un estado coherente de los datos a nivel de aplicación, al detener las aplicaciones
antes de hacer el backup.
En el caso de la réplica síncrona en tiempo real se garantiza que el estado de los datos en el
centro remoto es idéntico al local a nivel de bloque, pero no a nivel de S.O. o aplicación. Un
fallo en el centro local es similar a una parada brusca de un servidor respecto a sus discos
internos. Todo aquello que las aplicaciones y el S.O. tuviesen en caché y no hubiesen volcado
aún al disco se pierde y por lo tanto la imagen del disco tanto local como remoto, a pesar de
ser idénticos a nivel de bit, pueden no ser coherentes a nivel de aplicación.
En cambio en un backup, al haber parado las aplicaciones (o forzado que escriban todos los
datos a disco) la copia que se realiza es consistente a nivel de operación de E/S y a nivel de
aplicación.
El tener que mantener las aplicaciones paradas durante la realización del backup, en lo que se
denomina ventana de backup, hace que la duración del mismo sea crítica. Esta es una de las
razones que potencian la existencia de los virtualizadores de cinta. Estos dispositivos reciben el
backup como si fuesen cintas pero en realidad lo están enviando a disco, con lo que el tiempo
de respuesta es mucho mayor. Cuando acaba el backup se reanuda la producción y a partir de
ese momento el virtualizador puede volcar los datos a cinta sin restricciones temporales.
38
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
Las cintas presentan un modo secuencial de acceso a los datos frente al modo aleatorio de los
discos, por lo que la tecnología de cintas es intrínsecamentemás lenta que la de disco , aunque
si la aplicación solamente requiere acceso secuencia (por ejemplo, un backup) esa diferencia
puede verse reducida.
Las unidades de cinta pueden estar agrupadas en librerías, de forma que un servidor dispone
de varias unidades sobre las que cargar los cartuchos. Las librerías manuales están en desuso
en los centros de datos, siendo sustituidas por libreríasautomáticas, o robots, en los que un
brazo mecánico selecciona las cintas y las introduce o saca de las unidades de cinta. También
está la opción de Librería de Cintas Virtual, que realmente son discos de bajo coste como
soporte intermedio para un backup más rápido
El virtualizador implementa los mismos protocolos que las librerías de cintas, de forma que el
servidor trabaja exactamente igual que lo haría contra una cinta real, pero guarda los datos en
disco, de forma que el tiempo de respuesta es mucho menor y los trabajos (por ejemplo,
backups) finalizan mucho antes.
Posteriormente el virtualizador de cinta puede encargarse de pasar los datos de disco a cinta,
de forma que se mantienen las ventajas de las cintas en cuanto a capacidad de
almacenamiento y menor coste que los discos, pero sin la penalización en rendimiento que
presenta el uso directo de cintas.
39
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
La virtualización de cintas puede realizarse de distintas formas:
En servidor
En “appliance”
En dispositivo virtualizador
Capacidad elevada
Crecimiento elevado
Cantidad Intermediación con cabina de cintas
Depende de la tecnología: LTO,
DDS, DLT
Rendimiento bajo
Calidad Depende de la tecnología: LTO, Mejora el rendimiento
DDS, DLT
40
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
5. Políticas de backup
La política de backup es la definición de los diferentes aspectos de las copias de seguridad:
¿de qué se debe hacer backup? ¿Cada cuánto se realiza la copia de seguridad? ¿Qué
retención deben tener? ¿Dónde se guardan las copias? ¿Cuánto tiempo es aceptable que se
pueda tardar en recuperar datos?
En los sucesivos apartados se analizarán los puntos clave que requieren concretarse para
estableces una política de backup adecuada a las necesidades de cada sistema
Como caso especial de copia normal se puede hacer una copia de seguridad diaria:
solo copia los archivos que han sido modificados en el día en que se ejecuta la tarea
sin tener en cuenta el estado del bit de modificación. Tampoco borra el bit de
modificación. Útiles cuando se quiere realizar una copia de seguridad extra en un día
determinado, sin afectar a la estrategia de copia de seguridad establecida
41
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
5.2. Rotación de medios
Un esquema de rotación de medios dicta cuantas cintas se usan ara realizar las copias de
seguridad. Un esquema popular es el método del abuelo-padre-hijo, utiliza tres generaciones
de cintas que representan copias de seguridad mensual, semanal y diaria.
Se realiza una copia de seguridad completa cada mes y se guarda la cinta durante un
año (abuela).
Se realiza una copia de seguridad completa semanalmente y se guarda durante un
mes (padre).
Las copias de seguridad hijo se realizan diariamente y se guardan durante una semana
(12+4+7=23 cintas). Las tareas diarias pueden ser copias de seguridad completa,
incremental o diferencial.
En función de la criticidad de los datos, del espacio y del tiempo disponible, y una vez
concretado el tipo de backup y la rotación de medios, se podrá establecer la política de backup
correspondiente.
42
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.
5.3. InformationLifecycle Management (ILM)
En el concepto de ILM (InformationLifecycle Management) se centra en dos puntos
complementarios.
Desde el lado puramente tecnológico existen, como se muestra en los apartados anteriores,
una gran variedad de dispositivos y tecnologías para el almacenamiento de la información,
cada una de ellas con un nivel de rendimiento y un coste asociado. En general, cuanto mayor
sea el rendimiento del sistema mayor será su coste, tanto de adquisición como de
mantenimiento en la forma de soporte, licencias, etc.
Teniendo en cuenta estos dos elementos, surge el concepto de ILM, en el que se pretende
hacer residir los datos en el nivel de almacenamiento adecuado a cada momento.
Para que un sistema ILM sea realizable en la práctica, es necesario que el movimiento de
datos entre sistemas de almacenamiento sea automático, basado en políticas y sobre todo
transparente a los servidores y las aplicaciones, que siempre deberían acceder al dato de la
misma forma, siendo el sistema de ILM el encargado tanto de proporcionar el dato desde
donde se encuentre como de moverlo de un almacenamiento a otro en función de las políticas
establecidas.
El concepto de ILM se apoya por tanto en el de virtualización, para ocultar a los servidores y
aplicaciones la ubicación real del dato, pero va mucho más allá, ya que debe permitir la
definición y ejecución de políticas de movimiento de datos que estarán más relacionadas con el
negocio y el valor del dato en cada momento que con el puro componente tecnológico.
En los entornos Mainframe el concepto de ILM está más desarrollado y es posible la definición
de migrado automático de datos desde niveles de almacenamiento de alto rendimiento hasta
cintas, pasando por almacenamiento de más bajo nivel o de cinta virtual.
En sistemas abiertos tipo unix/Windows el concepto de ILM está en pleno desarrollo y aún no
existen sistemas globales que permitan una implantación en todos los entornos. Donde más
desarrollados están actualmente los productos es en el tratamiento del correo electrónico,
existiendo sistemas de archivado de correo que son capaces de mover los datos de los
buzones de correo de un sistema de almacenamiento de más rendimiento a otro de menor
rendimiento sin que el usuario sea consciente de ello, salvo por el mayor tiempo de acceso a
correos antiguos que han sido archivados. También existen en el mercado productos para
implementar una política similar en servidores de ficheros.
43
048. - Sistemas de almacenamiento para sistemas grandes y departamentales. Dispositivos para
tratamiento de información multimedia. Virtualización del almacenamiento.