Información general
Amazon.com es el minorista en línea más grande del mundo. En 2011,
Amazon.com pasó de utilizar el backup en cinta a usar Amazon Simple
Storage Service (Amazon S3) para realizar backups de la mayoría de las
bases de datos de Oracle de las que se encarga. Esta estrategia reduce la
complejidad y el desembolso de capital, ofrece un desempeño de backup y
restauración más rápido, elimina la planificación de capacidad de cinta para
las backups y el archivo, y permite que el personal administrativo se
dedique a operaciones de más valor. La empresa pudo reemplazar su
infraestructura de cinta para copias de seguridad por un almacenamiento de
Amazon S3 basado en la nube y eliminar el software necesario para las
copias de seguridad. Asimismo, experimentó una mejora del rendimiento
12 veces mayor, de forma que pudo reducir el tiempo de restablecimiento
de 15 a 2,5 horas aproximadamente en situaciones concretas.
Oportunidad
A medida que Amazon.com crece, también aumenta el tamaño de las bases
de datos de Oracle y la enorme cantidad de bases de datos que mantienen.
Esto ha generado cada vez más problemas relacionados con la realización
de backups de las bases de datos existentes de Oracle en cintas, por lo que
se han contemplado estrategias alternativas como la utilización de los
servicios de la nube de Amazon Web Services (AWS), una subsidiaria de
Amazon.com. Entre los retos empresariales a los que se enfrenta
Amazon.com destacan:
La planificación de uso y capacidad resulta compleja, y el tiempo y el
presupuesto de inversión de capital son de suma importancia. Con los
años se necesitaron importantes inversiones de capital para hardware
de cinta, espacios de centros de datos para dicho hardware y gastos
de licencias empresariales para software de cinta. Durante dicho
periodo, la administración de la infraestructura de cinta requería
contar con personal altamente cualificado dedicado a la configuración,
certificación e ingeniería de la planificación de archivado, en lugar de
dedicarse a proyectos de mayor valor. Y, al final de cada ejercicio
fiscal, prever los futuros requisitos de capacidad requería auditorías,
previsiones y elaboración de presupuestos que consumían mucho
tiempo.
El costo del software de backup necesario para varios dispositivos de
cinta podía ser toda una sorpresa. Los robots de cintas ofrecen una
capacidad básica de lectura/escritura, pero para poder utilizarlos
completamente, es necesario invertir en software de backup en cinta
patentado. Para Amazon.com, el costo del software había sido alto y
constituía una parte importante de los costos generales de backup. El
costo de este software no dejaba de plantear un problema en los
presupuestos, pero resultaba difícil de solucionar debido a que era
necesario grabar los backups en dispositivos de cinta.
Mantener backups de confianza y disfrutar de rapidez y eficacia al
recuperar los datos son tareas que requieren mucho tiempo y esfuerzo
con la cinta. Si los datos tienen que almacenarse de manera duradera
en la cinta, es necesario realizar varias copias. Si todo funciona
correctamente y existe una contención mínima de los recursos de
cinta, los robots de cinta y el software de backup pueden encontrar los
datos necesarios con facilidad. No obstante, si el hardware falla, se
precisa de la intervención humana para restablecer los datos desde la
cinta. La contención de las unidades de cinta derivada de solicitudes
de cinta de varios usuarios ralentiza todavía más los procesos de
restablecimiento. Esto afecta al objetivo de tiempo de recuperación
(RTO) y hace que conseguirlo sea más complicado que con las copias
de seguridad almacenadas en la nube.
Solución | Por qué Amazon Web Services
Amazon.com empezó a evaluar Amazon S3 para poder introducir mejoras
económicas y de rendimiento en el ámbito de la copia de seguridad de los
datos. Como parte de dicha evaluación, estudiaron los aspectos de
seguridad, disponibilidad y desempeño de las backups de Amazon S3.
Amazon.com también realizó un análisis costo-beneficio para garantizar que
la migración a Amazon S3 merecía la pena desde el punto de vista
económico. Este análisis costo-beneficio comprendía los siguientes
elementos:
Ventajas de desempeño y competitividad de los costos. Era importante
que los costos generales de los backups no aumentaran. Al mismo
tiempo, Amazon.com precisaba de un desempeño más rápido para
backups y recuperaciones. El tiempo y el esfuerzo necesarios para las
operaciones de backup y recuperación demostraron ser una mejora
importante con respecto a la cinta, ya que el restablecimientos desde
Amazon S3 se ejecutaba de dos a doce veces más rápido que un
restablecimiento similar desde la cinta. Amazon.com necesitaba un
nuevo método de backup para ofrecer más desempeño y, al mismo
tiempo, mantener o reducir los costos generales. Los backups en
discos on-premise hubieran mejorado el desempeño, pero hubiesen
supuesto pérdidas en relación con la competitividad de los costos. El
almacenamiento basado en la nube de Amazon S3 cumplía los dos
criterios.
Mayor durabilidad y disponibilidad. Amazon S3 está diseñado para
ofrecer una durabilidad del 99.999999999% y una disponibilidad de los
objetos del 99.99% durante un año concreto. Amazon.com comparó
estas cifras con las de la infraestructura de la cinta, tras lo cual
determinó que Amazon S3 ofrecía una mejora importante.
Menor fricción operativa. Los administradores de bases de datos de
Amazon.com tuvieron que evaluar si las backups de Amazon S3 serían
viables para las backups de las bases de datos. Determinaron que
utilizar Amazon S3 para las backups resultaba fácil de implementar ya
que funcionaba perfectamente con Oracle RMAN.
Seguridad de los datos potente. Amazon.com observó que AWS cumplía
todos los requisitos de seguridad física, acreditaciones de seguridad y
procesos de seguridad, protegía los datos en tránsito y en reposo y
utilizaba los estándares de cifrado adecuados.
Resultado
Durante todo el proceso de migración a Amazon S3, Amazon.com ha
obtenido varias ventajas, entre las que se incluyen:
Eliminación de una planificación compleja de la capacidad de cinta que
tanto tiempo requería. Amazon.com crece de manera más acuciante y
dinámica cada año, tanto orgánicamente como a raíz de sus
adquisiciones. AWS ha permitido a Amazon.com seguir el ritmo
perfectamente de esta rápida expansión. Anteriormente, los grupos
empresariales de Amazon.com tenían que elaborar planes de backups
anuales, en los que cuantificaban el volumen de almacenamiento en
cinta que pretendían utilizar a lo largo del año y la frecuencia con la
que utilizarían los recursos de cinta. Estos planes se utilizan para
cobrar a cada organización por el uso que hacen de las cintas, para lo
que se reparte el costo entre muchos equipos. Con Amazon S3, los
equipos solo tienen que pagar por lo que utilizan. Se les facturará
según el uso que hayan realizado. Prácticamente no existe ningún
límite máximo en cuanto a la cantidad de datos que se pueden
almacenar en Amazon S3, por lo que no es necesario preocuparse por
agotar los recursos. Para los equipos que hayan adoptado los backups
de Amazon S3, la necesidad de realizar una planificación formal se ha
eliminado prácticamente.
Menos inversiones de capital. Amazon.com ya no necesita adquirir
robots de cinta, unidades de cinta, inventarios de cinta, espacio para
centros de datos, dispositivos de red o software para backup
empresarial ni prever el futuro consumo de cinta. De esta forma, se
elimina el problema de tener que presupuestar con mucha antelación
los bienes de equipo y los gastos de capital.
Disponibilidad inmediata de los datos para su restablecimiento, sin
necesidad de localizar ni de recuperar cintas físicas. Los
administradores de bases de datos siempre experimentan retrasos
cuando tienen que restablecer datos desde cintas. El software de
backup de la cinta tiene que leer el catálogo de la cinta para encontrar
los archivos correctos que se van a restablecer, localizar la cinta
correcta, montar la cinta y leer los datos que esta contiene. En casi
todos los casos, los datos se distribuyen entre varias cintas, lo que
provoca aún más retrasos. Esto, sumado a la contención de las
unidades de cinta a raíz de solicitudes de cinta realizadas por varios
usuarios, ralentiza el proceso todavía más. Esto resulta especialmente
grave durante eventos de vital importancia como la interrupción de un
centro de datos, donde es necesario restablecer muchas bases de
datos al mismo tiempo y lo antes posible. Ninguno de estos problemas
se producen con Amazon S3. Los restablecimientos de datos pueden
comenzar de inmediato, sin necesidad de esperar ni de soportar las
colas de las cintas, lo que significa que la base de datos se puede
restablecer mucho más rápido.
El backup de una base de datos en Amazon S3 puede realizarse de dos
a doce veces más rápido que con unidades de cinta. Por ejemplo, en
una prueba de referencia, un administrador de base de datos pudo
restablecer 3.8 terabytes en 2.5 horas a través de Gigabit Ethernet.
Esto asciende a 25 gigabytes por minuto, o 422 MB por segundo.
Además, habida cuenta de que Amazon.com utiliza la compresión de
datos RMAN, la tasa de restablecimiento efectiva ascendió a 3.37
gigabytes por segundo. Estas 2.5 horas se comparan con el periodo
habitual de 10 a 15 horas que hubiera sido necesario con una cinta.
Sencilla implementación de las backups de Oracle RMAN en Amazon
S3. A los administradores de bases de datos les resultó sencillo iniciar
los backups de sus bases de datos en Amazon S3. Para direccionar las
backups de Oracle RMAN a Amazon S3 solo es necesario realizar una
configuración del módulo Oracle Secure Backup Cloud (SBC). El trabajo
necesario para configurar el módulo Oracle SBC supuso una hora o
menos por cada base de datos. Después de esta configuración puntual,
los backups de las bases de datos se redireccionaron de manera
transparente a Amazon S3.
Amazon S3 ofrece un almacenamiento de los datos a muy largo plazo,
dado que es un servicio diseñado para ofrecer una durabilidad del
99.9999999%. En ocasiones, Amazon.com ha experimentado errores de
hardware con la infraestructura de cinta debido a que las cintas se
rompen, las unidades de cinta fallan y los componentes robóticos
fallan. En ocasiones, esto sucede cuando un administrador de base de
datos intenta restablecer una base de datos y, con ello, provoca que
aumente significativamente el tiempo medio de recuperación (MTTR).
Con la durabilidad y disponibilidad de Amazon S3, estos problemas
desaparecen.
Liberación de recursos humanos importantes. Con la infraestructura de
cinta, Amazon.com tenía que recurrir a ingenieros expertos en
instalaciones muy grandes de backups en cinta, que deben reunir una
serie de cualidades especializadas y específicas del proveedor que
resultan difíciles de encontrar. También tenían que contratar técnicos
de centros de datos que se dedicaran a solucionar problemas de
hardware y generales, como sustituir las unidades, transferir las
cintas, entregar y hacer un seguimiento de las cintas, etc. Amazon S3
permitió a estos profesionales liberarse de las operaciones diarias
para que pudieran centrarse en desarrollar tareas de ingeniería más
importantes y críticas para la empresa.
Eliminación del transporte de cintas físicas a ubicaciones remotas. Las
empresas que hayan almacenado de manera remota los datos de
backup de Oracle deberían analizar detenidamente los costos
relacionados con el transporte, la protección y el almacenamiento de
las cintas en ubicaciones remotas, ya que estos costos pueden
reducirse o quizá eliminarse con el almacenamiento de los datos en
Amazon S3.
Como el minorista online más importante del mundo, Amazon.com busca
innovar constantemente a fin de ofrecer mejores experiencias a los clientes
y ofrecer productos al precio más bajo posible. Una de tales innovaciones
ha sido reemplazar la cinta por el almacenamiento en Amazon S3 para los
backups de las bases de datos. Se trata de una innovación que pueden
replicar fácilmente otras organizaciones que utilizan la cinta para realizar
backups de bases de datos de Oracle.
Acerca de Amazon.com
Amazon.com es el minorista en línea más grande del mundo.