Tolerancia a Fallos en Sistemas Distribuidos

1) Los sistemas distribuidos requieren tolerancia a fallos para evitar tiempos de inactividad programados y no programados. Esto incluye planes de contingencia, recuperación de desastres y continuidad del negocio. 2) La alta disponibilidad utiliza redundancia para minimizar el riesgo de paradas debido a fallos mediante la detección rápida de errores y la recuperación de aplicaciones en hardware alternativo. 3) Las mejores prácticas incluyen copias de seguridad, equilibrio de carga de red, sol

Cargado por

zoesl2002

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

44 vistas4 páginas

Tolerancia a Fallos en Sistemas Distribuidos

Cargado por

zoesl2002

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

TEMA 4.

TOLERANCIA A FALLOS EN SISTEMAS DISTRIBUIDOS

1. MOTIVACIÓN DE LA FIBILIDAD DE LOS SISTEMAS
El tiempo de inactividad es el periodo de tiempo en que un sistema (o red) no está disponible para su
uso.
Hay dos tipos de tiempo de inactividad programados y no programados:

 Un tiempo de inactividad programado es el resultado de un mantenimiento, que es

inevitable. Esto incluye aplicar parches, actualizar programas o incluso cambios en el
esquema de la base de datos.
 Un tiempo de inactividad no programado es causado por un evento imprevisto, como un
fallo de hardware o software. Esto puede suceder debido a cortes de energía o fallos de un
componente.
Los tiempos de inactividad programados generalmente se excluyen de los cálculos de rendimiento.
Una interrupción no planificada no siempre es un desastre. Por ejemplo, que un disco duro falle, o una
fuente de alimentación falle es un incidente y debe ser tratado como tal.

 Desastres naturales
 Accidentes
 Desastres provocados
 Desastres políticos
 Desastres informáticos

2. PLANES PARA EVITAR ALCANCE DE LOS DESASTRES

Para poder evitar el impacto de los desastres hay que planificar. Podemos contar con planes de
contingencia, de recuperación de desastres y de continuidad del negocio.

 Plan de contingencia: los planes de contingencia se orientan a proteger un elemento

específico de tecnología, que es vital para la organización, y poseer control total sobre este,
por ejemplo: un servidor, una aplicación, un dispositivo o un elemento de soporte de
comunicaciones (router, switch, etc).
 Plan de recuperación de desastres (DRP): Un plan de recuperación de desastres es un
conjunto estructurado de recursos humanos, técnicos y procedimentales, aprobados por la
dirección para recuperar en el menor tiempo y coste posibles y con los condicionantes y
limitaciones que se tienen, una actividad interrumpida a causa de una emergencia.
 Plan de continuidad del negocio: Conjunto de tareas que permite a las organizaciones
continuar su actividad ante una situación que afecte a sus operaciones. Un plan de continuidad
afecta tanto a los sistemas informáticos, como al resto de procesos de la organización.

3. CUESTIONES PARA REALIZAR UN ANÁLISIS DE IMPACTO

¿Qué cuestiones o preguntas se os ocurren que debemos plantearnos a la hora de realizar un análisis
de impacto?

 ¿Tienes copias de seguridad de toda la información?

 ¿Qué elementos son más críticos?
 ¿Están las réplicas en el mismo edificio o fuera?
 ¿Por qué desastres se puede ver afectado tu empresa? Inundaciones, incendios...
 ¿Cuántas personas quedarían inactivas ante un desastre?
 ¿Cómo afecta económicamente una interrupción del servicio informático?
 Interdependencia entre la empresa y un proveedor
En definitiva se trata de establecer métricas y valores tangibles:

 Ejemplos de valores tangibles:

o Dinero que se deja de percibir
o Coste de vuelta a la normalidad
o Sanciones impuestas por organizamos oficiales
o Penalizaciones contractuales ejercidas por clientes
o Corrupción de materiales perecederos.
o Préstamos necesarios para continuar con la actividad
 Ejemplos de valores intangibles:
o Impacto en proveedores
o Fluctuaciones de acciones en bolsa
o Impacto en empleados
o Impacto en la imagen de empresa y/o producto

4. ALTA DISPONIBILIDAD
Alta disponibilidad (HA) es una estrategia de gestión de sistemas para restaurar rápidamente los
servicios esenciales, al producirse un evento en el sistema, componente o aplicación de fallo. Por otro
lado, la alta disponibilidad no es un software específico o un hardware específico, es la suma de
software, hardware y buenas practicas bien documentadas.
De acuerdo con el DRII (Disaster Recovery Institute International), la alta disponibilidad se define
como: “sistemas o aplicaciones que requieren un alto nivel de fiabilidad y disponibilidad. Los
sistemas de alta disponibilidad operan normalmente 24x7 y normalmente necesitan ser construidos
usando redundancia para minimizar el riesgo de una parada debida a fallos en hardware o
comunicación”.
Alta disponibilidad más allá de la disponibilidad del hardware, implica asegurar la disponibilidad de
acceso a la aplicación, con solo una pequeña interrupción, en caso de fallo de alguno de los
componentes del sistema. Los sistemas de HA permiten reiniciar aplicaciones en un hardware
redundante en caso de fallos. El tiempo de interrupción depende principalmente de la recuperabilidad
de la aplicación.
*Se entiende como tiempo de interrupción al tiempo que le cuesta a la aplicación volver a estar
operativa en caso de una parada brusca.

5. ESTRATEGIDAS PARA DISEÑAR UN SISTEMA FIABLE

Sistema fiable

 Sistema no redundante (sin copias)

o Evitación / prevención de fallos
 Sistema redundante
o Detección de errores (reinicio)
o Sistemas tolerantes a fallos
 Redundancia estática: los sistema redundantes están siempre activos. Los dos
programas se ejecutan a la vez.
 Redundancia dinámica: los sistema redundantes se activan cuando se detecta
el fallo. El programa solo se va a ejecutar cuando haga falta.
Ejemplo:
Ejemplo de redundancia estática y dinámica desde el punto de vista del software:
Imaginemos que solicitamos que nos hagan un SW, aportamos nuestros requisitos y nos lo entregan.
¿cómo podemos prevenir posibles errores del mismo por defectos en su programación?
Redundancia estática del software: basada en la programación con N versiones.
La programación N-versión se define como la
generación independiente de N (N>=2)
programas, a partir de una misma
especificación. Los programas se ejecutan
concurrentemente, con la misma entrada, y
sus resultados son comparados por un
proceso coordinador. El resultado ha de ser el mismo. Si hay discrepancia, se realiza una votación
entre las N versiones.
Redundancia dinámica en el software: basada en
bloques de recuperación y en programación con N
versiones auto comprobantes .
En la redundancia dinámica en el software, los
componentes redundantes solo se ejecutan cuando se
detecta un error.

6. EJEMPLOS DE MEJORES PRÁCTICAS

 Copias de seguridad, recuperación y replicación de datos: Estrategia, pruebas, copias

parciales vs copias completas, etc
 Agrupación: En caso de error, la agrupación en clúster puede proporcionar servicios
instantáneos de aplicación de conmutación por error. Un servicio de aplicaciones que es
compatible con clústeres es capaz de invocar recursos desde múltiples servidores, es decir,
vuelve a un servidor secundario si el servidor principal se desconecta. Esto significa que
cualquier nodo puede desconectarse o apagarse de la red, y el resto del clúster continuará
funcionando normalmente, siempre que al menos un nodo sea completamente funcional.
 Equilibrio de carda de red: El equilibrio de carga es una forma efectiva de aumentar la
disponibilidad de aplicaciones críticas basadas en la web. Cuando se detectan instancias de
falla del servidor, se reemplazan sin problemas cuando el tráfico se redistribuye
automáticamente a los servidores que aún se están ejecutando.
 Soluciones de Failover: La conmutación por error es básicamente un modo operativo de
respaldo, en el cual las funciones de un componente del sistema son asumidas por un sistema
secundario, en caso de que el primario se desconecte, ya sea por falla o por un tiempo de
inactividad planificado
 Plan de contingencia: al final acabará fallando, por tanto hay que tener planes que me
permitan mitigar el impacto del fallo.

También podría gustarte

Tema 4
Aún no hay calificaciones
Tema 4
4 páginas
Alta Disponibilidad: Los Cinco Nueves
Aún no hay calificaciones
Alta Disponibilidad: Los Cinco Nueves
19 páginas
CC 5 HGVVVH
Aún no hay calificaciones
CC 5 HGVVVH
49 páginas
Si6x Ciberseguridad
Aún no hay calificaciones
Si6x Ciberseguridad
25 páginas
Disponibilidad de Sistemas: Los Cinco Nueves
Aún no hay calificaciones
Disponibilidad de Sistemas: Los Cinco Nueves
26 páginas
Estrategias para Alta Disponibilidad y Recuperabilidad
Aún no hay calificaciones
Estrategias para Alta Disponibilidad y Recuperabilidad
7 páginas
Estrategias de Alta Disponibilidad
Aún no hay calificaciones
Estrategias de Alta Disponibilidad
20 páginas
1.5 Disponibilidad Términos Uptime Downtime CC
Aún no hay calificaciones
1.5 Disponibilidad Términos Uptime Downtime CC
30 páginas
Fundamentos de Seguridad Informática (6 - El Reino de Los Cinco Nueves)
Aún no hay calificaciones
Fundamentos de Seguridad Informática (6 - El Reino de Los Cinco Nueves)
15 páginas
Soluciones de Alta Disponibilidad
Aún no hay calificaciones
Soluciones de Alta Disponibilidad
33 páginas
Ga10 220501097 Aa4 Ev01
Aún no hay calificaciones
Ga10 220501097 Aa4 Ev01
9 páginas
Configuración y Gestión de Clústeres TI
Aún no hay calificaciones
Configuración y Gestión de Clústeres TI
8 páginas
Alta Disponibilidad en Sistemas Informáticos
Aún no hay calificaciones
Alta Disponibilidad en Sistemas Informáticos
4 páginas
GA10-220501097-AA4-EV01 Conceptos Acerca de Conf de Servicios
Aún no hay calificaciones
GA10-220501097-AA4-EV01 Conceptos Acerca de Conf de Servicios
13 páginas
Conceptos y Principios Acerca de Configuración Se Servicios Ga10-220501097-Aa4-Ev01
Aún no hay calificaciones
Conceptos y Principios Acerca de Configuración Se Servicios Ga10-220501097-Aa4-Ev01
7 páginas
Alta Disponibilidad y Bóveda Electrónica
Aún no hay calificaciones
Alta Disponibilidad y Bóveda Electrónica
9 páginas
UNIDAD 7. Seguridad Operacional en El Área de Informática
100% (1)
UNIDAD 7. Seguridad Operacional en El Área de Informática
7 páginas
Servicios de Servidores de Alta Disponibilidad
Aún no hay calificaciones
Servicios de Servidores de Alta Disponibilidad
24 páginas
Unidad 3 - de La Torre Perera Leonardo - 8CM22
Aún no hay calificaciones
Unidad 3 - de La Torre Perera Leonardo - 8CM22
19 páginas
GA5-220501106-AA3-EV01 Informe-Tecnico ENTREGADO
Aún no hay calificaciones
GA5-220501106-AA3-EV01 Informe-Tecnico ENTREGADO
14 páginas
Alta disponibilidad: clave para sistemas robustos
Aún no hay calificaciones
Alta disponibilidad: clave para sistemas robustos
3 páginas
TI013 AnexoC Esp
Aún no hay calificaciones
TI013 AnexoC Esp
58 páginas
Almacenamiento Distribuido en Sistemas
Aún no hay calificaciones
Almacenamiento Distribuido en Sistemas
9 páginas
Conceptos y Principios Acerca de Configuración Se Servicios. GA10 220501097-AA4-EV01.
Aún no hay calificaciones
Conceptos y Principios Acerca de Configuración Se Servicios. GA10 220501097-AA4-EV01.
9 páginas
Arquitectura Alta Disponibilidad
Aún no hay calificaciones
Arquitectura Alta Disponibilidad
18 páginas
Lectura 2
Aún no hay calificaciones
Lectura 2
18 páginas
Plan Continuidad CallCenter SENA
Aún no hay calificaciones
Plan Continuidad CallCenter SENA
11 páginas
Fiabilidad y Manejo de Fallas en Software
Aún no hay calificaciones
Fiabilidad y Manejo de Fallas en Software
81 páginas
Importancia de la Integridad de Datos
Aún no hay calificaciones
Importancia de la Integridad de Datos
46 páginas
La Continuidad de TI y La Recuperación Ante Desastres
Aún no hay calificaciones
La Continuidad de TI y La Recuperación Ante Desastres
3 páginas
Estrategias para la Resiliencia Empresarial
Aún no hay calificaciones
Estrategias para la Resiliencia Empresarial
29 páginas
Tarea 02
Aún no hay calificaciones
Tarea 02
13 páginas
Sistemas de Alta Disponibilidad y Tolerancia a Fallos
Aún no hay calificaciones
Sistemas de Alta Disponibilidad y Tolerancia a Fallos
21 páginas
Procedimiento de Respaldo en Ciberseguridad
Aún no hay calificaciones
Procedimiento de Respaldo en Ciberseguridad
17 páginas
S07 - 01 - Estrategias de Recuperacion Acorde Con Las Reales Necesidades Del Negocio
Aún no hay calificaciones
S07 - 01 - Estrategias de Recuperacion Acorde Con Las Reales Necesidades Del Negocio
33 páginas
Administración de Servidores de Bases de Datos
Aún no hay calificaciones
Administración de Servidores de Bases de Datos
11 páginas
Resumen Tolerancia A Fallos
Aún no hay calificaciones
Resumen Tolerancia A Fallos
7 páginas
Semana 2
Aún no hay calificaciones
Semana 2
8 páginas
Alta Disponibilidad y Tolerancia a Fallos
Aún no hay calificaciones
Alta Disponibilidad y Tolerancia a Fallos
19 páginas
Configuración de Servicios en Clústeres
Aún no hay calificaciones
Configuración de Servicios en Clústeres
6 páginas
Estrategias de Continuidad del Negocio
Aún no hay calificaciones
Estrategias de Continuidad del Negocio
43 páginas
Alta Disp 2011
Aún no hay calificaciones
Alta Disp 2011
63 páginas
Informe Técnico. GA5-220501106-AA3-EV01-FERNANDO RAVELO
Aún no hay calificaciones
Informe Técnico. GA5-220501106-AA3-EV01-FERNANDO RAVELO
19 páginas
Tratamiento de Fallos Fallos
Aún no hay calificaciones
Tratamiento de Fallos Fallos
5 páginas
3.1 - Anexo 1.3 Alta Disponibilidad - y - Escalamiento
Aún no hay calificaciones
3.1 - Anexo 1.3 Alta Disponibilidad - y - Escalamiento
12 páginas
Monitoreo y Seguridad de Vehículos UDB
Aún no hay calificaciones
Monitoreo y Seguridad de Vehículos UDB
6 páginas
Guia para La Construccion de Un Plan de Continuidad
100% (1)
Guia para La Construccion de Un Plan de Continuidad
25 páginas
Apunte Unidad 2 TALLER DE ANÁLISIS DE RIESGOS Y CONTROLES DE SEGURIDAD
Aún no hay calificaciones
Apunte Unidad 2 TALLER DE ANÁLISIS DE RIESGOS Y CONTROLES DE SEGURIDAD
17 páginas
Diplomado en Arquitectura de Software: Disponibilidad
Aún no hay calificaciones
Diplomado en Arquitectura de Software: Disponibilidad
57 páginas
UT04 - Tema06 Almacenamiento Redundante para Alumnos
Aún no hay calificaciones
UT04 - Tema06 Almacenamiento Redundante para Alumnos
24 páginas
Protocolo de Alta Disponibilidad
Aún no hay calificaciones
Protocolo de Alta Disponibilidad
3 páginas
Plan de Continuidad del Negocio en CPD
Aún no hay calificaciones
Plan de Continuidad del Negocio en CPD
10 páginas
Clústeres y Gestión de Riesgos en TI
Aún no hay calificaciones
Clústeres y Gestión de Riesgos en TI
14 páginas
GA10 220501097-AA4-EV01 - Conceptos y Principios Acerca de Configuración de Servicios
Aún no hay calificaciones
GA10 220501097-AA4-EV01 - Conceptos y Principios Acerca de Configuración de Servicios
4 páginas
Análisis de Arquitectura Empresarial TI
Aún no hay calificaciones
Análisis de Arquitectura Empresarial TI
76 páginas
Sistema de Geolocalización Ammys
Aún no hay calificaciones
Sistema de Geolocalización Ammys
35 páginas
Diseño y Mejora en SCM
Aún no hay calificaciones
Diseño y Mejora en SCM
63 páginas
Guía de Aprendizaje en Desarrollo de Software
Aún no hay calificaciones
Guía de Aprendizaje en Desarrollo de Software
24 páginas
Tendencias Modernas en Selección de Personal
100% (2)
Tendencias Modernas en Selección de Personal
13 páginas
Aumenta ventas con gestión ERP
Aún no hay calificaciones
Aumenta ventas con gestión ERP
7 páginas
Evaluación y Pronósticos en Ventas
Aún no hay calificaciones
Evaluación y Pronósticos en Ventas
2 páginas
Entrevista Gestión Documental
100% (2)
Entrevista Gestión Documental
41 páginas
Ejemplo Procesos BPMN
Aún no hay calificaciones
Ejemplo Procesos BPMN
17 páginas
Listado de Proveedores y Clientes ERP
Aún no hay calificaciones
Listado de Proveedores y Clientes ERP
2 páginas
CVSOFIAVEGA
Aún no hay calificaciones
CVSOFIAVEGA
9 páginas
RAP12 - GA4 - AA2 - EV04 - ITC - Diagrama de Clases Del Proyecto de Software
Aún no hay calificaciones
RAP12 - GA4 - AA2 - EV04 - ITC - Diagrama de Clases Del Proyecto de Software
5 páginas
MD3D - Máster en Especialización en Fabricación Aditiva
Aún no hay calificaciones
MD3D - Máster en Especialización en Fabricación Aditiva
48 páginas
Factura Electrónica de Venta
Aún no hay calificaciones
Factura Electrónica de Venta
1 página
PresentaciÃ N Dinero Electrã Nico New
Aún no hay calificaciones
PresentaciÃ N Dinero Electrã Nico New
16 páginas
TPS 338 2021 1 Def
Aún no hay calificaciones
TPS 338 2021 1 Def
4 páginas
Autoevaluación N°3 - Marketing Relacional
67% (3)
Autoevaluación N°3 - Marketing Relacional
4 páginas
Resumen de Funciones en SAP S/4HANA Retail, S4IRT Col02
Aún no hay calificaciones
Resumen de Funciones en SAP S/4HANA Retail, S4IRT Col02
20 páginas
Implementación Efectiva de CRM Empresarial
Aún no hay calificaciones
Implementación Efectiva de CRM Empresarial
19 páginas
Sopa de Letras
Aún no hay calificaciones
Sopa de Letras
2 páginas
Informe-Sistema de Gestión de Tienda de Informática
Aún no hay calificaciones
Informe-Sistema de Gestión de Tienda de Informática
25 páginas
Factura Electrónica Bodega Pepito
Aún no hay calificaciones
Factura Electrónica Bodega Pepito
1 página
Cómo Activar Office 2013 Professional Plus GRATIS Sin Programas
Aún no hay calificaciones
Cómo Activar Office 2013 Professional Plus GRATIS Sin Programas
1 página
Metodologías Ágiles para Emprendimientos
100% (1)
Metodologías Ágiles para Emprendimientos
73 páginas
Simulación VISSIM en Zipaquirá TPCU
Aún no hay calificaciones
Simulación VISSIM en Zipaquirá TPCU
9 páginas
Política Seguridad Fapro SpA
Aún no hay calificaciones
Política Seguridad Fapro SpA
17 páginas
Definición y Objetivos del Software CIM
Aún no hay calificaciones
Definición y Objetivos del Software CIM
5 páginas
Ventajas y Desventajas del Cloud Computing
Aún no hay calificaciones
Ventajas y Desventajas del Cloud Computing
3 páginas
Reporte Runa - El Futuro de Trabajo en América Latina
Aún no hay calificaciones
Reporte Runa - El Futuro de Trabajo en América Latina
24 páginas
Carta de Serv. Post Venta 30072020
Aún no hay calificaciones
Carta de Serv. Post Venta 30072020
3 páginas
Factura Electrónica Lima Gas S.A.
Aún no hay calificaciones
Factura Electrónica Lima Gas S.A.
1 página