Sla PDF
Sla PDF
Mejores Prácticas
Contenido
Introducción
Descripción general de la administración de niveles de servicio
Factores de éxito crítico
Indicadores de rendimiento
Flujo del proceso de administración de nivel de servicio
Implementar la administración de nivel de servicio
Definición de los niveles de servicio de la red
Creando y mantener los SLA
Indicadores de rendimiento de la administración de nivel de servicio
Service Level Agreement o definición de nivel de servicio documentado
Métricas del Indicador de rendimiento
Revisión de la administración de nivel de servicio
Resumen de administración de nivel de servicio
Información Relacionada
Introducción
Este documento describe la administración de nivel de servicio y los acuerdos de nivel de servicio
(SLA) para las redes de alta disponibilidad. Incluye los factores de éxito importantes para que la
administración de nivel de servicio y los indicadores de rendimiento ayuden a evaluar el éxito. El
documento también provee detalles significativos de los SLA que siguen pautas de práctica
identificadas por el equipo de servicio de gran disponibilidad.
Indicadores de rendimiento
Los indicadores de rendimiento brindan el mecanismo por el cual una organización mide los
factores de éxito críticos. Usted revisa típicamente éstos en una base mensual para asegurarse
de que las definiciones de nivel de servicio o los SLA están trabajando bien. El grupo de
operaciones de red y los grupos de herramientas necesarias pueden realizar las siguientes
mediciones.
Note: Para las organizaciones sin los SLA, le recomendamos realizamos las definiciones de nivel
de servicio y los estudios del servicio-nivel además de las métricas.
El flujo del proceso de alto nivel para la administración de nivel de servicio contiene dos grupos
principales:
Necesidad de los administradores de la red de definir las reglas principales por las cuales la red
es soportada, manejado, y medido. Los niveles de servicio representan metas para todo el
personal de la red y se pueden utilizar como métrica de la calidad de todo el servicio. También
puede usar las definiciones de nivel de servicio como una herramienta para presupuestar los
recursos de la red y como evidencia por si fueran necesarios más fondos QoS. También proveen
una forma de evaluar al proveedor y el rendimiento de la portadora.
Sin una medición y definición de nivel de servicio, la organización no tiene objetivos bien
definidos. La satisfacción del servicio debe regirse por los usuarios sin grandes diferencias entre
aplicaciones, operaciones servidor/cliente o soporte de red. El presupuesto puede ser más difícil
porque el resultado final no está claro a la organización, y finalmente, la organización de la red
tiende a ser más reactiva, no dinámica, en la mejora de la red y del modelo soporte.
Recomendamos los pasos siguientes para construir y soportar un modelo del servicio-nivel:
1. Analice los objetivos y restricciones técnicas.
2. Determine el presupuesto de disponibilidad.
3. Cree los perfiles de aplicación que detallan las Características de la red de las aplicaciones
críticas.
4. Defina la Disponibilidad y los estándares de rendimiento y defina los términos comunes.
5. Cree una definición de nivel de servicio que incluya la Disponibilidad, el funcionamiento, el
tiempo de respuesta del servicio, los Tiempos promedio para resolver el problema, la
detección de falla, los umbrales de la actualización, y el trayecto de escalada.
6. Recoja la métrica y monitoree la definición de nivel de servicio.
La mejor forma de comenzar a analizar objetivos y restricciones técnicas es generar una tormenta
de ideas o investigar objetivos y requisitos técnicos. A veces ayuda invitar a otros técnicos IT para
que se sumen al debate ya que ellos tienen objetivos específicos relativos a sus servicios. Los
objetivos técnicos incluyen la Disponibilidad de los niveles, producción, jitter, retardo, tiempo de
respuesta, los requisitos de ampliación, las introducciones de la nueva función, las introducciones
de la nueva aplicación, Seguridad, manejabilidad, e incluso coste. La organización luego debe
investigar las limitaciones para alcanzar esos objetivos dados los recursos disponibles. Puede
crear una hoja de trabajo para cada objetivo con una explicación de las restricciones.
Inicialmente, puede parecer como si la mayor parte de las metas no sean realizables. Luego,
comience a priorizar los objetivos o a disminuir las expectativas que aún pueden cumplir con los
requisitos de la empresa.
Por ejemplo, usted puede ser que tenga una Disponibilidad llana del 99.999 por ciento, o 5
minutos del tiempo muerto por el año. Hay varias restricciones para alcanzar este objetivo, por
ejemplo, puntos individuales de errores en el hardware, Tiempo intermedio para reparar (MTTR)
hardware dañado en ubicaciones remotas, confiabilidad de la portadora, capacidades de
detección de fallas proactivas, velocidades de cambio altas y limitaciones de la capacidad de la
red actual. Como consecuencia, usted puede ajustar la meta a un nivel más realizable. El modelo
de disponibilidad de la sección siguiente puede ayudarle a establecer objetivos realistas.
También puede considerar proporcionar una mayor disponibilidad en ciertas áreas de la red que
poseen menos restricciones. Cuando la organización de la red publica estándares de servicio
para disponibilidad, los grupos de negocios dentro de la organización pueden hallar inaceptable
este nivel. Éste es, entonces, un punto natural para iniciar discusiones SLA o modelos de
financiación/presupuesto que puedan satisfacer los requisitos comerciales.
Haga lo necesario para identificar todas las restricciones o riesgos que conlleva la realización del
objetivo técnico. Dé prioridad a las restricciones en función del riesgo o impacto al objetivo
deseado. Esto ayuda a la organización para dar prioridad a las iniciativas de mejora de la red y
para determinar cómo el obstáculo puede ser dirigido fácilmente. Hay tres tipos de limitaciones:
Las investigaciones del riesgo de la elasticidad del hardware de red deben concentrar en la
topología del hardware, la jerarquía, la modularidad, la Redundancia, y el MTBF a lo largo de las
trayectorias definidas en la red. Los apremios del link de red deben centrarse en los links de red y
la conectividad de la portadora para las organizaciones corporativas. Los apremios del link
pueden incluir la redundancia de link y la diversidad, las limitaciones de medios, atando con
alambre las infraestructuras, la Conectividad del local loop, y la conectividad de larga distancia.
Las limitaciones de diseño se relacionan con la comprobación o el diseño lógico de la red e
incluyen todo del espacio disponible para el equipo al scalability de la aplicación de Routing
Protocol. Todos los diseños del protocolo y de los media se deben considerar en relación con la
configuración, la Disponibilidad, el scalability, el funcionamiento, y la capacidad. Los apremios del
servicio de red tales como Protocolo de configuración dinámica de host (DHCP), Domain Name
System (DNS), Firewall, traductores de protocolos, y traductores de dirección de red deben
también ser considerados.
Las Prácticas del ciclo vital definen los procesos y la Administración de la red usada para
desplegar constantemente las soluciones, detectan y reparan los problemas, previenen la
capacidad o los problemas de rendimiento, y configuran la red para obtener consistencia y la
modularidad. Debe considerar esta área porque la falta de disponibilidad generalmente depende
de la experiencia y los procesos. El ciclo vital de la red refiere al ciclo de las hojas de operación
(planning), del diseño, de la implementación, y de las operaciones. Dentro de cada una de estas
áreas, usted debe entender la funcionalidad de la administración de red, tales como la
administración de rendimiento, la administración de configuración, el tratamiento de fallas y la
seguridad. Una evaluación del ciclo vital de la red es disponible desde servicios de (HAS) de los
servicios de gran disponibilidad de Cisco NSA que muestran las restricciones de la disponibilidad
de la red actual asociadas a las prácticas del ciclo vital de la red.
La carga de tráfico o las restricciones de aplicación actual refiere simplemente al impacto del
tráfico y de las aplicaciones actuales.
La siguiente hoja de trabajo usa el ya mencionado método objetivo/limitación para el ejemplo del
objetivo de prevención de un ataque a la seguridad o un ataque de Negación de servicio (DoS).
Usted puede también utilizar esta hoja de trabajo para ayudar a determinar la cobertura del
servicio para los ataques a la seguridad de reducción al mínimo.
● La organización puede utilizar esto como objetivo de disponibilidad interna y las desviaciones
pueden ser definidas y solucionadas rápidamente.
● Los planificadores de la red pueden utilizar la información al determinar la disponibilidad del
sistema para ayudar a garantizar que el diseño reunirá los requisitos del negocio.
Los factores que contribuyen a la indisponibilidad o período de interrupción incluyen la falla de
hardware, falla de software, poder y los Problemas de entorno, link o falla de portadora, diseño de
red, error humano, o falta de proceso. Deberá evaluar detenidamente cada uno de estos
parámetros al considerar el presupuesto de disponibilidad general para la red.
Ayuda de los perfiles de aplicación que la organización de interconexión de redes entiende y que
define los requisitos del nivel de servicio de la red para las aplicaciones individuales. Esto lo
ayuda a asegurarse de que la red soporte requisitos de aplicación individuales y servicios de red
generales. Los perfiles de aplicación pueden también servir como línea de fondo documentada
para el soporte de servicio de red cuando punta de la aplicación o de los grupos de servidores a
la red como el problema. En última instancia, los perfiles de aplicación ayudan a alinear los
objetivos del servicio de red con los requerimientos de aplicación o de negocios mediante la
comparación de los requisitos de aplicación, como el rendimiento y la disponibilidad, con los
objetivos realistas de servicio de red o las limitaciones actuales. Es importante no sólo para la
administración de nivel de servicio, sino también para el diseño general descendente de la red.
Cree los perfiles de aplicación cualquier momento usted introduce las nuevas aplicaciones a la
red. Es posible que sea necesario establecer un acuerdo entre el grupo de aplicación de IT, los
grupos de administración de servidores y la conexión en red para ayudar a imponer la creación de
perfiles de aplicación para los servicios nuevos y los que ya existen. Perfiles de aplicación
completos para las aplicaciones comerciales y las aplicaciones del sistema. Las aplicaciones
comerciales pueden incluir el email, transferencia de archivos, exploración de la Web, diagnóstico
por imágenes, o fabricación. Las aplicaciones del sistema pueden incluir la distribución del
software, la autenticación del usuario, el respaldo de la red y la administración de la red.
Un analista de red y una aplicación o la aplicación de soporte de servidor deben crear el perfil de
aplicación. Las nuevas aplicaciones pueden requerir el uso de un analizador de protocolo y de un
emulador WAN con la emulación del retardo de caracterizar correctamente los requerimientos de
la aplicación. Esto ayuda a identificar el ancho de banda necesario, el retraso máximo para la
utilidad de la aplicación y los requerimientos de fluctuación. Esto puede realizarse en un entorno
de laboratorio siempre que tenga los servidores requeridos. En otros casos, por ejemplo con el
VoIP, los requisitos de la red incluyendo el jitter, el retardo, y el ancho de banda se publican bien
y la prueba de laboratorio no será necesaria. Un perfil de aplicación debe incluir los elementos
siguientes:
● Nombre de la aplicación
● Tipo de aplicación
● ¿Nueva aplicación?
● Importancia comercial
● Requerimientos de disponibilidad
● Protocolos y puertos usados
● Ancho de banda de usuario estimado (kbps)
● Número y ubicación de los usuarios
● Requisitos de la transferencia de archivos (tiempo incluyendo, volumen, y puntos finales)
● Impacto de la interrupción de la red
● Retardo, jitter, y requerimientos de disponibilidad
El objetivo del perfil de aplicación es comprender los requisitos comerciales para la aplicación, el
carácter crítico del negocio y los requisitos de la red como el ancho de banda, el retardo y la
fluctuación. Además, la organización de interconexión de redes debe entender el impacto del
tiempo de inactividad de la red. En algunos casos, usted necesitará los recomienzos de la
aplicación o del servidor que agregan perceptiblemente al tiempo de inactividad de la aplicación
total. Cuando completa el perfil de la aplicación, puede comparar las capacidades generales de la
red y contribuir a alinear los niveles de servicio de la red con los requisitos comerciales y de la
aplicación.
La Disponibilidad y los estándares de rendimiento fijaron las expectativas del servicio para la
organización. Éstos pueden ser definidos para distintas áreas de la red o para aplicaciones
específicas. El funcionamiento se puede también definir en términos de retardo de ida y vuelta,
jitter, rendimiento máximo, compromisos de ancho de banda, y escalabilidad general. Además de
fijar las expectativas del servicio, la organización debe también tomar el cuidado para definir cada
uno de los estándares del servicio de modo que el usuario y los grupos TIC que trabajan con el
establecimiento de una red entiendan completamente el servicio estándar y cómo se relaciona
con sus requisitos de la aplicación o de la administración de servidores. Los grupos de usuarios y
de IT también deben comprender cómo se debe medir el estándar de servicio.
Los resultados de los pasos de definición de nivel del servicio previo ayudarán a crear el
estándar. En este momento, la organización de interconexión de redes debe tener un
conocimiento de los riesgos y de los apremios actuales en la red, una comprensión de la
conducta de la aplicación, y una disponibilidad teórica del análisis o línea de base de
disponibilidad.
1. Defina el geográfico o las áreas de aplicación donde estarán aplicados los estándares del
servicio.Podría incluir áreas como la LAN de oficinas centrales, la WAN local, extranet o la
conectividad asociada. En algunos casos, la organización puede tener diversos objetivos de
nivel de servicio dentro de una área. Este no es común para las empresas o las
organizaciones proveedoras de servicios. En estos casos, no sería infrecuente crear
diversos estándares del nivel de servicio basados en los requisitos del servicio individual. Se
pueden clasificar como estándares de servicio de oro, plata y bronce dentro de un área
geográfica o de servicio.
2. Defina los parámetros estándars del servicio.La Disponibilidad y el retardo de ida y vuelta
son la mayoría de los estándares del servicio de red común. El rendimiento máximo, el
compromiso de ancho de banda mínimo, el jitter, los índices de errores aceptables, y las
capacidades de escalabilidad se pueden también incluir según las necesidades. Tenga
cuidado al revisar el parámetro de servicio para los métodos de medición. Si el parámetro
avanza hacia la SLA o no, la organización debe pensar en cómo se debería medir o justificar
el parámetro de servicio cuando ocurren problemas o desacuerdos de servicio.
Después de que usted defina las áreas de servicio y los parámetros de servicio, utilice la
información de los pasos anteriores para construir la matriz de estándares de servicios. La
organización también necesitará definir las áreas que pueden ser confusas a los usuarios y a los
grupos TIC. Por ejemplo, el tiempo de respuesta máximo será muy diferente para un ping de ida y
vuelta que para golpear tecla Enter (Intro) en un lugar remoto para una aplicación específica. La
tabla siguiente muestra los objetivos de rendimiento dentro de los Estados Unidos.
Blanco
media
Tiempo Método de
Dispon Método del
Área de la medición
ibilidad de tiempo
de respuesta de tiempo
de la medici de
red máximo de
blanco ón respues
validado respuesta
ta de la
red
Minuto
s de Respuesta
99.99 Menos
LAN usuario 10 ms de ping de
% de 5 ms
impact ida y vuelta
ado
Menos
Minuto
de 100
s de Respuesta
99.99 ms
WAN usuario 150 ms de ping de
% (ping de
impact ida y vuelta
ida y
ado
vuelta)
Menos
WAN Minuto
de 100
crític s de Respuesta
99.99 ms
oy usuario 150 ms de ping de
% (ping de
extra impact ida y vuelta
ida y
net ado
vuelta)
Éste es el paso más reciente hacia la Administración del nivel del servicio básico; define el
reactivo y los procesos proactivos y las capacidades de administración de red que usted
implementa para alcanzar los objetivos de nivel de servicio. El documento final típicamente se
llama un plan de soporte de las operaciones. La mayoría de los planes del soporte de
aplicaciones incluyen solamente los requisitos de soporte reactivo. En los entornos de gran
disponibilidad, la organización debe también considerar los procesos de la administración
proactiva que serán utilizados para aislar y los problemas de red de la resolución antes de que se
inicien las llamadas de servicio de usuario. En general, el documento final debe:
Usted no alcanzará el nivel del servicio deseado durante la noche. Los defectos tales como baja
experiencia, limitaciones del proceso actual o niveles de personal inadecuados pueden evitar que
la organización alcance los estándares u objetivos deseados, aun luego de los pasos previos del
análisis del servicio. No existe un método preciso para coincidir exactamente el nivel de servicio
requerido con los objetivos deseados. Para acomodar para esto, la organización debe medir los
estándares del servicio y medir los parámetros de servicio usados para soportar los estándares
del servicio. Cuando la organización no está resolviendo los objetivos del servicio, debe entonces
mirar para mantener la métrica para ayudar a entender el problema. En muchos casos, los
aumentos de presupuesto se pueden hacer para mejorar los servicios del soporte y para llevar a
cabo mejoras necesarias alcanzar las metas del servicio deseado. Con el transcurso del tiempo la
organización puede realizar varios ajustes, tanto a los objetivos de los servicios como a la
definición de los servicios, a fin de alinear los servicios de red y los requisitos comerciales.
Por ejemplo, una organización pudo alcanzar el 99 por ciento de Disponibilidad cuando la meta
era mucho más alta en el 99.9 por ciento de Disponibilidad. Al observar el servicio y las
mediciones de soporte, los representantes de la organización encontraron que el reemplazo de
hardware llevó aproximadamente 24 horas, mucho más que el tiempo estimado originalmente ya
que la organización había presupuestado únicamente cuatro. Además, la organización encontró
que las capacidades de administración proactiva eran ignoradas y abajo los dispositivos de la Red
redundante no eran reparados. También encontraron que no tenían los personales para llevar a
cabo mejoras. Como consecuencia, después de considerar que bajaba los objetivos del servicio
actuales, la organización presupuestada para los recursos adicionales necesitó alcanzar el nivel
del servicio deseado.
Las definiciones de servicio deben incluir las definiciones y las definiciones proactivas del soporte
reactivo. Las definiciones reactivas definen cómo la organización reaccionará a los problemas
después de que se hayan identificado de la queja del usuario o de las capacidades de
administración de red. Las definiciones proactivas describen cómo la organización identificará y
resolverá los problemas de la red potencial, incluyendo la reparación de los componentes de la
red “espera” quebrados, detección de error, y los umbrales de capacidad y las actualizaciones.
Las siguientes secciones proporcionan información sobre las definiciones de nivel de servicio
reactivo y proactivo.
Las siguientes áreas de nivel de servicio se miden generalmente utilizando estadísticas de una
base datos del mostrador de informaciones y de auditorías periódicas. Esta tabla muestra un
ejemplo de gravedad de problema para una organización. Note que la carta no incluye cómo
manejar los pedidos el nuevo servicio, que se puede manejar por SLA o un perfil de aplicación y
un análisis adicionales del qué si del funcionamiento. Típicamente, la gravedad 5 podría ser una
solicitud de un nuevo servicio en caso de darle tratamiento por medio del mismo proceso de
soporte.
Graved Graved
Gravedad 2 Gravedad 3
ad 1 ad 4
Una
Sitio
Alto impacto Una cierta interrog
WAN
comercial con la funcionalidad ación o
crítico
pérdida o la de la red un
severo
degradación, LAN de específica se incident
del
oficina central en el pierde o se e
usuario
lugar de la solución degrada, por funcion
de LAN
alternativa posible ejemplo la al que
o del
abajo; 5-99 usuarios redundancia no
segmen
afectaron al impacto LAN afectada tienen
to del
PÁLIDO funcionamiento ningún
servidor
internacional del del LAN de impacto
del
rendimiento crítico oficina central comerci
impacto
del sitio del sitio del de la pérdida al para
comerci
WAN local abajo de redundancia la
al abajo
abajo perdida organiz
abajo
ación
Cuando se ha definido la gravedad del problema, defina o investigue el proceso de apoyo para
crear definiciones de respuesta del servicio. Las definiciones de respuesta del servicio requieren
generalmente una estructura del soporte por niveles juntada con un sistema de soporte del
software del escritorio de ayuda para seguir los problemas vía los ticketes de problemas. La
métrica debe también estar disponible en el tiempo de respuesta y el tiempo de resolución para
cada prioridad, el número de llamadas por la prioridad, y la respuesta/la calidad de resolución.
Para definir el proceso de soporte, es útil definir los objetivos de cada nivel de soporte en la
organización y sus roles y responsabilidades. Esto ayuda a los requerimientos de recursos de
comprensión de la organización y a los niveles de conocimiento para cada nivel de soporte. La
siguiente tabla brinda un ejemplo de una organización de soporte por niveles con pautas para la
solución de problemas.
Niv
el
de
Responsabilidad Metas
sop
ort
e
So Las llamadas al servicio técnico a tiempo Resoluc
por ión del
completo de la respuesta del soporte del
te 40% de
escritorio de ayuda, los ticketes de
de las
problemas del lugar, trabajo sobre el
la llamada
problema hasta 15 minutos, boleto del
gra s
documento y se extienden para apropiarse
da entrante
del soporte de la grada 2
1 s
Resoluc
So Haga cola la supervisión, Administración
ión del
por de redes, los ticketes de problemas del
100%
te lugar de la supervisión de la estación por
de las
de problemas identificados del software
llamada
la implementan las llamadas de la toma de la
s en el
gra grada 1, vendedor, y la escalada de la
nivel de
da grada 3 asume la propiedad de la llamada
la grada
2 hasta la resolución
2
Ninguna
So
Debe proporcionar el soporte inmediato a propied
por
la grada 2 para todos los problemas de la ad
te
prioridad 1 acuerdan ayudar con todos los directa
del
problemas sin resolver por la grada 2 del
niv
dentro del periodo de resolución SLA problem
el 3
a
Además de la resolución de la respuesta del servicio y del servicio, construya una matriz para
escalada. Las ayudas de la Matriz de escalada se aseguran de que los recursos disponibles estén
centrados en los problemas que afectan seriamente al servicio. Generalmente cuando los
analistas se centran en los problemas de la fijación, se centran raramente en traer a los recursos
adicionales adentro en el problema. Definición cuando los recursos adicionales deben ser ayudas
notificadas para promover el conocimiento del problema en Administración y pueden ayudar
generalmente a llevar a dinámico futuro o a las medidas preventivas. Vea la tabla siguiente:
Tiemp
o Graveda Graved Graved
Gravedad 2
transc d 1 ad 3 ad 4
urrido
Administr
ador de
las
operacio
nes de la
red,
5
soporte
minuto
de la
s
grada 3,
director
de
intercone
xiones de
red
Actualiza
r al
administr
ador de
operacio Actualizar al
nes de administrador de
red, operaciones de
1 hora soporte red, soporte de
de nivel nivel 3, director de
3, interconexiones
director de red
de
intercone
xiones de
red
Extiénda
se al VP,
actualiza
ción al
2
director,
horas
administr
ador de
operacio
nes
El
análisis
de la
causa
raíz no
resuelto
que se
efectuó a
Extiéndase al VP,
VP,
actualización al
4 director,
director,
horas administr
administrador de
ador de
operaciones
operacio
nes y
soporte
de nivel 3
requiere
notificaci
ón de
CEO
Adminis
trador
24 de las
horas operaci
ones de
la red
Adminis
trador
de las
5 días
operaci
ones de
la red
Hasta ahora, las definiciones de nivel de servicio se centraron en cómo la organización de soporte
de las operaciones reacciona ante los problemas una vez que se identifican. Durante años, las
organizaciones de operaciones han creado planes de soporte operacional con información similar
a la mencionada anteriormente. Sin embargo, cuál falta en estos casos es cómo la organización
identificará los problemas y qué problemas identificarán. Organizaciones de la red más
sofisticadas han intentado resolver este problema simplemente creando las metas para el
porcentaje de problemas que dinámico se identifican, en comparación con problemas
reactivamente identificado por el informe de problema o la denuncia del usuario.
La siguiente tabla muestra cómo una organización puede desear evaluar las capacidades de
soporte proactivo y el soporte proactivo en general.
Una más amplia metodología para crear las definiciones de nivel de servicio incluye más detalle
en cómo se monitorea la red y cómo la organización de operaciones reacciona a los umbrales de
la estación de administración de la red definida (NMS) sobre las 7 x 24 bases. Esto puede parecer
una tarea imposible debido al elevado número de variables de Base de información para
administración (MIB) y la cantidad de información de administración de la red disponible
pertinente para la integridad de la misma. Podía también ser extremadamente costoso y uso
intensivo de recurso. Desafortunadamente, estas objeciones evitan, en muchos casos, que se
implemente una definición de servicio proactivo que, por naturaleza, debe ser simple, bastante
fácil de seguir y aplicable sólo a los mayores riesgos de disponibilidad o rendimiento de la red. Si
una organización entonces considera el valor en las definiciones de servicio proactivo básicas,
más variables se pueden agregar en un cierto plazo sin el impacto significativo, mientras usted
implemente un acercamiento organizado.
Incluya la primera área de las definiciones de servicio proactivo en todos los planes de soporte de
las operaciones. De la definición de servicio los estados simplemente cómo el grupo de
operaciones dinámico identificará y responderá a la red o conectará abajo de las condiciones en
diversas áreas de la red. Sin esta definición (o soporte de administración), la organización puede
esperar soporte variable, expectativas de usuarios irreales y, en última instancia, una
disponibilidad de red menor.
La siguiente tabla muestra cómo una organización puede crear una definición de servicio para
condiciones de link/dispositivo fuera de funcionamiento. El ejemplo muestra una organización
empresarial que quizás tenga diferentes requerimientos de notificaciones y de respuestas según
el momento del día y el área de la red.
Dispos
Métod
itivo 7 x 24 resolu
o de notificació Resolución
de red notifica ción 5
detecc n 5 x 8 7 x 24
o link ción x8
ión
abajo
El Analist Prioridades
El NOC localiz a LAN
Dispos 3 y de las
crea el ador asigna
itivo prioridades
ticket de de do en
SNMP 1y2
problema tareas el
LAN y resolución e
s, de plazo
del consul investigació
localizado LAN de 15
núcleo ta de n inmediata
r de de la minuto
links, cola 4 para
tareas de Página s por
tramp la
LAN de la autom el
as resolución
página ática, NOC, posterior
person
a de
tareas
repara
de
ción
LAN
según
crea el
la
ticket
definic
de
ión de
proble
respu
mas
esta
para la
del
cola
servici
del
o
LAN
del
núcleo
El
localiz
ador
de Analist
tareas a de
de WAN
WAN asigna
de la do en Prioridades
El NOC
Dispos Página 15 3 y de las
crea el
itivo autom minuto prioridades
ticket de
SNMP ática, s por 1y2
problema
y person NOC, resolución e
WAN s, llamar
consul a de repara investigació
local al
ta de tareas ción n inmediata
radiolocali
links, de como cola 4 para
zador de
tramp WAN definic la
WAN en
as crea el ión de resolución
servicio
ticket respu posterior
de esta
proble por
mas servici
para la o.
cola
PÁLID
A
El Analist Prioridades
El NOC localiz a 1y2
Dispos
crea el ador asocia resolución e
itivo
ticket de de do investigació
SNMP
problema tareas asigna n inmediata;
y
Extran s, del do Las
consul
et localizado partner dentro prioridades
ta de
r de de la de los 3y4
links,
tareas del Página 15 quedan
tramp
partner de autom minuto pendientes
as
página ática, s por para
person
a del
deber NOC,
del repara
partner ción
crea el según
ticket definic resolverse
de ión de luego
proble repue
mas sta del
para la servici
cola o
del
partner
Las definiciones de nivel de servicio proactivo restantes se pueden dividir en dos categorías:
Errores de red y capacidad/problemas de rendimiento. Sólo un pequeño porcentaje de las
organizaciones de red poseen definiciones de nivel de servicio en éstas áreas. Como
consecuencia, estos problemas se ignoran o se manejan esporádico. Esto puede ser adecuado
para algunos entornos de red, pero los entornos con alta disponibilidad necesitan generalmente
una administración de servicio uniforme y proactiva.
Las organizaciones de interconexión de redes tienden a luchar con las definiciones de servicio
proactivo por varias razones. Esto se debe principalmente a que no realizaron un análisis de
requisitos con respecto a definiciones de servicio proactivo en base a riesgos de disponibilidad,
presupuesto de disponibilidad y problemas de aplicación. Esto lleva a los requisitos no
entendibles para las definiciones de servicio proactivo y a las ventajas no entendibles,
especialmente porque los recursos adicionales pueden ser necesarios.
La primera categoría de definiciones de nivel de servicio proactivo es errores de red. Los Errores
de red se pueden subdividir más a fondo en los errores del sistema que incluyen los errores del
software o los Errores de hardware, los errores del protocolo, los errores de control de medios, los
errores de precisión, y las advertencias ambientales. Desarrollar una definición de nivel de
servicio comienza con un conocimiento general de cómo estos problemas serán detectados, de
los cuales los mirarán, y qué sucederán cuando ocurren. Agregue los mensajes o los problemas
específicos a la definición de nivel de servicio si se presenta la necesidad. Es posible que también
sea necesario trabajar en las siguientes áreas para garantizar el éxito:
s.
Categorí
Método de Acción
a de Umbral
detección realizada
error
Estudio diario Cualquier Revise el
Errores de los ocurrencia problema, cree
de mensajes de para un ticket con el
software Syslog prioridad 0, inconveniente y
(caídas usando el 1, y 2 sobre envíelo si
forzadas visor de 100 vuelve a ocurrir
por el Syslog hecho acontecimien o si el problema
software) por el soporte tos del nivel requiere
de la grada 2 3 o arriba atención
Errores Estudio diario Cualquier Revise el
de de los ocurrencia problema, cree
hardwar mensajes de para un ticket con el
e Syslog prioridad 0, inconveniente y
(caídas usando el 1, y 2 sobre envíelo si
forzadas visor de 100 vuelve a ocurrir
por el Syslog hecho acontecimien o si el problema
hardwar por el soporte tos del nivel requiere
e) de la grada 2 3 o arriba atención
Estudio diario Diez Revise el
Errores
de los mensajes por problema, cree
del
mensajes de el día de las un ticket con el
protocol
Syslog prioridades 0, inconveniente y
o (IP
usando el 1, y 2 sobre envíelo si
Routing
visor de 100 vuelve a ocurrir
Protocol
Syslog hecho acontecimien o si el problema
solament
por el soporte tos del nivel requiere
e)
de la grada 2 3 o arriba atención
Errores Estudio diario Diez Revise el
de de los mensajes por problema, cree
control mensajes de el día de las un ticket con el
de Syslog prioridades 0, inconveniente y
medios usando el 1, y 2 sobre envíelo si
(FDDI, visor de 100 vuelve a ocurrir
POS, y Syslog hecho acontecimien o si el problema
fast
ethernet por el soporte tos del nivel requiere
solament de la grada 2 3 o arriba atención
e)
Estudio diario
de los
Mensaje
mensajes de Cree el ticket de
s del
Syslog problemas y el
entorno Cualquier
usando el envío para los
(poder y mensaje
visor de nuevos
temporer
Syslog hecho problemas
os)
por el soporte
de la grada 2
Consulta Errores de
Errores
SNMP en entrada o Cree el ticket de
de
cinco minutos salida un problemas para
precisión
los eventos error en los nuevos
(errores
de umbral de cinco problemas y
de
los intervalos minutos el envío al soporte
entrada
recibidos por intervalo en de la grada 2
del link)
el NOC cualquier link
Las otras definiciones de nivel de la categoría del servicio proactivo se aplican al funcionamiento y
a la capacidad. La verdadera administración de capacidad y rendimiento incluye la administración
de excepciones, el establecimiento de líneas de base y tendencia y el análisis de ¿qué pasa si…?
La definición de nivel de servicio define simplemente los umbrales del funcionamiento y del
umbral de excepción de capacidad y medios que iniciarán la investigación o la actualización.
Estos umbrales pueden utilizarse con los tres procesos de gestión de rendimiento y capacidad de
alguna manera.
Como los Errores de red, desarrollar una definición de nivel de servicio para la capacidad y el
funcionamiento comienza con un conocimiento general de cómo estos problemas serán
detectados, de los cuales los mirarán, y qué sucederán cuando ocurren. Puede agregar
definiciones de eventos específicas a la definición del nivel de servicio en caso de necesitarlo. Es
posible que también sea necesario trabajar en las siguientes áreas para garantizar el éxito:
Área
de Método de
Umbral Acción realizada
red/me detección
dia
Estruct
Consulta utilización
ura Notificación por
SNMP en del 50% en
básica correo electrónico
cinco minutos cinco
y links al grupo del email
los desvíos de minutos la
de del funcionamiento
la excepción utilización
distribu alias para evaluar
de los de los
ción la actualización del
intervalos intervalos el
del requisito de QoS o
RMON en la 90% vía el
LAN del plan por
base y los desvío de
de problemas
links de la
oficina recurrentes
distribución excepción
central
Notificación por
correo electrónico
75 % de al grupo del email
Links Consultas utilización del funcionamiento
del SNMP en en alias para evaluar
WAN intervalos de intervalos la actualización del
local 5 minutos de 5 requisito de QoS o
minutos del plan por
problemas
recurrentes
Notificación por
correo electrónico
Links al grupo del email
utilización
de Consultas del funcionamiento
del 60% en
WAN SNMP en alias para evaluar
cinco
del intervalos de la actualización del
minutos los
extran 5 minutos requisito de QoS o
intervalos
et del plan por
problemas
recurrentes
La tabla siguiente define las definiciones de nivel de servicio para la capacidad del dispositivo y
los umbrales de rendimiento. Asegúrese que usted cree los umbrales que son significativos y
útiles en la prevención de los problemas de red o de los temas de disponibilidad. Esta es un área
muy importante porque los problemas de recursos de plano de control de dispositivos no
verificados pueden tener un grave impacto en la red.
La
notificación
por correo
electrónico
al grupo del
email del
Consult funcionamie
CPU en el 75%
a nto y de la
durante cinco
SNMP capacidad
minutos los
en la alias para
intervalos, el 99%
CPU, notifica resolver los
vía la memoria de
mem ción de problemas o
Cisco la notificación de
oria, RMON la
7500 RMON en el 50%
buffe de los actualizació
durante cinco
rs interval n RMON
minutos los
os -5- CPU del
buffers de los
minute plan en el
intervalos en la
para el 99%, el
utilización del 99%
CPU ticket de
problemas y
la grada 2
del lugar de
la página
soporta el
paginador
Notificación
por correo
electrónico
Consult CPU en el 75% al grupo del
as durante cinco email del
SNMP minutos la funcionamie
CPU,
Cisco en memoria de los nto y de la
mem
2600 interval intervalos en el capacidad
oria
os de 5 50% durante cinco alias para
minuto minutos los resolver los
s intervalos problemas o
la
actualizació
n del plan
Utiliz Consult Notificación
ación as Backplane en la por correo
Cataly de SNMP memoria de la electrónico
st back en utilización del 50% al grupo del
5000 plane interval en la utilización email del
, os de 5 del 75% funcionamie
mem minuto nto y de la
capacidad
alias para
resolver los
oria s problemas o
la
actualizació
n del plan
Notificación
por correo
electrónico
Consult al grupo del
Switch as email del
CPU en la
ATM SNMP funcionamie
CPU, memoria de la
de en nto y de la
mem utilización del 65%
LightSt interval capacidad
oria en la utilización
ream® os de 5 alias para
del 50%
1010 minuto resolver los
s problemas o
la
actualizació
n del plan
Área
de
Método de
red/ Umbral Acción realizada
medición
medi
a
Notificación por
correo electrónico
tiempo de
Ningunos al grupo del email
LAN respuesta de
ningún del
de viaje de ida y
problema funcionamiento y
ofici vuelta de 10
contaban con de la capacidad
na milisegundos
difícil medir la alias para
cent o menos en
infraestructura resolver la
ral todo
LAN entera actualización del
momento
problema o del
plan
Link Medición actual tiempo de Notificación por
s del del SF al NY y respuesta de correo electrónico
WA del SF a ida y vuelta al grupo del email
del
Chicago 75-
funcionamiento
solamente millisecond
alias para evaluar
usando el eco hecho un
N la actualización
ICMP del promedio
local del requisito de
Internet durante cinco
QoS o del plan
Performance minutos el
por problemas
Monitor (IPM) período
recurrentes
Notificación por
tiempo de
correo electrónico
respuesta de
de al grupo del email
Medición actual ida y vuelta
San del
de San 250-
Fran funcionamiento
Francisco a millisecond
cisc alias para evaluar
Bruselas hecho un
oa la actualización
usando el IPM y promedio
Toky del requisito de
el eco ICMP durante cinco
o QoS o del plan
minutos el
por problemas
período
recurrentes
Notificación por
tiempo de
correo electrónico
respuesta de
al grupo del email
San Medición actual ida y vuelta
del
Fran de San 175-
funcionamiento
cisc Francisco a millisecond
alias para evaluar
o a Bruselas hecho un
la actualización
Brus usando el IPM y promedio
del requisito de
elas el eco ICMP durante cinco
QoS o del plan
minutos el
por problemas
período
recurrentes
El área final para las definiciones de nivel de servicio es para el rendimiento de las aplicaciones.
Las definiciones de nivel de servicio del rendimiento de la aplicación son creadas normalmente
por la aplicación o el grupo de administración de servidores porque el funcionamiento y la
capacidad de los servidores ellos mismos es probablemente el factor más grande del rendimiento
de la aplicación. Las organizaciones de interconexión de redes pueden realizar la enorme ventaja
creando las definiciones de nivel de servicio para el funcionamiento de la aplicación de red
porque:
● la medición y las definiciones del nivel de servicio pueden ayudar a eliminar conflictos entre
grupos.
● las definiciones de los niveles de servicio para las aplicaciones individuales son importantes
si la calidad de servicio (QoS) está configurada para las aplicaciones principales y el resto del
tráfico se considera opcional.
Si usted elige crear y rendimiento de la aplicación de la medida, es probablemente el mejor si
usted no mide el funcionamiento al servidor sí mismo. Esto, entonces, nos ayuda a distinguir entre
problemas de red y aplicaciones y problemas de servidores. Use sondas o el software agente de
disponibilidad del sistema que se ejecuta en los routers de Cisco y el IPM de Cisco que controla el
tipo de paquete y la frecuencia de medición.
La tabla siguiente muestra una definición de nivel de servicios simple para el rendimiento de la
aplicación.
Aplicació Método de
Umbral Acción realizada
n medición
Puerto tiempo de Notificación por
Bruselas a San
TCP 1529 respuesta correo
Francisco
Bruselas de ida y electrónico al
usando el
del vuelta grupo del email
gateway de
aplicacion 175- del
Bruselas de
de millisecon funcionamiento
medición del
planificaci d hecho alias para
rendimiento de
ón de un evaluar la
ida y vuelta del
recursos promedio actualización del
puerto 1529
para durante problema o del
IPM al
empresas cinco plan por
gateway SFO
(ERP) al minutos el problemas
2
SF período recurrentes
tiempo de Notificación por
Bruselas a San
respuesta correo
Francisco
de ida y electrónico al
usando el
Puerto vuelta grupo del email
gateway de
TCP 1529 200- del
Bruselas de
Tokio de millisecon funcionamiento
medición del
la d hecho alias para
rendimiento de
aplicación un evaluar la
ida y vuelta del
ERP al promedio actualización del
puerto 1529
SF durante problema o del
IPM al
cinco plan por
gateway SFO
minutos el problemas
2
período recurrentes
tiempo de Notificación por
Sydney a San
respuesta correo
Francisco
Puerto de ida y electrónico al
usando el
TCP 1702 vuelta grupo del email
gateway
Sydney 250- del
Sydney de
de la millisecon funcionamiento
medición del
aplicación d hecho alias para
rendimiento de
de un evaluar la
ida y vuelta del
soporte promedio actualización del
puerto 1702
de cliente durante problema o del
IPM al
al SF cinco plan por
gateway SFO
minutos el problemas
1
período recurrentes
por sí solas, las definiciones de nivel de servicio no son útiles a menos que la organización
recopile las medidas y monitoree el éxito. En crear una definición de nivel de servicio crítica,
defina cómo el nivel de servicio será medido y señalado. La medición del nivel de servicio
determina si la organización está logrando los objetivos y también identifica la causa raíz de la
Disponibilidad o de los problemas de rendimiento. También considere la meta al elegir un método
para medir la definición de nivel de servicio. Vea creando y mantener los SLA para más
información.
Los niveles del servicio de supervisión exigen el conducir de una reunión de la revisión periódica,
normalmente cada mes, para discutir el servicio periódico. Discuta toda la métrica y si ella se
ajusta a los objetivos. Si no conforman, determine la causa raíz del problema y implemente las
mejoras. Debería también cubrir el progreso y las iniciativas actuales para mejorar situaciones
individuales.
Las definiciones de nivel de servicio son un excelente componente esencial ya que ayudan a
crear una calidad de servicio uniforme en toda la organización y facilitan la optimización de la
disponibilidad. El siguiente paso es los SLA, que son una mejora porque alinean los objetivos
comerciales y los requisitos de costo de mantener directamente la calidad. SLA bien-construido
entonces sirve como modelo para la eficacia, calidad, y sinergia entre la comunidad del usuario y
el grupo de soporte manteniendo los procesos claros y los procedimientos para los problemas de
red o los problemas.
● Los SLA establecen responsabilidad de dos partes para los servicios, lo que significa que los
usuarios y los grupos de aplicación también son contables para el servicio de la red. Si no
ayudan a crear SLA para un servicio específico y a comunicar el impacto comercial con el
grupo de red, después pueden realmente ser responsables del problema.
● Los SLA determinan las herramientas estándar y los recursos necesarios para satisfacer los
requisitos comerciales. Decidiendo a cuánta gente y qué herramientas utilizar sin los SLA es
a menudo una conjetura presupuestaria. El servicio puede estar sobrediseñado, lo cual deriva
en gastos excesivos; o bien, subdiseñado que resulta en objetivos comerciales no
alcanzados. El ajuste de los SLA ayuda a alcanzar el nivel óptimo equilibrado.
● El SLA documentado crea un método más claro para configurar las expectativas del nivel de
servicio.
Recomendamos los siguientes pasos para formar SLA una vez que se han creado definiciones de
nivel de servicio: Recomendamos los siguientes pasos para formar SLA una vez que se han
creado definiciones de nivel de servicio:
Los expertos en el desarrollo del SLA TIC identificaron tres requisitos previos a SLA acertado.
Desafortunadamente, las organizaciones que no alcanzan estos objetivos pueden esperar
problemas con el proceso SLA y deberán considerar los problemas potenciales involucrados en el
proceso SLA. El no poder implementar los SLA no es perjudicial si la organización de
interconexión de redes puede construir las definiciones de nivel de servicio que cumplen los
requisitos comerciales generales. Los siguientes son requisitos previos para el proceso de SLA:
● Su negocio debe contar con una cultura orientada al servicio.La organización debe poner las
necesidades de los clientes en primer lugar. Necesita un compromiso de prioridad verticalista
con el servicio, con lo que se obtiene una comprensión completa de las necesidades y
percepciones del cliente. Encuestas de satisfacción del cliente de la conducta e iniciativas
adaptadas a las necesidades del clien del servicio.Otro indicador del servicio puede ser que
la satisfacción del servicio o del soporte de estados de la organización como objetivo
corporativo. Esto no es poco común debido a que ahora, las organizaciones de IT están
críticamente relacionadas al éxito general de las organizaciones.La cultura de servicio es
importante porque el proceso SLA se trata principalmente de realizar mejoras según las
necesidades y los requerimientos del negocio del cliente. Si organizaciones no han están
hechos esto en el pasado, encontrarán el proceso de SLA difícil.
● El cliente/las iniciativas de negocios debe conducir todas las actividades TIC.La visión de la
compañía o los enunciados de la misión deben estar alineados con las iniciativas del cliente y
del negocio que luego conducen a todas las actividad de IT, incluyendo los SLA. Con mucha
frecuencia, una red es colocada en un lugar para alcanzar un objetivo en particular aunque el
grupo de conexión en red pierde de vista ese objetivo y los posteriores requisitos
comerciales. En estos casos, un presupuesto del conjunto se afecta un aparato a la red, que
puede reaccionar exageradamente a las necesidades actuales o subestima grueso el
requisito, dando por resultado el error.Cuando las iniciativas comerciales/de clientes se
alinean con las actividades de informática, la organización de la red puede estar en sintonía
con los desarrollos, nuevos servicios y otros requerimientos comerciales más fácilmente. La
relación y las metas comunes generales de cumplir con los objetivos corporativos están
presentes y todos los grupos funcionan como un equipo.
● Usted debe confiar al proceso de SLA y al contrato.El primer allí debe ser consolidación para
aprender el proceso de SLA para desarrollar los acuerdos efectivos. En segundo lugar, debe
cumplir con los requisitos de servicio del contrato. No espere crear los SLA potentes sin la
entrada y la consolidación significativas de todos los individuos implicados. Esta
consolidación debe también venir de la Administración y de todos los individuos asociados al
proceso de SLA.
Los SLA de redes del nivel empresarial dependen pesadamente de los elementos de redes, los
elementos de la administración de servidores, soporte del servicio de ayuda, los elementos de la
aplicación, y negocio o los requisitos del usuario. La Administración de la cada área estará
implicada normalmente en el proceso de SLA. Este escenario funciona bien cuando la
organización construye SLA de soporte reactivos básicos. Las organizaciones corporativas con
los requisitos de mayor disponibilidad pueden necesitar la asistencia técnica durante el proceso
de SLA de ayudar con los problemas tales como el presupuesto de disponibilidad, las limitaciones
de rendimiento, el perfil de aplicación, o las capacidades de administración proactiva. Para más
aspectos SLA de la administración proactiva, recomendamos a un equipo técnico de arquitectos
de la red y de arquitectos de aplicación. La asistencia técnica puede ofrecer información mucho
más aproximada sobre la disponibilidad y las capacidades de rendimiento de la red y lo que se
necesitaría para lograr objetivos específicos.
El proveedor de servicio SLA no incluye normalmente la entrada de usuario porque se crean con
el único propósito de ganar una ventaja competitiva en otros proveedores de servicio. En algunos
casos, la administración superior creará estos SLA en los niveles muy de gran disponibilidad o de
alto rendimiento para promover su servicio y para proporcionar las metas internas para los
empleados internos. Los proveedores de servicios se concentrarán en los aspectos técnicos de
disponibilidad de mejoras mediante la creación de definiciones de niveles de servicios fuertes que
son medidos y administrados internamente. En otros casos, ambos esfuerzos ocurren
simultáneamente pero no no necesariamente juntos o con las mismas metas.
Elegir los partidos implicados en SLA se debe entonces basar en las metas de SLA. Algunos
objetivos posibles son:
Comúnmente, el servicio primario/soporte de los SLA tendrá muchos componentes, los cuales
incluyen el nivel de soporte, la forma en la que será medido, el trayecto de escalación para la
reconciliación de SLA y las preocupaciones relacionadas con el presupuesto general. Los
elementos de servicio para entornos de alta disponibilidad deben incluir definiciones de servicios
proactivos, así como objetivos reactivos. Los detalles adicionales incluyen el siguiente:
Note: La estructura de soporte, el trayecto de escalada, los procedimientos del servicio de ayuda,
la medida, y las definiciones de las prioridades deben seguir siendo en gran parte lo mismo para
mantener y para mejorar una cultura del servicio coherente.
Solució
Platino Oro Plata
n
Routers Ninguna
Router redundante
redundante redundan
Disposit para realizar copias de
s para cia del
ivos seguridad en el sitio
conectivida dispositiv
central
d WAN o
Conectivid
ad Ninguna
Conectividad T1 con el
redundante redundan
WAN backup de Frame
T1, cia de
Relay
portadoras WAN
múltiples
Requeri T1 NON-carga que
mientos redundante comparte, backup de
de con Frame Relay para las
ancho distribución aplicaciones críticas Hasta T1
de de carga solamente; Frame
banda y para Relay 64K CIR
explosió ráfaga. solamente
n
Tiempo de Ms del
respuesta tiempo de
de ida y Tiempo de respuesta respuesta
Rendimi
vuelta 100 ms o un 99.9% 100 o el
ento
constante menos esperado. 99%
100-ms o menos
menos previsto
Requeri
miento
de 99.99% 99.95% 99.9%
disponi
bilidad
Priorida Prioridad 1:
Prioridad
d del el servicio
3:
escritori de Prioridad 2: el servicio
conectivid
o de importanci de impacto comercial
ad
ayuda a comercial está fuera de servicio
comercial
cuando no
abajo
abajo funciona
Paso 10: Información sobre las Necesidades y los Objetivos Corporativos del Cliente
Este paso le otorga al desarrollador de SLA gran credibilidad. Entendiendo las necesidades de los
diversos grupos empresariales, el documento inicial de SLA será mucho más cercano al requisito
comercial y al resultado deseado. Intente entender el costo de tiempo de inactividad para el
servicio de cliente. Estimación en términos de productividad perdida, ingresos, y fondo de
comercio del cliente. Tenga presente que incluso las conexiones simples con algunas personas
pueden afectar seriamente los ingresos. En este caso, esté seguro de ayudar al cliente a
entender la Disponibilidad y los riesgos de rendimiento que pueden ocurrir de modo que la
organización entienda mejor el nivel de servicio que necesita. Si usted falta este paso, usted
puede conseguir a muchos clientes que exigen simplemente la Disponibilidad 100-percent.
El desarrollador SLA también debería entender los objetivos del negocio y el crecimiento de la
organización para alojar actualizaciones de red, la carga de trabajo y el presupuesto. Es también
útil entender las aplicaciones que serán utilizadas. Esperanzadamente la organización tiene
perfiles de aplicación en cada aplicación, pero si no, considere hacer una evaluación técnica de la
aplicación para determinar los problemas relacionados con la red.
Prioridad
Costo de de Requisito
Unidad tiempo de problema de
Aplicaciones
comercial inactivida s cuando Servidor/
d desciend Red
e
Redunda
Fabricaci
ERP Alto 1 ncia más
ón
alta
Redunda
Soporte Atención al
Alto 1 ncia más
de cliente cliente
alta
Servidor de Redunda
archivos, ncia del
El dirigir Medio 2
diseño de núcleo
ASIC LAN
Redunda
Comercia Servidor de ncia del
Medio 2
lización archivos núcleo
LAN
El formato del SLA puede variar según los deseos del grupo o los requisitos de la organización.
Lo que sigue es un ejemplo recomendado delinea para el SLA de red:
El siguiente paso es identificar a los participantes en el grupo de trabajo SLA, incluido el líder del
grupo. El grupo de trabajo puede incluir a usuarios y administradores de unidades comerciales,
grupos funcionales o representantes de una base geográfica. Estos individuos comunican los
problemas de SLA a sus respectivos grupos de trabajo. Los administradores y los responsables
que pueden estar de acuerdo con los elementos dominantes de SLA deben participar. Estos
individuos puede incluir individuos administradores así como técnicos que pueden ayudar a definir
problemas técnicos relacionados con SLA y tomar decisiones a nivel de IT (es decir,
administrador del escritorio de ayuda, administrador de operaciones del servidor, administradores
de aplicaciones y administrador de operaciones de la red).
El grupo de trabajo debería crear un estatuto de grupo de trabajo al comienzo. El informe debe
mostrar los objetivos, las iniciativas y las tramas de tiempo para SLA. El grupo debe desarrollar
los planes específicos de la tarea y determinar después los programas y los calendarios para
desarrollar y implementar el SLA. El grupo debe también desarrollar el proceso de la información
para medir el Nivel de soporte contra los criterios del soporte. El último paso está creando el
acuerdo de SLA del proyecto.
El grupo de trabajo en red SLA debería reunirse una vez por semana para desarrollar el SLA.
Después de que se haya creado y se haya aprobado SLA, el grupo puede resolver la publicación
mensual o aún trimestralmente para las actualizaciones de SLA.
El último paso para crear el SLA es la negociación final y la firma. Este paso incluye:
La conformidad de SLA y los resultados de medición el señalar son los aspectos importantes del
proceso de SLA que ayudan a asegurar la coherencia a largo plazo y los resultados.
Recomendamos generalmente que cualquier componente importante de SLA sea mensurable y
que una metodología de medición esté establecida antes de la implementación del SLA. Después
celebre a las reuniones mensuales entre el usuario y los grupos de soporte para revisar las
medidas, identifique las causas raíz del problema, y proponga las soluciones para cumplir o para
exceder el requisito de nivel de servicio. Esto ayuda a hacer el proceso de SLA similar a cualquier
programa de mejora de la calidad moderno.
Por ejemplo, considere el escenario real siguiente. La compañía X conseguía las denuncias de
los numerosos usuarios que la red fuera con frecuencia abajo por los períodos ampliados.
Midiendo la Disponibilidad, la compañía encontró el problema principal para ser algunos sitios
PÁLIDOS. La investigación más detallada de esas vistas reveló que la mayor parte de los
problemas estaban en algunos sitios PÁLIDOS. La causa raíz fue encontrada y la organización
resolvió el problema. Luego, la organización estableció objetivos de nivel de servicio para la
disponibilidad y celebró acuerdos con grupos de usuarios. Problemas identificados de las
mediciones futuras rápidamente debido a la inconformidad a SLA. Entonces vieron al grupo de
interconexión de redes como teniendo el mayor profesionalismo, la experiencia, y un recurso
general a la organización. El grupo se movió efectivamente de reactivo a proactivo en naturaleza
y la línea inferior de la compañía colaboró en esto.
Utilice los siguientes indicadores de rendimiento de SLA para determinar el éxito del proceso de
administración de niveles de servicio:
Los objetivos secundarios son importantes porque ayudan a definir cómo se alcanzarán los
niveles de disponibilidad o rendimiento. Por ejemplo, si la organización tiene la disponibilidad
agresiva y objetivos de rendimiento, será importante evitar que los problemas ocurran y reparar
los problemas rápidamente cuando ocurren. Los objetivos secundarios ayudan a definir los
procesos necesarios para alcanzar la Disponibilidad y los niveles de rendimiento deseados.
Los objetivos secundarios reactivos incluyen:
El objetivo
La definición del servicio para objetivos secundarios proactivos, define cómo la organización
proporciona soporte proactivo, incluyendo las condiciones de identificación de caída de la red, del
link o de los dispositivos, las condiciones de error de la red y los umbrales de capacidad de la red.
Fije las metas que promueven la administración proactiva porque las ayudas de la administración
proactiva de la calidad eliminan los problemas y las ayudas reparan los problemas más
rápidamente. Generalmente se logra esto fijando un objetivo de la cantidad de casos proactivos
creados y resueltos sin notificación del usuario. Muchas organizaciones configuran un indicador
en el software del escritorio de ayuda para identificar los casos proactivos contra el para este
propósito de los casos reactivos. El documento de nivel del servicio debería contener también
información sobre la forma en que se medirá el objetivo, las partes responsables de la medición y
los procesos de no conformidad.
Siempre recomendamos que toda meta definida de nivel de servicio sea cuantificable, de manera
tal que la organización pueda medir los niveles de servicio, identificar los problemas de causas
raíz del servicio que dificultan la meta principal de disponibilidad y desempeño y efectuar mejoras
dirigidas a objetivos específicos. A nivel general, las mediciones son sólo una herramienta que
permite a los administradores de la red gestionar la coherencia en el nivel de los servicios y hacer
mejoras de acuerdo a los requerimientos comerciales.
El otro método exitoso para calcular la disponibilidad es utilizar tickets de problema y una
medición denominada minutos de usuarios impactados (IUM). Este método tabula la cantidad de
usuarios que han sido afectados por una interrupción y lo multiplica por la cantidad de minutos de
la interrupción. Cuando se expresa como un porcentaje de minutos totales en el periodo, se
puede convertir fácilmente a disponibilidad. En ambos casos, puede también ser útil identificar y
medir la causa raíz del tiempo muerto para poder apuntar más fácilmente la mejora. Las
categorías de causas de los problemas incluyen problemas de hardware, software, link o
portadora, potencia o entorno, fallas de cambios y errores de los usuarios.
Que mide el soporte proactivo los procesos es más difícil porque le requiere monitorear el trabajo
proactivo y calcular una cierta medida de su eficacia. Poco trabajo se ha hecho en esta área. Está
claro, sin embargo, que solamente un pequeño porcentaje de la gente señalará realmente los
problemas de red a un escritorio de ayuda, y cuando señalan el problema, tomará tiempo
claramente para explicar el problema o para aislar el problema como siendo relacionado a la red.
No todos los casos proactivos tendrán un efecto inmediato sobre la Disponibilidad y el
funcionamiento debido al error de dispositivos redundantes o de links tendrá poco impacto en los
usuarios finales.
Las organizaciones que implementan las definiciones o acuerdos de nivel de servicio proactivos
hacen eso a causa de los requisitos comerciales y el riesgo potencial de disponibilidad. La medida
entonces se hace en términos de cantidad o porcentaje de los casos proactivos, en comparación
con los casos reactivos que son generados por los usuarios. Es una buena idea medir la cantidad
de casos proactivos en la cada área también. Estas categorías incluirían dispositivos inactivos,
links inactivos, errores de red y violaciones de capacidad. También se puede realizar un trabajo
con el modelado de la disponibilidad y los casos proactivos para determinar el efecto en la
disponibilidad logrado al implementar las definiciones de servicio proactivo.
Otra medida de éxito del Service Level Management es el estudio del Service Level Management.
Esto debe hacerse ya sea que existan o no SLA (contratos de nivel de servicio). Ejecute la
revisión de la administración de nivel de servicio en una reunión mensual con individuos
responsables de medir y proveer niveles de servicios definidos. Los grupos de usuarios pueden
también estar presentes en que los SLA están implicados. El objetivo de la reunión es evaluar el
rendimiento de las definiciones del nivel de servicio medido y realizar mejoras.
Cada reunión debe tener un orden del día definido que incluya:
Información Relacionada
● Soporte Técnico - Cisco Systems