4.
Monitoreo de Datacenter
Prof. Ramiro Estigarribia Canese
ramiroec@[Link]
Link a la presentación
¿Qué es el Monitoreo de Datacenter?
Son actividades que permiten la detección oportuna de fallas
de los elementos que conforman el Datacenter.
Son de gran relevancia para garantizar un buen servicio del
Datacenter.
Siempre es mejor prevenir que lamentar.
[Link]
¿Es importante monitorear un Datacenter?
Es de vital importancia contar con un esquema capaz de
notificar fallas y mostrar el comportamiento mediante el
análisis y recolección de datos en el tiempo.
De esta forma podremos anticiparnos a posibles problemas
futuros y corregirlos a tiempo.
Año 2025: De Reactivo a Predictivo
Nuevos Paradigmas: El monitoreo ahora busca predecir eventos con IA.
➔ IA Predictiva: Sistemas que anticipan fallas 72 horas antes usando
machine learning.
➔ Digital Twins: Réplicas virtuales en tiempo real del data center para
simulaciones.
➔ Autonomía: Sistemas que se auto-curan (ej: reconfiguran tráfico ante
congestión).
Caso real: El DC de Microsoft en Azure Sphere usa IA que predice fallas en
discos SSD.
¿Cuáles son los elementos típicos a
monitorear en un Datacenter?
1. Utilización de ancho de banda.
2. Consumo de CPU.
3. Uso de memoria y disco.
4. Disponibilidad de servicios (web, email, base de datos, etc).
5. Tiempo de respuesta al ping.
6. Temperatura de equipos y de la sala.
7. Tiempo de encendido de cada equipo.
[Link]
Elementos Críticos a Monitorear en 2025
Energía: Huella de carbono (kgCO2/kWh), PUE en tiempo real.
Hardware: Degradación de SSD, health score de GPUs para AI.
Ciberseguridad: Anomalías de tráfico zero-day:
[Link]
Ambiental: Calidad del aire (partículas), radiación electromagnética.
Protocolos para hacer Monitoreo
1. SNMP: Permite recopilar información sobre el estado y el
rendimiento de los dispositivos.
2. ICMP (Internet Control Message Protocol): Se utiliza
principalmente para diagnosticar problemas de red.
3. NetFlow: desarrollado por Cisco, es un protocolo que
recopila información sobre el tráfico de red.
¿Qué es SNMP?
Es un protocolo para intercambiar información entre
dispositivos de red.
Forma parte del conjunto de protocolos Protocolo de control
de transmisión/Protocolo de Internet (TCP/IP).
Del inglés: Protocolo simple de administración de redes.
(SNMP)
¿Para qué se utiliza SNMP?
Se utiliza para administrar y monitorizar los equipos de un
Datacenter.
La mayoría de los elementos de red de nivel profesional
vienen con un agente SNMP incluido.
Estos agentes deben estar habilitados y configurados para
poder ser monitoreados.
Esquema básico del monitoreo con SNMP
El usuario desde el navegador visualiza el monitoreo en forma remota.
Protocolos Emergentes de Monitoreo
Más Allá de SNMP
● gNMI (gRPC Network Management Interface):
○ Reemplaza SNMP para dispositivos modernos (mayor
velocidad y seguridad).
● eBPF (Extended Berkeley Packet Filter):
○ Monitorización a nivel kernel sin instalar agentes.
● QUIC para métricas:
○ Entrega de datos de monitoreo con baja latencia incluso en
redes congestionadas.
Herramientas de Monitoreo
1. Nagios: Popular para monitorear redes y servidores.
2. Zabbix: Ofrece monitoreo en tiempo real y alertas.
3. PRTG Network Monitor: Fácil de usar y muy completo.
4. SolarWinds: Conocido por su interfaz intuitiva y
capacidades avanzadas.
5. Solutions customizadas:
a. AWS Data Center Monitoring Service (DCMS)
b. Google Anthos for DCs
Aspectos a Monitorear
Red: Latencia, ancho de banda, errores de paquetes.
Servidores: Uso de CPU, memoria, almacenamiento.
Equipos de Red: Estado de los puertos, tráfico, errores.
Configuración de Alertas
Umbrales de Uso: CPU por encima del 80%, por ejemplo.
Errores de Red: Paquetes perdidos o alta latencia.
Estado del Hardware: Fallos en discos duros o memoria.
Simulador de Monitoreo con Python
Actividad: Crear un script en Python que permita monitear un
Centro de Datos.
Abrir Visual Studio Code (o Google Colab).
Crear una nueva carpeta (puede ser Clase 4) y una vez dentro,
crear 1 archivo: [Link]
[Link]
mJmQcQO8mMb8ot1wtW?usp=sharing