CLUSTER Y GRID
ING. MAGNO EDWIN CALIZAYA A.
CLUSTER
INDICE
INTRODUCCION
HISTORIA
CONCEPTOS
VENTAJAS
APLICACIONES
INTRODUCCION
La informática, ha contribuido de
forma única a la resolución de
millones de problemas en diferentes
ámbitos y disciplinas, constituyendo
hoy en día el motor de procesamiento
y fuente de recursos absolutamente
imprescindible.
…INTRODUCCION
Hoy en día existen ambiciosos proyectos de
investigación científica, simulaciones a gran escala,
toma de decisiones a partir de grandes volúmenes de
información y cientos de casos imaginables que no
encuentran una solución, en las herramientas
disponibles en la tecnología actual.
En estos casos, ni aún la supercomputadora más
sofisticada disponible en el mercado podría satisfacer la
capacidad de procesamiento de, estos problemas de
enorme potencia de cálculo fue logrado mediante
“CLUSTER” o “granjas” de computadoras,
HISTORIA DE CLUSTER
Surgidos a principios de los 80.
Es un CLUSTER de componentes de cómputo
dedicados a un problema paralelo.
El primer Cluster de este tipo fue desarrollado por
Thomas Sterling, de la división de Ciencias de la
Tierra de la NASA en JPL California, esta solución
popular ha sido ampliamente aceptada en varios
ambientes de producción, principalmente
laboratorios de investigación y sitios académicos.
COMO SURGE LOS CLUSTER
SUPERCOMPUTADORAS
Costosas.
Propietarias.
No están ampliamente
disponibles.
IDEAS…
RAID (Redundant Array of Inexpensive Disks) o
conjunto redundante de discos baratos
IBM – 1978.
RAID es un método de combinación de varios
discos duros para formar una única unidad
lógica y formar un sistema de almacenamiento
entre los que distribuye o replica los datos.
ALMACENAMIENTO A GRAN VELOCIDAD
…IDEAS
Delmismo modo que se añaden
discos para aumentar su rendimiento,
se pueden añadir nodos a un
CLUSTER para aumentar también su
rendimiento.
¿QUÉ ES CLÚSTER?
Cluster: Un conjunto de
computadoras independientes
interconectadas, usadas como un
recurso unificado de cómputo.
Un cluster es una colección de
ordenadores independientes que
se conectan para realizar en
conjunto o una serie de tareas.
Los recursos de memoria o
procesador dedicados a una tarea
pueden multiplicarse por el
número de ordenadores (nodos)
en el cluster.
¿QUÉ ES CLÚSTER?
Es CLUSTER si los componentes son supervisados por
medio de un solo dominio administrativo, usualmente
residiendo en un solo espacio y manejado como un solo
sistema de cómputo.
Los nodos son comerciales,
Realizar operaciones independiente,
Se emplea para aplicaciones seriales y aisladas.
ASPECTOS IMPORTANTES DE LOS CLUSTERS
Escalabilidad
Alto rendimiento
Alta disponibilidad
Imagen de Sistema Sencillo
Rápida comunicación
Ambiente distribuido
Balanceo de carga
Seguridad
CLUSTERS DE COMPUTADORAS DEBEN SOPORTAR:
Multiusuarios
Tiempo compartido
Homogenidad o Hetereogenidad
Muchos procesadores
Cada nodo es independiente
APLICACIONES
Aplicaciones en areas como predicción del clima,
astronomía, biologia, quimica, etc. son algunas de las
aplicaciones mas comunes para los clusters.
Otro ejemplo de aplicación mas usado en estos dias, es
por ejemplo, un negocio en Internet que recibe millones
de peticiones por dia, y nuestro trabajo es asegurarnos
de que los servidores respondan rapidamente a las
peticiones de los clientes.
Asegurarnos de que nuestros servidores esten
disponibles todo el tiempo aun cuando exista algún
problema en alguno de ellos.
APLICACIONES
Altos requerimientos computacionales son típicos en
aplicaciones como:
Algoritmos genéticos
Simulación de líneas de fabricación
Aplicaciones militares
Síntesis de imágenes
Recuperación de imágenes por contenido
Simulación de modelos para clima
Análisis de sismos
Algoritmos electromagnéticos
Dinámica de fluidos
Química cuántica
Biomedicina
Etc.
FOTOS DE
CLUSTER
IMÁGENES DE INSTALACIONES DE CLUSTER
…CLUSTER…
HERRAMIENTAS
PARA CLUSTER
HERRAMIENTAS PARA CLUSTERS
Sistema Operativo Linux
OpenMosix
PVM
LAM
MPI
OSCAR
Ganglia
Etherboot
LinPack
Piranha
¿QUE ES MOSIX?
Mosix es una paquete de
software diseñado para
añadir a Linux la
capacidad de
procesamiento cluster.
Incluye balanceo de carga, ushering memoria y
algoritmos de optimización de E/S que
responden a las varaciones del uso de los
recursos del cluster.
Características
Mosix trabaja silenciosamente y sus operaciones son
transparentes a las aplicaciones.
Los usuarios de Mosix tanto pueden ejecutar tareas
en secuencial como en paralelo
No conocen donde se ejecutan sus aplicaciones.
No son conscientes de lo que otros usuarios estan haciendo.
Migración de procesos
Cuando se crea un proceso Mosix intenta asignar el
proceso nodo menos cargado en ese instante de
tiempo.
Para conseguir la migración de procesos Mosix
realiza: Monitorización de todos los procesos.
La monitorización se realiza sin afectar a la interficie
de Linux.
Cadena Alimenticia de la
Computación (presente y futuro)
QUIENES UTILIZAN CLUSTERS?
NASA
NOAA (The National Oceanic
and Atmospheric
Administration)
[Link]
Instituto Nacional de Salud en
Estados Unidos (Beowulf 675
nodos, 1350 procesadores)
Universidades en todo el
mundo
La FCC-BUAP y otras fac.
QUIENES UTILIZAN CLUSTERS?
GOOGLE
Más de 5 mil millones de búsquedas
cada mes.
20 mil servidores en 7 datacenters
INTRODUCCION
A través de Internet se han realizado logros
importantes como ser compartir archivos, E-
MAIL, Word Wide Web pero hace un tiempo
aras no se ha logrado compartir otro recursos
como ser procesador memoria o creando una
entidad virtual. Es entonces aquí donde surge
el concepto de “computación grid”
COMO NACE?
El Grid toma el nombre de su
analogía con la red eléctrica
(en inglés ”power
grid”):analogía con la red
eléctrica:
¿QUE ES GRID?
Un GRID es la integración de equipos de trabajo ubicados
físicamente en forma remota que comparten recursos,
instrumentos, dispositivos y tecnologías como las asociadas a
redes de alta velocidad o dedicadas, equipos disponibles para
cualquier trabajo amplio y sistemas de software que
interaccionan entre el usuario final y los dispositivos para
recibir y ejecutar sus solicitudes.
Las tecnologías de GRID buscan cambiar la forma en que se
usan los recursos computacionales, de manera que se pueda
usar cierta cantidad de recursos, sin importar su ubicación
geográfica ni su pertenencia a una organización.
MITOS
El Grid NO es una mejora/ampliación de
Internet (no están al mismo nivel)
El Grid NO es un proyecto (es una tecnología)
El Grid NO es un cluster de ordenadores (en un
grid puede haber integrados muchos o ningún
cluster)
LOS RECURSOS DE GRID SE DIVIDEN EN:
Recursos que forman parte de la
infraestructura, tales como recursos de
hardware, de software y de red.
Recursos que forman parte de los
requerimientos; por ejemplo, el tiempo que se
dispone de los recursos de infraestructura, los
datos requeridos para un proceso dado, etc.
ARQUITECTURA DEL PROTOCOLO GRID
MEMORIA COMPARTIDA
Existen variedad de casos pero en general
múltiples tienen en común que los procesadores
acceden al mismo espacio físico de memoria.
Los cambios de un procesador en la memoria
afectan a todos los procesadores.
HÍBRIDO MEMORIA COMPARTIDA-DISTRIBUÍDA
Utiliza las ventajas de las dos arquitecturas anteriores.
Los componentes de memoria compartida son
usualmente maquinas SMP.
El componente distribuído lo proporciona una
interconección de red entre las máquinas SMP.
Las tendencias actuales indican que esta arquitectura
es la que prevalecerá y se desarrollará más
rápidamente
MEMORIA DISTRIBUIDA
Existen variedad de casos pero en general tienen en
común lo siguiente:
Cada procesador cuenta con memoria local la cual no se
mapea a los otros
Procesadores
Requieren una red de comunicación para conectar las
memorias interprocesador. Memoria escalable con el
número de procesadores
VENTAJAS
La obsolescencia deja de ser un problema. Los ordenadores
más antiguos suman potencia al Grid.
Los ordenadores no requieren estar dedicados.
Amortiza al máximo los equipos disponibles.
Bajo coste en comparación con otras alternativas.
Puede crecer según las necesidades del usuario
Bajos costes de administración y mantenimiento.
Permite dar gran potencia de cálculo a los investigadores a un
coste bajo y de manera sencilla.
Más productividad de la investigación científica: papers,
proyectos.
IMPLEMENTACIONES
Entre los esfuerzos por estandarizar la computación Grid se
encuentran implementaciones de protocolos como la Open
Grid Services Architecture (OGSA) y el Globus Toolkit
([Link]), una herramienta que se ha establecido
como el estándar de facto para la capa intermedia
(middleware) del grid. Este software de arquitectura abierta
es un conjunto “open-source” de servicios y librerías que
soportan grids y sus aplicaciones y permite direccionar
asuntos de seguridad, hallazgos de información, de gestión
de recursos y datos, comunicación, fallas y
transportabilidad. Actualmente se encuentra en uso en
cientos de sitios y docenas de proyectos grid en todo el
mundo.
Evolucion de las plataformas
2100 2100 2100
2100
?
2100 2100 2100 2100
2100
R
E
N
D
I
M Clusters
I
E interplanetarios
N ??
T
O
Desktop SMPs o Cluster Cluster/Grid Cluster/Grid
SuperCom Local
putadoras Globales
¿QUIÉN ESTÁ UTILIZANDO GRID?
UNA DE CADA5 EMPRESAS VA A IMPLEMENTAR UN GRID MUY
PRONTO
INDUSTRIA TAREAS DE COMPUTO
¿QuiénestáutilizandoGrid?
Unade cada5 empresasvaa implementarun
Grid en los próximosdos años. IDC
(Enero2005)
CONCLUSIONES
La tecnología grid ha logrado el aprovechamiento de
recursos y procesamiento inutilizado mediante la
integración de equipos distribuidos geográficamente,
creando estructuras más robustas y resistentes y
reduciendo sensiblemente los costos en proyectos a
gran escala.
Si bien se han identificado los requerimientos
necesarios en proyectos grid, todavía no ha surgido un
modelo estándar que describa la arquitectura,
generándose de este modo una necesidad de
superación y evolución llena de desafíos para los
desarrolladores del futuro.
CONCLUSIONES
Los cluster y Grid son un foco para la
investigación en la tecnología actual y tiene
aplicaciones paralelas de cómputos
distribuidos.
MUCHAS GRACIAS!!!!