0% ont trouvé ce document utile (0 vote)

29 vues30 pages

Architectures de calculs parallèles expliquées

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

29 vues30 pages

Architectures de calculs parallèles expliquées

Transféré par

orochon

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Architectures

parallèles

Chargé de cours: Lévis Thériault

Département de génie logiciel et des TI
Sommaire
 Introduction
 Réseaux d’interconnexion
 Tableaux de processeurs
 Multiprocesseurs
 Multi-ordinateurs

LOG645 – Architectures de calculs parallèles 2

Matériel développé par Lévis Thériault, Automne 2014
Introduction
 1960-1990 : beaucoup de développement dans les
architectures, mais trop de variété
- Processeurs : fabrication propriétaire vs. générique
- Petit nombre de processeurs super-puissants vs. grand nombre de
processeurs « ordinaires »

 Aujourd’hui :
- Utilisation de CPU génériques, croissance plus rapide que les
technologies propriétaires

 Questions
- Comment relier ces processeurs les uns aux autres?
- Comment relier ces processeurs à la mémoire ?
LOG645 – Architectures de calculs parallèles 3
Matériel développé par Lévis Thériault, Automne 2014
Réseau d’interconnexion
 Sert à :
- Relier les processeurs à une mémoire partagée
- Relier les processeurs les uns aux autres
 Le médium du réseau peut être :
- Partagé
- Commuté
 Problématique :
- Vitesse de communication vs. vitesse des processeurs
LOG645 – Architectures de calculs parallèles 4
Matériel développé par Lévis Thériault, Automne 2014
Médium partagé
 Les messages sont envoyés à tous, un à la fois
 Tous les processeurs reçoivent le message mais
seuls ceux identifiés comme destinataires le
conservent
 Exemple : Ethernet
 Beaucoup de communications  collisions

P P P P

LOG645 – Architectures de calculs parallèles 5

Matériel développé par Lévis Thériault, Automne 2014
Médium commuté
 Permet des communications point-à-point entre paires
de processeurs
 Chaque processeur a un lien avec le médium
 Principaux avantages sur le médium partagé
- Permet des communications simultanées
- Plus extensible à de grand nombre de processeurs
Médium commuté
 Principaux inconvénients :
- Complexité
P P P P
- Coût
LOG645 – Architectures de calculs parallèles 6
Matériel développé par Lévis Thériault, Automne 2014
Topologie du réseau d’interconnexion
 Directe : 1 processeur = 1 commutateur
 Indirecte : Nb processeurs < Nb commutateurs
 Critères de performance du réseau :
- Diamètre : Distance maximum entre 2 nœuds
- Largeur bissectionnelle : Nombre min. de liens devant
être enlevés pour sectionner le réseau en deux moitiés
- Degré : Nb de liens directs d’un nœud vers d’autres
nœuds
- Longueur des liens entre les noeuds
LOG645 – Architectures de calculs parallèles 7
Matériel développé par Lévis Thériault, Automne 2014
Topologie du réseau d’interconnexion
 Exemples:
 Point-à-point  Grille
 Étoile  Arbre hyperbolique
 Arbre binaire  Bus
 Maillé  Multi-étage
 Hypercube  Matriciel (« crossbar »)
 Anneau
 Aucune topologie n’est supérieure sur tous les
critères
LOG645 – Architectures de calculs parallèles 8
Matériel développé par Lévis Thériault, Automne 2014
Tableaux de processeurs (arrays)
 Ordinateur vectoriel : ordinateur contenant des
instructions sur des vecteurs (tableau de valeurs)
 Tableau (réseau) de processeurs : ordinateur
vectoriel comprenant un ensemble d’éléments de
calcul identiques et synchrones
 Les éléments de calcul sont des processeurs primitifs
contrôlés par un processeur standard
 Les processeurs effectuent simultanément la même
opération sur des données différentes

LOG645 – Architectures de calculs parallèles 9

Matériel développé par Lévis Thériault, Automne 2014
Tableaux de processeurs (arrays)
 Parallélisme de données
 Vecteur < Tableau = Perte de performance
 Vecteur > Tableau = « Mapping » (manuel ou
système)

LOG645 – Architectures de calculs parallèles 10

Matériel développé par Lévis Thériault, Automne 2014
Besoin d’architectures flexibles
 Problèmes associés aux ordinateurs vectoriels
- Peu flexibles (limité principalement au parallélisme
de données)
- Difficiles à programmer
- Technologie progressant trop lentement par rapport
aux processeurs génériques
- …

LOG645 – Architectures de calculs parallèles 11

Matériel développé par Lévis Thériault, Automne 2014
Besoin d’architectures flexibles
 2 types d’ordinateurs mieux adaptés aux
besoins actuels se sont développés depuis les
années 90
- Multiprocesseurs
- Multi-ordinateurs

LOG645 – Architectures de calculs parallèles 12

Matériel développé par Lévis Thériault, Automne 2014
Multiprocesseur
 Ordinateur comprenant plusieurs processeurs
pouvant être génériques
 Mémoire partagée
 Supporte plusieurs utilisateurs
 2 types :
- Centralisé
- Distribué

LOG645 – Architectures de calculs parallèles 13

Matériel développé par Lévis Thériault, Automne 2014
Multiprocesseur centralisé
 Extension de l’architecture séquentielle typique
- Un bus relie les processeurs à la mémoire et aux E/S
- La mémoire cache permet d’accélérer les calculs sur
chaque processeur en réduisant les accès à la mémoire

 2 autres appellations, liées au temps d’accès à la

mémoire par tous les processeurs :
- Uniform Memory Access (UMA)
- Symmetric MultiProcessor (SMP)

LOG645 – Architectures de calculs parallèles 14

Matériel développé par Lévis Thériault, Automne 2014
Multiprocesseur centralisé
 Les processeurs communiquent par des
lectures/écritures sur des variables en mémoire
partagée
 Les caches réduisent la CPU CPU CPU
charge sur bus/mémoire
Cache Cache Cache

Bus

Mémoire Entrées
principale /Sorties

LOG645 – Architectures de calculs parallèles 15

Matériel développé par Lévis Thériault, Automne 2014
Multiprocesseur centralisé
 Exemples :
- IBM p5 570, 16 procs 1.9 GHz, 32 GB RAM
- Sun Blade X6250, 8 procs 3 GHz, 32 GB RAM
 2 Problèmes :
- Cohérence de cache
- Synchronisation

LOG645 – Architectures de calculs parallèles 16

Matériel développé par Lévis Thériault, Automne 2014
Cohérence de cache
 La duplication de certaines données dans les caches
permet de minimiser les accès mémoire
 Que fait-on lorsqu’une écriture est effectuée?
 Protocole de cohérence de cache : ensemble de règles
assurant que les processeurs possèdent la même
valeur d’un emplacement mémoire
- Snoopy bus (espionnage)

LOG645 – Architectures de calculs parallèles 17

Matériel développé par Lévis Thériault, Automne 2014
Synchronisation
 Dans certains cas d’exécution parallèle, des règles de
précédence doivent être respectées
 Dans un contexte de mémoire partagée, des mécanismes
permettent d’assurer un certain ordre dans les opérations
- Exclusion mutuelle : seulement un processeur doit effectuer une
partie de programme
- Section critique : partie de programme ne pouvant être effectuée
que par un processeur à la fois
- Barrière de synchronisation : les processeurs sont arrêtés à un
certain point du programme jusqu’à ce que tous les processeurs
aient atteint ce point
 Ces mécanismes peuvent être implémentés de façon matérielle
ou logicielle
LOG645 – Architectures de calculs parallèles 18
Matériel développé par Lévis Thériault, Automne 2014
Multiprocesseur distribué
 La mémoire principale est distribuée entre les
processeurs
 Les accès à la mémoire locale sont plus rapides
que ceux à la mémoire distante
 Permet un plus grand nombre de processeurs
CPU CPU CPU

Cache Cache Cache

Mémoire E/S Mémoire E/S Mémoire E/S

Réseau d’interconnexion
LOG645 – Architectures de calculs parallèles 19
Matériel développé par Lévis Thériault, Automne 2014
Multiprocesseur distribué
 Même si elle est physiquement distribuée, la
mémoire est vue logiquement comme unique
 Non Uniform Memory Access (NUMA) : les
temps d’accès à la mémoire peuvent varier
considérablement selon la localité
 Réseau d’interconnexion :
- Problème : cohérence de cache
- Solution : protocole basé sur un répertoire

LOG645 – Architectures de calculs parallèles 20

Matériel développé par Lévis Thériault, Automne 2014
Multi-ordinateur
 La mémoire est physiquement organisée comme celle du
multiprocesseur distribué
 Logiquement, espaces d’adressage disjoints
 Chaque processeur n’a accès qu’à sa propre mémoire locale
 Interactions entre processeurs effectuées par passage de
messages
 Peut être :
- Asymétrique
- Symétrique

LOG645 – Architectures de calculs parallèles 21

Matériel développé par Lévis Thériault, Automne 2014
Multi-ordinateur asymétrique
 Composé d’un ordinateur principal complet et de plusieurs
ordinateurs dédiés au calcul
 Ordinateur principal
- Point d’entrée du système
- Fonctionnalités standard d’un ordinateur (OS, E/S, etc.)
- Contient le programme qui contrôle les autres procs (ordinateurs)

Ordinateur

Ordinateur Réseau Ordinateur

Utilisateur
principal d’interconnexion
Ordinateur
Multi-ordinateur

LOG645 – Architectures de calculs parallèles 22

Matériel développé par Lévis Thériault, Automne 2014
Multi-ordinateur asymétrique
 Ordinateurs dédiés au calcul
- Système d’exploitation minimal
- Pas d’entrées/sorties
 Problèmes
- Une panne sur l’ordinateur principal, plus de machine !
- Beaucoup d’utilisateurs = goulot d’étranglement sur la
machine principale !
- Programmes difficiles à débugger, pas d’E/S sur les procs
- Nécessite l’écriture de 2 programmes (maître-esclave)
LOG645 – Architectures de calculs parallèles 23
Matériel développé par Lévis Thériault, Automne 2014
Multi-ordinateur symétrique
 Ordinateurs identiques, même fonctionnalités
 Plusieurs points d’entrée pour les utilisateurs
 Avantages
- Charge répartie sur le système plutôt que concentrée
- Un ordinateur peut se permettre de tomber en panne
- Un seul programme pour tous les ordinateurs
Utilisateur
Ordinateur Ordinateur

Ordinateur Réseau Ordinateur

Utilisateur d’interconnexion

Ordinateur Ordinateur
Multi-ordinateur

LOG645 – Architectures de calculs parallèles 24

Matériel développé par Lévis Thériault, Automne 2014
Multi-ordinateur symétrique
 Désavantages :
- Chaque nœud pouvant servir d’entrée et ayant sa propre
identité, l’illusion d’un seul système est difficile à
maintenir
- Difficulté de répartition de la charge de calcul générale,
de tous les utilisateurs, sur tous les processeurs
- Compétition entre les programmes pour le temps CPU
limite la performance

LOG645 – Architectures de calculs parallèles 25

Matériel développé par Lévis Thériault, Automne 2014
Clusters vs. réseaux de stations
 Cluster
- Ensemble homogène d’ordinateurs
- Réunis géographiquement
- Nœuds dédiés au calcul parallèle
- Ressource unifiée de calcul parallèle
- Réseau haut débit (Fast/Gigabit Ethernet, Myrinet)
 Exemple
- IBM Roadrunner (superordinateur, #7 mondial du
Top 500)
LOG645 – Architectures de calculs parallèles 26
Matériel développé par Lévis Thériault, Automne 2014
Clusters vs. réseaux de stations
 Réseau de stations (Network of Workstations, NOW) :
- Ensemble hétérogène d’ordinateurs
- Souvent réparti géographiquement
- Les nœuds sont souvent déjà utilisés localement
- Calcul parallèle  utilisation secondaire des machines
- Connectés par un réseau générique, souvent Ethernet
 Exemple:
- LCA de l’ÉTS

LOG645 – Architectures de calculs parallèles 27

Matériel développé par Lévis Thériault, Automne 2014
Clusters vs. réseaux de stations
 Comparaison des réseaux :
Latence Largeur de bande Coût par nœud
(sec) (Mbit/s) ($)
Ethernet ~150 10 ~10

Fast Ethernet 100 100 100

Gigabit Ethernet 100 1000 1000

Myrinet 7 1920 2000

 Principal avantage des NOW = Peu coûteux et facile à

construire avec des composantes génériques
LOG645 – Architectures de calculs parallèles 28
Matériel développé par Lévis Thériault, Automne 2014
Conclusion
 L’intérêt pour les tableaux de processeurs a
diminué avec
- Diminution du coût des microprocesseurs
- Rigidité du parallélisme de données
 « Petits » ordinateurs parallèles
- 2 < Nombre de processeurs < 64
- Typiquement de type multiprocesseur
- Vue globale de la mémoire, cohérence de cache

LOG645 – Architectures de calculs parallèles 29

Matériel développé par Lévis Thériault, Automne 2014
Conclusion
 « Grands » ordinateurs parallèles
- 64 < Nombre de processeurs < Quelques centaines
- Typiquement de type multi-ordinateur
- Souvent des clusters de multiprocesseurs
 « Supers » ordinateurs parallèles
- Des milliers de processeurs
- Typiquement de type multi-ordinateur
- Souvent des clusters de multiprocesseurs

LOG645 – Architectures de calculs parallèles 30

Matériel développé par Lévis Thériault, Automne 2014

Vous aimerez peut-être aussi

Introduction au parallélisme informatique
Pas encore d'évaluation
Introduction au parallélisme informatique
48 pages
Introduction à MPI et Communication
Pas encore d'évaluation
Introduction à MPI et Communication
54 pages
Introduction à MPI pour Débutants
Pas encore d'évaluation
Introduction à MPI pour Débutants
57 pages
Cours 04
Pas encore d'évaluation
Cours 04
53 pages
Cours 05
Pas encore d'évaluation
Cours 05
73 pages
Architectures de Processeurs Parallèles
Pas encore d'évaluation
Architectures de Processeurs Parallèles
22 pages
Cours Parallélisme Et Clustering (Part1)
Pas encore d'évaluation
Cours Parallélisme Et Clustering (Part1)
26 pages
Introduction au calcul parallèle
Pas encore d'évaluation
Introduction au calcul parallèle
66 pages
Introduction aux architectures parallèles
Pas encore d'évaluation
Introduction aux architectures parallèles
30 pages
Pa 1
Pas encore d'évaluation
Pa 1
30 pages
Cours1 Info0802
Pas encore d'évaluation
Cours1 Info0802
58 pages
Architectures et Programmation Parallèle
Pas encore d'évaluation
Architectures et Programmation Parallèle
67 pages
Architectur Parallèle
Pas encore d'évaluation
Architectur Parallèle
163 pages
Système Dexploitation II-chapitre1
Pas encore d'évaluation
Système Dexploitation II-chapitre1
16 pages
Exploitation des systèmes parallèles
Pas encore d'évaluation
Exploitation des systèmes parallèles
18 pages
Cours Calcul Parallele Partie 21
Pas encore d'évaluation
Cours Calcul Parallele Partie 21
53 pages
Architectures des Processeurs Modernes
Pas encore d'évaluation
Architectures des Processeurs Modernes
5 pages
Parallelisme
Pas encore d'évaluation
Parallelisme
41 pages
Programmation Parallèle-IRIIA
Pas encore d'évaluation
Programmation Parallèle-IRIIA
74 pages
Module 5-Processeurs
Pas encore d'évaluation
Module 5-Processeurs
9 pages
Architecture Et Segmentation Mémoire Du 80286
Pas encore d'évaluation
Architecture Et Segmentation Mémoire Du 80286
39 pages
Cours-AAO-version Finale (Mode de Compatibilité)
Pas encore d'évaluation
Cours-AAO-version Finale (Mode de Compatibilité)
186 pages
Architecture Parallèle2333
Pas encore d'évaluation
Architecture Parallèle2333
81 pages
Introduction au Parallélisme et Architectures Parallèles
Pas encore d'évaluation
Introduction au Parallélisme et Architectures Parallèles
68 pages
Architectures Parallèles en Informatique
Pas encore d'évaluation
Architectures Parallèles en Informatique
37 pages
System D'Exploitation: Enseignante: Mme Zouari Hela
Pas encore d'évaluation
System D'Exploitation: Enseignante: Mme Zouari Hela
23 pages
Architectures Paralleles
Pas encore d'évaluation
Architectures Paralleles
15 pages
Cours 1
Pas encore d'évaluation
Cours 1
25 pages
6 - Etat Art
Pas encore d'évaluation
6 - Etat Art
15 pages
Null 4
Pas encore d'évaluation
Null 4
4 pages
coursAO SZ-V22
Pas encore d'évaluation
coursAO SZ-V22
247 pages
APM Cours1
Pas encore d'évaluation
APM Cours1
61 pages
Introduction aux architectures parallèles
100% (1)
Introduction aux architectures parallèles
21 pages
Cours Parallelisme
Pas encore d'évaluation
Cours Parallelisme
63 pages
Introduction à l'Architecture PC
Pas encore d'évaluation
Introduction à l'Architecture PC
5 pages
Introduction Support
Pas encore d'évaluation
Introduction Support
34 pages
Systèmes Parallèles et Temps Réel : Réponses et Concepts
Pas encore d'évaluation
Systèmes Parallèles et Temps Réel : Réponses et Concepts
30 pages
Introduction aux Réseaux et Protocoles
100% (1)
Introduction aux Réseaux et Protocoles
884 pages
Architectures et Programmes Parallèles
Pas encore d'évaluation
Architectures et Programmes Parallèles
15 pages
Comprendre le processus en informatique
Pas encore d'évaluation
Comprendre le processus en informatique
6 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
34 pages
Cour 1 SE
Pas encore d'évaluation
Cour 1 SE
22 pages
Resume GC
Pas encore d'évaluation
Resume GC
15 pages
CH 1
Pas encore d'évaluation
CH 1
7 pages
Annexe1 Domaines D'application Des Algorithmes Parallèles
Pas encore d'évaluation
Annexe1 Domaines D'application Des Algorithmes Parallèles
3 pages
Idouar2024 - Support Des Taches Heterogenes Pour Des Applications de Streaming Sur Cibles Embarquees A Memoire Partagee
Pas encore d'évaluation
Idouar2024 - Support Des Taches Heterogenes Pour Des Applications de Streaming Sur Cibles Embarquees A Memoire Partagee
42 pages
Expose Groupe 5 Asi (1) - 1
Pas encore d'évaluation
Expose Groupe 5 Asi (1) - 1
11 pages
Asp Gci 1
Pas encore d'évaluation
Asp Gci 1
46 pages
Architecture et Circuits Logiques
Pas encore d'évaluation
Architecture et Circuits Logiques
25 pages
Cours Calculateurs L2 Info
Pas encore d'évaluation
Cours Calculateurs L2 Info
85 pages
Sepc 2
Pas encore d'évaluation
Sepc 2
26 pages
Introduction Parallelisme
Pas encore d'évaluation
Introduction Parallelisme
52 pages
Systèmes Parallèles-3
Pas encore d'évaluation
Systèmes Parallèles-3
60 pages
Cours Réseaux
Pas encore d'évaluation
Cours Réseaux
39 pages
Qu'est-Ce Qu'un Système Distribué ?
Pas encore d'évaluation
Qu'est-Ce Qu'un Système Distribué ?
9 pages
Distributed Parallel Systems-Chapitre2
Pas encore d'évaluation
Distributed Parallel Systems-Chapitre2
164 pages
Chap 1
Pas encore d'évaluation
Chap 1
10 pages
Cours Sys 2PPT20
Pas encore d'évaluation
Cours Sys 2PPT20
155 pages
Architectures Parallèles et Pipelines
Pas encore d'évaluation
Architectures Parallèles et Pipelines
25 pages
Configuration VLAN sur Cisco 2950
Pas encore d'évaluation
Configuration VLAN sur Cisco 2950
5 pages
Périphériques informatiques : installation et usage
Pas encore d'évaluation
Périphériques informatiques : installation et usage
3 pages
Mediadocs PdfVue Eclatee Flip PDF
Pas encore d'évaluation
Mediadocs PdfVue Eclatee Flip PDF
11 pages
2023 0004fr Jace9000 Datasheet French
Pas encore d'évaluation
2023 0004fr Jace9000 Datasheet French
5 pages
Architecture et Programmation 68000
Pas encore d'évaluation
Architecture et Programmation 68000
29 pages
Formation AutoPISTE et COVADIS 16
100% (1)
Formation AutoPISTE et COVADIS 16
2 pages
Mise À Jour Du Firmware BD-SP309 Web
Pas encore d'évaluation
Mise À Jour Du Firmware BD-SP309 Web
7 pages
TIGp's EB1 INFO 2C
Pas encore d'évaluation
TIGp's EB1 INFO 2C
2 pages
Réception Vente SIP50677
Pas encore d'évaluation
Réception Vente SIP50677
2 pages
Système d'Encaissement Automatisé BTS
Pas encore d'évaluation
Système d'Encaissement Automatisé BTS
8 pages
Installation & Programmation OP'DRIVE 3.0
Pas encore d'évaluation
Installation & Programmation OP'DRIVE 3.0
31 pages
Virtualisation & Cloud Partie1
Pas encore d'évaluation
Virtualisation & Cloud Partie1
11 pages
Catalogue de Pièces de Rechange 3191
Pas encore d'évaluation
Catalogue de Pièces de Rechange 3191
46 pages
DEVOIR N°1 - Architecture Des Ordinateurs 29 Avril 2020
100% (1)
DEVOIR N°1 - Architecture Des Ordinateurs 29 Avril 2020
4 pages
Optimisation de la gestion de mémoire RAM
Pas encore d'évaluation
Optimisation de la gestion de mémoire RAM
85 pages
Cahier 1AS 2019 v3
Pas encore d'évaluation
Cahier 1AS 2019 v3
65 pages
Introduction A L'informatique - Debut
Pas encore d'évaluation
Introduction A L'informatique - Debut
2 pages
Enseigner la logique à l'école
Pas encore d'évaluation
Enseigner la logique à l'école
11 pages
AcadiaCyberSec Tome1 Sever2022
Pas encore d'évaluation
AcadiaCyberSec Tome1 Sever2022
9 pages
Memoires Caches 2
Pas encore d'évaluation
Memoires Caches 2
46 pages
Rapport de Stage Pfe
Pas encore d'évaluation
Rapport de Stage Pfe
67 pages
2e Partie
Pas encore d'évaluation
2e Partie
52 pages
Vérifiez L'état de Votre Garantie Ou de Service
Pas encore d'évaluation
Vérifiez L'état de Votre Garantie Ou de Service
2 pages
Ports d'Entrée/Sortie et Connecteurs
Pas encore d'évaluation
Ports d'Entrée/Sortie et Connecteurs
4 pages
Commande Numérique d'une Découpe Laser
90% (39)
Commande Numérique d'une Découpe Laser
64 pages
Introduction à la programmation parallèle
100% (1)
Introduction à la programmation parallèle
302 pages
Chapitre 2 Getsion Des Processus
Pas encore d'évaluation
Chapitre 2 Getsion Des Processus
3 pages
Codes de Diagnostic de Trip Et de Statut de L'emerson Commander SK
Pas encore d'évaluation
Codes de Diagnostic de Trip Et de Statut de L'emerson Commander SK
6 pages
Maîtriser La Programmation Arduino Un Guide Rapide de La Programmation
Pas encore d'évaluation
Maîtriser La Programmation Arduino Un Guide Rapide de La Programmation
100 pages
Formation MOCN: Manuel Pratique
Pas encore d'évaluation
Formation MOCN: Manuel Pratique
90 pages