0% ont trouvé ce document utile (0 vote)

52 vues52 pages

Introduction au Calcul Parallèle

Le document décrit le calcul parallèle, y compris les architectures parallèles, les modèles de programmation parallèle, OpenMP et MPI. Il explique les concepts clés du calcul parallèle tels que les différents types d'architectures parallèles comme SIMD, MIMD, et les défis liés à la programmation et à la performance des calculs parallèles.

Transféré par

Tag Tēd

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

52 vues52 pages

Introduction au Calcul Parallèle

Transféré par

Tag Tēd

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Calcul Parallèle

Vincent Loechner
loechner@[Link]

UFR de Mathématique et d’Informatique

Université de Strasbourg
et
équipe ICPS
laboratoire ICube (UMR CNRS 7357) / INRIA

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 1 / 39

Plan

1 Introduction

2 Architectures parallèles

3 Modèles de programmation

4 OpenMP

5 MPI

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 2 / 39

Introduction

Qu’est-ce que le parallélisme ?

→ exécuter plusieurs actions coordonnées en même temps

En informatique, le parallélisme consiste à mettre en œuvre des architectures

[...] permettant de traiter des informations de manière simultanée, ainsi que
les algorithmes spécialisés pour celles-ci. Ces techniques ont pour but de réa-
liser le plus grand nombre d’opérations en un temps le plus petit possible.
(source : wikipedia)

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 3 / 39

Introduction

Qu’est-ce que le parallélisme ?

→ exécuter plusieurs actions coordonnées en même temps

En informatique, le parallélisme consiste à mettre en œuvre des architectures

Les architectures parallèles sont les ordinateurs sur lesquels ce paradigme est
utilisable ;
les modèles de programmation parallèles sont les techniques de
programmation qui permettent de l’exploiter.

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 3 / 39

Introduction

Temps d’exécution d’un programme

texéc = ninstructions ∗ tinstruction

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 4 / 39

Introduction

Temps d’exécution d’un programme

texéc = ninstructions ∗ tinstruction

Temps d’exécution d’un programme parallèle

ninstructions ∗ tinstruction
texéc =
p

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 4 / 39

Introduction : quelques challenges

Applications numériques
→ simulation physique : éléments finis, maillage de l’espace
météo, modélisation globale et changements climatiques
mécanique des fluides (aéronautique, moteurs, nucléaire, ...)
simulation de matériaux (composites, catalyseurs, ...)
→ problèmes à N-corps
astronomie, astrophysique
modélisation moléculaire (médicaments, génôme, ...)

Applications informatiques
temps réel, applications embarquées
traitement d’image, visualisation, réalité virtuelle
bases de données : systèmes d’information géographique, web, ...

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 5 / 39

Introduction : performance

1 flop/s = un calcul en virgule flotante par seconde

(FLoating OPeration per Second)

année vitesse ordinateur

3
1947 1 kflop/s 10 ENIAC
1984 50 kflop/s 104 8087 (co-processeur IBM PC)
1984 800 Mflop/s 109 Cray X-MP/48
1997 23 Mflop/s 107 Intel Pentium MMX (200MHz)
1997 1 Tflop/s 1012 Intel ASCI Red
2007 1.5 Gflop/s 109 Core 2 Duo (2.4Ghz)
2007 500 Tflop/s 1014 IBM BlueGene/L
2017 10 Tflop/s 1013 Core i7 + GPU
2017 100 Pflop/s 1017 Sunway TaihuLight

[Link]

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 6 / 39

Introduction : vitesse

Un produit de matrices

produit de deux matrices 10000 × 10000 : C = AB

P
calcul de 10000 fois ci,j = ai,k ∗ bk,j
nombre d’opérations flotantes = 2 ∗ 104 ∗ 104 ∗ 104 = 2.1012

Temps d’exécution :
ENIAC : 2.109 s = 63ans
PC de 1997 : 24 minutes
ASCI Red (1997) : 2 s
PC actuel : 0.2s → 5 par seconde
TaihuLight : 0.02 ms → 50000 par seconde

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 7 / 39

Plan

1 Introduction

2 Architectures parallèles

3 Modèles de programmation

4 OpenMP

5 MPI

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 8 / 39

Architectures parallèles

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 9 / 39

Architectures parallèles

SISD

une seule unité de calcul, séquentielle

accédant à une seule donnée à la fois

Exemples : ENIAC, un PC de 1982 (Intel8088)

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 10 / 39

Architectures parallèles

MISD

plusieurs unités de calcul, qui exécutent des instructions différentes

mais accédant à une seule donnée à la fois

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 11 / 39

Architectures parallèles

MISD

plusieurs unités de calcul, qui exécutent des instructions différentes

mais accédant à une seule donnée à la fois
→ fonctionnement de type pipeline

Exemples : pipeline d’instructions du coeur de processeur (RISC à 5 étages :

1988), pipeline graphique

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 11 / 39

Architectures parallèles

SIMD

plusieurs unités de calcul, exécutant toutes la même instruction (SI)

sur des jeux de données différents

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 12 / 39

Architectures parallèles

SIMD

plusieurs unités de calcul, exécutant toutes la même instruction (SI)

sur des jeux de données différents
→ fonctionnement de type vectoriel

Exemples : MasPar (1990), instructions vectorielles (MMX, SSE, AVX), GPUs,

...
Vincent Loechner (Université de Strasbourg) Calcul Parallèle 12 / 39
Architectures parallèles

MIMD - mémoire distribuée

plusieurs machines SISD, reliées entre elles par un réseau

fonctionnement asynchrone, chaque machine a sa mémoire

Exemples : IBM RS/6000 (1990), clusters de PCs

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 13 / 39

Architectures parallèles

MIMD - mémoire partagée

plusieurs machines SISD,

partageant une mémoire unique

Exemples : Cray X-MP (1983), SGI Challenge (1990), processeurs multi-coeurs

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 14 / 39

Architectures parallèles

MIMD-VSM (Virtually Shared Memory)

aussi appelée NUMA (Non-Uniform Memory Access)

architecure physique MIMD à mémoire distribuée

mais... l’ensemble de la machine possède une vision globale de la
mémoire
un processeur X peut accéder à la mémoire du processeur Y, sans
l’interrompre, grâce à un réseau qui interconnecte les RAM !

Exemples : Cray T3D (1993), SGI Origin 2000 (1996), ...

Vincent Loechner (Université de Strasbourg) Calcul Parallèle 15 / 39

Plan

1 Introduction

2 Architectures parallèles

3 Modèles de programmation
À la recherche du parallélisme potentiel
Techniques d’écriture d’un programme parallèle
Mesures de performance

4 OpenMP

5 MPI