0% ont trouvé ce document utile (0 vote)

187 vues60 pages

Introduction à OpenMP et MPI

Ce document présente OpenMP et MPI, deux API pour la programmation parallèle. OpenMP permet de paralléliser des boucles et des sections de code de manière simple en ajoutant des directives. MPI est utilisé pour la communication entre processus.

Transféré par

kaoutar

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

187 vues60 pages

Introduction à OpenMP et MPI

Transféré par

kaoutar

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

CRSNG-FONCER

Programme de formation en Génie Par Simulation

Introduction à la programmation parallèle

Avec OpenMP et MPI

Guillaume Emond

Polytechnique Montréal
Montréal, QC

Novembre 2016
Table des matières

1 Programmation parallèle

2 OpenMP
Directives
Clauses
Concurrences et synchronisation

3 MPI
Messages
Communications collectives

4 Conclusion

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 2 / 60

Programmation parallèle

Table des matières

1 Programmation parallèle

2 OpenMP
Directives
Clauses
Concurrences et synchronisation

3 MPI
Messages
Communications collectives

4 Conclusion

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 3 / 60

Programmation parallèle

Loi d’Amdahl

La loi d’Amdahl permet de calculer l’accélération théorique(A), obtenu en

parallélisant un programme séquentiel, selon le nombre de processeurs (n)
utilisés et la fraction parallélisable du code(p).
1
A= (1)
(1 − p) + p/n
Il s’agit toujours d’une borne supérieur de l’accélération réelle.

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 4 / 60

Programmation parallèle

API de parallélisation

3 niveaux de parallélisation
• Thread : PThread,PTh,TBB, openMP
• Processus : MPI, PVM, LINDA
• GPU : Cuda, openCL

Pourquoi openMP ou MPI ?

• OpenMP et MPI sont simples d’utilisation
• Ce sont les api les plus répendus dans le monde scientifique
• Gratuits et portables

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 5 / 60

Programmation parallèle

Processus

Un processus est un programme en

cours d’exécution qui est constitué
de :
• un numéro d’identification
• un espace d’adressage
• un état (Élu, Prêt, Bloqué)
• une priorité
• une liste d’instructions
(Compteur Ordinal)
• descripteurs de fichier Figure – Espace d’adressage d’un
processus

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 6 / 60

Programmation parallèle

Thread

• Un même processus a la
possibilité d’avoir plus d’un fil
d’exécution (stack).
• Ces fils d’exécution partagent
les ressources du processus.
• Chaque thread possède :
• un identificateur
• sa pile d’exécution
• son compteur ordinal
• un état
Figure – Multithreaded process

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 7 / 60

Programmation parallèle

Avantages threads vs processus

• Le partage des ressources entre threads est beaucoup plus facile et

efficace que pour les processus.

• Problèmes de concurrence des ressources.

• La création et les changements de contexte entre threads est

beaucoup plus rapide.

• Les threads ne s’appliquent pas aux architectures à mémoire

distribuée.

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 8 / 60

OpenMP

Table des matières

1 Programmation parallèle

2 OpenMP
Directives
Clauses
Concurrences et synchronisation

3 MPI
Messages
Communications collectives

4 Conclusion

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 9 / 60

OpenMP

Open Multi-Processing

• Programmation en mémoire partagée

• API C,C++ et Fortran.

• Disponible sur Linux, Unix, Mac OS X, Microsoft Windows et Solaris

(www.openmp.org)

• Permet de progressivement paralléliser un programme séquentiel sans

restructurer l’entièreté du programme.

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 10 / 60

OpenMP

Quelques modèles

Modèle d’éxecution Modèle de mémoire

• ”Fork-Join” • Variables partagées.
• Open mp consiste à insérer des • Variables privées.
blocs parallèles dans un
programme séquentiel.
• Possibilité d’avoir des régions
parallèles imbriquées.

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 11 / 60

OpenMP

Syntaxe

C/C++ : #pragma omp directive [clause]

Fortran : !$OMP DIRECTIVE [CLAUSE]
: !$OMP END DIRECTIVE [CLAUSE]

• Directives : parallel, for (parallel for), sections (parallel sections),

single, critical, atomic, master, target, simd...
• Clauses : shared, private, firstprivate, lasprivate, default, reduction,
copyin, if, ordered, schedule, nowait, safelen, linear, aligned,
collasped, device, map...
• Les clauses disponibles pour chaque directive peuvent changer.

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 12 / 60

OpenMP

Fonctions de support : threads

• omp (set/get) num threads : spécifie/retourne le nombre de threads.

• omp get max threads : retourne le nombre maximal possible de
threads.
• omp get thread num : retourne le numéro du thread courant.
• omp get num proc : retourne le nombre de processeurs disponibles.
• omp in parallel : pour savoir si on se trouve dans une région parallèle.
• omp get wtime : temps écoulé en secondes par thread.
• omp get wtick : temps écoulé en cycle d’horloge par thread.

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 13 / 60

OpenMP

Fonctions de support : threads

• omp (set/get) nested : permission d’avoir des régions parallèles

imbriquées.

• omp (set/get) set max active levels : profondeur maximale

d’imbrication

• omp get active level : retourne la profondeur courante de la région

parallèle imbriquée.

• omp stacksize : retourne la taille des piles pour les threads.

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 14 / 60

OpenMP Directives

Table des matières

1 Programmation parallèle

2 OpenMP
Directives
Clauses
Concurrences et synchronisation

3 MPI
Messages
Communications collectives

4 Conclusion

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 15 / 60

OpenMP Directives

Parallel

• Création des fils d’exécution au début de la section parallèle.

• Le nombre de threads créés est généralement spécifié dans la variable

d’environnement OMP NUM THREAD ou par défault (2 x core).

• Il y a une synchronisation à la fin de la section.

• Chaque thread exécute les instructions dans le bloc parallèle mais agit
différement selon son identificateur.

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 16 / 60

OpenMP Directives

Exemple : Parallel

// Hello World parallel

# include < stdio .h >

# include < omp .h >
int main ( int argc , char ** argv )
{
# pragma omp parallel
{
int rank = om p _g et _ th r ea d_ n um () ;
int size = o m p _ g et _ n u m _ t h r ea d s () ;
printf ( " Hello world ! I ’m % d of % d \ n " , rank , size ) ;
}
return 0;
}

export OMP NUM THREADS=4

gcc –fopenmp -o HelloWorld HelloWorld.c
./HelloWorld
Hello world ! I’m 0 of 4
Hello world ! I’m 1 of 4
Hello world ! I’m 3 of 4
Hello world ! I’m 2 of 4

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 17 / 60

OpenMP Directives

For

• Parallélisation d’une boucle for (si chaque itération est indépendante

des autres).

• Doit être appelé depuis un environnement parallèle ou avec omp

parallel for.

• Chaque thread s’occupe d’un sous-intervalle de la boucle.

• Plusieurs types de division des sous-domaines possibles : static,

dynamic, guided ou auto.

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 18 / 60

OpenMP Directives

Exemple : for

// f o n c t i o n e f f e c t u a n t la moyenne de chaque elements avec ses voisins directes

// output [1... n ]
// input [0... n ]

int p ar al l el Av erage ( double * output , const double * input , const int length )
{
# pragma omp parallel for
for ( int i =1; i < length -1; i ++) {
output [i -1] = ( input [i -1] + input [ i ] + input [ i +1]) /3;
}
return 0;
}

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 19 / 60

OpenMP Directives

Single et Sections

• Single permet d’encapsuler un bloc d’instructions qui ne sera exécuté

que par un seul thread.

• Sections permet de séparer des tâches différentes et de les exécuter

respectivement par 1 seul fil d’exécution.

• Le thread qui exécutera une section ou le single est aléatoire.

• La directive master permet de faire un single en garantissant que le

bloc sera exécuté par le thread parent (id=0).

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 20 / 60

OpenMP Directives

Exemple :Single et Sections

Sections Single
# pragma omp parallel { # pragma omp parallel {
function_0 () ; # pragma omp for
# pragma omp sections { /* bloc parallel 1 */
function_1 () ;
# pragma omp section { # pragma omp single {
function_2 () ; /* bloc s e q u e n t i e l */
} }
# prgma omp section {
function_3 () ; /* bloc parallel 2 */
function_4 () ; }
}
}
}

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 21 / 60

OpenMP Directives

Autres directives

• omp task
• omp taskloop
• omp taskloop simd
• omp simd / declare simd
• omp target / declare target
• omp teams
• etc...

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 22 / 60

OpenMP Clauses

Table des matières

1 Programmation parallèle

2 OpenMP
Directives
Clauses
Concurrences et synchronisation

3 MPI
Messages
Communications collectives

4 Conclusion

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 23 / 60

OpenMP Clauses

shared, private...

La portée des variables doit être définie pour chaque région parallèle.
• shared : une seule copie de la variable pour tous les threads.
• private : chaque thread possède une copie de la variable. La variable
visée est indéfinie avant et après la région.
• firstprivate : variable privée initialisée avec la valeur en entrée.
• lastprivate : la valeur de sortie est donnée par le thread qui effectue la
dernière itération de la boucle.
• copyprivate : permet de propager une variable d’une région single aux
autres threads

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 24 / 60

OpenMP Clauses

shared, private

// Produit Matrice - vecteur

# pragma omp parallel for default ( none ) private (i ,j , sum ) shared (m ,n ,a ,b , c )
for ( i =0; i < m ; i ++) {
sum = 0.0;
for ( j =0; j < n ; j ++)
sum += b [ i ][ j ]* c [ j ];
a [ i ] = sum ;
}

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 25 / 60

OpenMP Clauses

reduction

• Pour les boucles for. // faire une somme des elements d ’ un vecteur
.
double somme ( double * a , int size ) {
• Permet de spécifier une variable int i ;
double sum =0;
pour une réduction avec un # pragma omp parallel for private ( i )
reduction (+: sum )
opérateur commutatif et for ( i =0; i < size ; i ++) {
sum += a [ i ];
associatif. }
+, ∗, &&, k, }
return sum ;

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 26 / 60

OpenMP Clauses

collapse

• Dans un omp for, seule la première boucle est parallélisée.

• Avec la clause collapse, des boucles imbriquées seront considérées

comme une grande boucle.
// faire une somme des elements d ’ une matrice
double somme ( double * a , int width , int height ) {
int i , j ;
double sum =0;
# pragma omp parallel for private (i , j ) collapse (2) reduction (+: sum )
for ( i =0; i < size ; i ++) {
for ( j =0; j < size ; j ++)
sum += a [ i ][ j ];
}
return sum ;
}

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 27 / 60

OpenMP Clauses

• Le bloc parallèle attaché au if ne s’exécute que si la condition est

vraie.

• Dans le cas contraire, la région s’exécute en séquentiel.

• Si la taille du problème est petite, il est parfois préférable de rester en

séquentiel à cause du surcoût de opemMP.

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 28 / 60

OpenMP Clauses

nowait

• Permet d’enlever la barrière implicite à la fin d’un bloc. Ainsi

l’exécution de deux régions parallèles distinctes peuvent se
chevaucher.

• La directive omp barrier permet de synchroniser tous les threads de la

région.

# pragma parallel shared (a ,b ,c ,y , z )

{ # pragma omp for schedule ( static ) nowait
for ( int i =0; i < n ; i ++) c [ i ] = ( a [ i ] + b [ i ]) / 2.0;
# pragma omp for schedule ( static ) nowait
for ( int i =0; i < n ; i ++) z [ i ] = c [ i ]* c [ i ];
# pragma omp barrier ;
# pragma omp for schedule ( static ) nowait
for ( int i =1; i <= n ; i ++) y [ i ] = z [i -1] + a [ i ];
}

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 29 / 60

OpenMP Concurrences et synchronisation

Table des matières

1 Programmation parallèle

2 OpenMP
Directives
Clauses
Concurrences et synchronisation

3 MPI
Messages
Communications collectives

4 Conclusion

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 30 / 60

OpenMP Concurrences et synchronisation

Problème ? ? ?

# include < stdio .h >

# include < omp .h >
int main ( int argc , char ** argv ) {
int N = 100;
double a [ N ];
double total = 0;
for ( int i =0; i < N ; i ++) a [ i ]= i ;

# pragma omp parallel num_threads (4) {

# pragma omp for
for ( int i =0; i < N ; i ++) {
total += a [ i ]
}
}
return total ;
}

réponse actuelle : 3745

réponse attendue : 4950

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 31 / 60

OpenMP Concurrences et synchronisation

critical et atomic

Afin de régler un problème de concurrence, Il faut que l’accès aux données

ciblées soit protégé soit par des verrous ou en étant locales.

• #pragma omp critical [name] : # pragma omp parallel num_threads (4) {

int i , j ;
Une seule région critique du # pragma omp for
for ( i =0; i < N ; i ++) {
même nom peut s’exécuter en # pragma omp critial {
total += a [ i ]
même temps. Cette directive }
}

utilise des verrous afin de }

protéger la région. # pragma omp parallel num_threads (4) {

int i , j ;
• #pragma omp atomic {x # pragma omp for
for ( i =0; i < N ; i ++) {
operateur= expression} # pragma omp atomic {
total += a [ i ]
}
}
}

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 32 / 60

OpenMP Concurrences et synchronisation

Quelques conseils

• Attention aux problèmes de concurrence. S’assurer que les fonctions

appelées sont ”thread safe”

• Choisir des morceaux assez gros pour minimiser le surcoût mais assez
petits pour équilibrer le travail de chaque thread.

• Attention à l’odre des indices lors du parcours de matrice.

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 33 / 60

MPI

Table des matières

1 Programmation parallèle

2 OpenMP
Directives
Clauses
Concurrences et synchronisation

3 MPI
Messages
Communications collectives

4 Conclusion

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 34 / 60

MPI

Message Passing Interface

• Ce n’est pas une librairie mais un standard. Il exite plusieurs

implémentations différentes (openMPI, MPICH, MVAPICH, IBM
MPI, etc...)

• Habituellement supporté en C,C++ et Fortran et sur la plupart des

systèmes d’exploitations.

• Programmation sur architechture à mémoire distribuée.

• Un programme MPI est constitué de processus autonomes qui

exécutent leur code respectif (MIMD) dans leur espace d’adressage
respectif. MPI est un environnment servant uniquement à la
communication entre ces processus.

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 35 / 60

MPI

Syntaxe

C/C++ : ierr = MPI Xxxx(parametre1, ...)

ierr = MPI Bsend(&buf,count,type,dest,tag,comm)

Fortran : MPI XXXX(parametre1, ..., ierr)

MPI BSEND(&buf,count,type,dest,tag,comm,ierr)

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 36 / 60

MPI

Fonctions de base

• MPI INIT : initialisation de l’environnment MPI. Il ne doit être appelé

qu’une seule fois dans le programme.

• MPI FINALIZE : terminaison des communications.

• MPI COMM RANK : retourne le numéro du processus.

• MPI COMM SIZE : retourne le nombre de processus dans le

communicateur (MPI COMM WORLD).

• MPI ABORD : terminaison de tous les processus MPI.

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 37 / 60

MPI

Hello World MPI

mpiexec ./HelloWorldMPI.c -np 4

# include " mpi . h "

# include < stdio .h >
int main ( argc , argv ) {
int rank , size ;
MPI_Init ( & argc , & argv ) ;
MPI_Comm_rank ( MPI_COMM_WORLD , & rank ) ;
MPI_Comm_size ( MPI_COMM_WORLD , & size ) ;
printf ( " Hello world ! I ’m % d of % d \ n " , rank , size ) ;
MPI_Finalize () ;
return 0;
}

Hello world ! I’m 3 of 4

Hello world ! I’m 2 of 4
Hello world ! I’m 0 of 4
Hello world ! I’m 1 of 4

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 38 / 60

MPI Messages

Table des matières

1 Programmation parallèle

2 OpenMP
Directives
Clauses
Concurrences et synchronisation

3 MPI
Messages
Communications collectives

4 Conclusion

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 39 / 60

MPI Messages

Contenu d’un message

Le contenu
• buffer : adresse de la variable qui est envoyée ou qui recevra les
données.
• count : nombre d’éléments dans le buffer
• datatype : type de la donnée passée dans le message. Il ne peut y en
avoir qu’un seul par message. Le système peut effectuer des
conversions si nécessaire.

L’enveloppe
• source : L’identificateur de l’envoyeur.
• dest : L’identificateur du receveur.
• tag : Valeur entière identifiant le message (possibilité de wildcard à la
réception : MPI ANY TAG).
• communicateur : Communicateur de l’envoyeur et du receveur.
• status : objet status indiquant l’état du message (pour la gestion des
erreurs).
G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 40 / 60
MPI Messages

Exemple de communication

# include " mpi . h "

int main ( int argc , char * argv [])
{
char message [20];
int myrank ;
MPI_Status status ;
MPI_Init ( & argc , & argv ) ;
MPI_Comm_rank ( MPI_COMM_WORLD , & myrank ) ;

if ( myrank == 0) { /* code for process zero */

strcpy ( message , " Hello , there " ) ;
MPI_Send ( message , strlen ( message ) , MPI_CHAR , 1 , 99 , MPI_COMM_WORLD ) ;
}
else if ( myrank == 1) { /* code for process one */
MPI_Recv ( message , 20 , MPI_CHAR , 0 , 99 , MPI_COMM_WORLD , & status ) ;
printf ( " received :% s :\ n " , message ) ;
}

MPI_Finalize () ;
return 0;
}

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 41 / 60

MPI Messages

Mode de communication

Standard, Buffered, Synchronous, Ready

• MPI XSEND(buf,count,datatype,dest,tag,comm)
1. MPI SEND : peut se comporter comme un BSEND ou SSEND selon le
choix de MPI.
2. MPI BSEND : termine lorsque le message est complètement copié dans
un tampon.
3. MPI SSEND : termine lorsqu’un RECV correspondant est appelé.
4. MPI RSEND : ne peut être appelé que si un RECV correspondant est
en attente.
• MPI RECV(buf,count,datatype,source,tag,comm,status)
Termine lorsque le message est totalement copié. Un RECV peut terminer
avant le SEND.

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 42 / 60

MPI Messages

interblocage

// EXEMPLE 1
MPI_Comm_rank ( comm , & rank )
if ( rank ==0) {
MPI_Bsend ( sendbuf , count , MPI_DOUBLE , 1 , tag1 , comm )
MPI_Ssend ( sendbuf , count , MPI_DOUBLE , 1 , tag2 , comm )
}
elseif ( rank ==1) {
MPI_Recv ( recvbuf , count , MPI_DOUBLE , 0 , tag2 , comm , status )
MPI_Recv ( recvbuf , count , MPI_DOUBLE , 0 , tag1 , comm , status )
}

// EXEMPLE 2
MPI_Comm_rank ( comm , & rank )
if ( rank ==0) {
MPI_Send ( sendbuf , count , MPI_REAL , 1 , tag , comm )
MPI_Recv ( recvbuf , count , MPI_REAL , 1 , tag , comm , status )
}
elseif ( rank ==1) {
MPI_Send ( sendbuf , count , MPI_REAL , 0 , tag , comm )
MPI_Recv ( recvbuf , count , MPI_REAL , 0 , tag , comm , status )
}

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 43 / 60

MPI Messages

SendReceive

On combine les appels send et receive afin de simplifier les échanges de

message.Cela évite les risque d’interblocages.

• MPI SENDRECV(sendbuf,sendcount,sendtype,dest,sendtag,
recvbuf,recvcount,recvtype,source,recvtag,comm,status)

• MPI SENDRECV REPLACE(buf,count,datatype,dest,sendtag,

source,recvtag,comm,status)

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 44 / 60

MPI Messages

Exemple : SendRecv
intrank , size ;
MP I _ s t a t u s s t a tus ;
floatrp [2048] , rs [2048] , rc [2048];
...
for ( t =0; t < max_time ; t ++) {
if ( rank < ( size -1) {
MPI_Sendrecv ( rc ,2048 , MPI_FLOAT , rank +1 ,1 , rs ,2048 , MPI_FLOAT , rank +1 ,0 , MPI_COMM_WORLD ) ;
}
if ( rank > 0) {
MPI_Sendrecv ( rc ,2048 , MPI_FLOAT , rank -1 ,0 , rp ,2048 , MPI_FLOAT , rank -1 ,1 , MPI_COMM_WORLD ) ;
}
itere_chaleur ( rp , rs , rc )
}

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 45 / 60

MPI Messages

Exemple : SendRecv
intrank , size ;
MPI_status status ;
float rp [2048] , rs [2048] , rc [2048];
...
for ( t =0; t < max_time ; t ++) {
if ( rank ==0) {
MPI_Sendrecv ( rc ,2048 , MPI_FLOAT , rank +1 ,1 , rs ,2048 , MPI_FLOAT , rank +1 ,0 , MPI_COMM_WORLD ) ;
itere_chaleur ( NULL , rs , rc )
}
elseif ( rank ==( size -1) ) {
MPI_Sendrecv ( rc ,2048 , MPI_FLOAT , rank -1 ,0 , rp ,2048 , MPI_FLOAT , rank -1 ,1 , MPI_COMM_WORLD ) ;
itere_chaleur ( rp , NULL , rc )
} else {
if ( rank %2) { // noeud impaire
MPI_Sendrecv ( rc ,2048 , MPI_FLOAT , rank -1 ,0 , rp ,2048 , MPI_FLOAT , rank -1 ,1 ,
MPI_COMM_WORLD ) ;
MPI_Sendrecv ( rc ,2048 , MPI_FLOAT , rank +1 ,2 , rs ,2048 , MPI_FLOAT , rank +1 ,3 ,
MPI_COMM_WORLD ) ;
}
else { // noeud paire
MPI_Sendrecv ( rc ,2048 , MPI_FLOAT , rank +1 ,1 , rs ,2048 , MPI_FLOAT , rank +1 ,0 ,
MPI_COMM_WORLD ) ;
MPI_Sendrecv ( rc ,2048 , MPI_FLOAT , rank -1 ,3 , rs ,2048 , MPI_FLOAT , rank -1 ,2 ,
MPI_COMM_WORLD ) ;
}
itere_chaleur ( rp , rs , rc )
}
}

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 46 / 60

MPI Messages

Exemple : SendRecv

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 47 / 60

MPI Messages

Communication non-bloquante

Les opérations SEND et RECV sont séparées en deux appels. Le premier

permet de commencer la communication sans attendre que l’écriture ou la
lecture soit terminée. Le second permet de savoir quand l’opération est
terminée. Cela permet de superposer les communications et les calculs.
• MPI IXSEND(buf,count,datatype,dest,tag,comm,request)
• MPI IRECV(buf,count,datatype,source,tag,comm,request)

L’objet request contient des informations sur le mode de communication,

sur l’enveloppe et le status de la communication

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 48 / 60

MPI Messages

Communication non-bloquante

Pour compléter une communication, on utilise les commandes suivantes :

• MPI WAIT(request,status)
• MPI WAITANY(count,array of request,index,status)
• MPI WAITALL(count,array of request,array status)
• MPI WAITSOME(incount,array request,outcount,
array index,array status)

• MPI TEST(request,flag,status)
• MPI TESTANY(count,array of request,index,flag,status)
• MPI TESTALL(count,array of request,flag,array status)
• MPI TESTSOME(incount,array request,outcount,
array index,array status)

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 49 / 60

MPI Messages

Exemple : communication non-bloquante

// C o m m u n i c a t i o n c i r c u l a i r e

# include < stdio .h >

# include " mpi . h "
int main ( int argc , char * argv []) {
int numtasks , rank , next , prev , buf [2] , tag1 =1 , tag2 =2;
MPI_Request reqs [4];
MPI_Status stats [4];
MPI_Init (& argc ,& argv ) ;
MPI_Comm_size ( MPI_COMM_WORLD , & numtasks ) ;
MPI_Comm_rank ( MPI_COMM_WORLD , & rank ) ;

prev = rank -1; next = rank +1;

if ( rank == 0) prev = numtasks - 1;
if ( rank == ( numtasks - 1) ) next = 0;
MPI_Irecv (& buf [0] , 1 , MPI_INT , prev , tag1 , MPI_COMM_WORLD , & reqs [0]) ;
MPI_Irecv (& buf [1] , 1 , MPI_INT , next , tag2 , MPI_COMM_WORLD , & reqs [1]) ;

MPI_Isend (& rank , 1 , MPI_INT , prev , tag2 , MPI_COMM_WORLD , & reqs [2]) ;
MPI_Isend (& rank , 1 , MPI_INT , next , tag1 , MPI_COMM_WORLD , & reqs [3]) ;

MPI_Waitall (4 , reqs , stats ) ;

printf ( " Task % d communicated with tasks % d & % d \ n " , rank , prev , next ) ;
MPI_Finalize () ;
}

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 50 / 60

MPI Communications collectives

Table des matières

1 Programmation parallèle

2 OpenMP
Directives
Clauses
Concurrences et synchronisation

3 MPI
Messages
Communications collectives

4 Conclusion

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 51 / 60

MPI Communications collectives

communications collectives

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 52 / 60

MPI Communications collectives

Communications collectives

• MPI BCAST(buf,count,datatype,root,comm)
• MPI GATHER(sendbuf,sendcount,sendtype,
recvbuf,recvcount,recvtype,root,comm)
• MPI SCATTER(sendbuf,sendcount,sendtype,
recvbuf,recvcount,recvtype,root,comm)
• MPI ALLGATHER(sendbuf,sendcount,sendtype,
recvbuf,recvcount,recvtype,comm)
• MPI ALLTOALL(sendbuf,sendcount,sendtype,
recvbuf,recvcount,recvtype,comm)

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 53 / 60

MPI Communications collectives

Réduction

Possibilité de faire une réduction avec des opérations prédéfinies ou

définies par l’usager(MPI OP CREATE).
• MPI REDUCE(sendbuf,recvbuf,count,datatype,op,root,comm)
• MPI ALLREDUCE(sendbuf,recvbuf,count,datatype,op,comm)
Les opérations prédéfinies sont :
MAX,MIN,SUM,PROD,LAND,BAND,LOR,BOR,LXOR,BXOR,MAXLOC
et MINLOC

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 54 / 60

MPI Communications collectives

Exemple : calcul de pi

// genere c o o r d o n n e e x et y
void random_coord ( double * x , double * y )

int main ( int argc , char * argv []) {

int rank , size , ierr ;
MPI_Status status ;
int root = 0;

double N_try = 100000

double hit_local =0;
double hit_total = 0;

ierr = MPI_Init (& argc ,& argv ) ;

ierr = MPI_Comm_size ( MPI_COMM_WORLD ,& size ) ;
ierr = MPI_Comm_rank ( MPI_COMM_WORLD ,& rank ) ;
Figure – Calcul de
for ( int i =0; i < N_try ; i ++) {
double x ,y , norm ; pi
random_coord (& x ,& y ) ;

norm = x * x + y * y
if ( norm < 1) { hit_local ++}
}
ierr = MPI_Reduce (& hit_local ,& hit_total ,1 , MPI_DOUBLE ,
MPI_SUM , root , MPI_COMM_WORLD )
if ( rank == root ) {
double pi = 4* hit_total / N_try ;
}
ierr = MPI_Finalize () ;
return 0;
G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 55 / 60
MPI Communications collectives

Autre type d’opération globale

• MPI REDUCE SCATTER(sendbuf,recvbuf,recvcount,

datatype,op,comm) : redistribue le résultat de la réduction
• MPI SCAN(sendbuf,recvbuf,count,datatype,op,comm) : réduction
avec préfixe
• MPI EXSCAN(sendbuf,recvbuf,count,datatype,op,comm)
• MPI BARRIER(comm)

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 56 / 60

MPI Communications collectives

Les points importants

• Attention aux situations d’interblocage.

• Les communications non bloquantes permettent d’effectuer des
calculs en même temps.
• S’assurer que les communications sont parallèles (si possible)

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 57 / 60

Conclusion

Table des matières

1 Programmation parallèle

2 OpenMP
Directives
Clauses
Concurrences et synchronisation

3 MPI
Messages
Communications collectives

4 Conclusion

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 58 / 60

Conclusion

À retenir !

• La loi d’Amdhal.
• La différence entre un thread et un processus.
• OpenMP crée des groupes de threads afin d’insérer des blocs
parallèles dans un code.
• MPI est un standard de communication inter-processus.
• Faites attention aux problèmes de concurrence et aux situations
d’interblocages.
• Une panoplie de tutoriels sur openMPI et MPI sont disponibles sur
internet.
• On retrouve les documentations officielles aux adresses suivantes :
- www.openmp.org
- mpi-forum.org

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 59 / 60

Conclusion

questions ?

G. Emond (PolyMtl) GPS-OpenMP/MPI 2016 60 / 60

Vous aimerez peut-être aussi

OpenMP Cours
Pas encore d'évaluation
OpenMP Cours
45 pages
Open MP
Pas encore d'évaluation
Open MP
85 pages
Bastoul Cours Openmp PDF
Pas encore d'évaluation
Bastoul Cours Openmp PDF
90 pages
Chapitre 5 Introduction À OpenMP
Pas encore d'évaluation
Chapitre 5 Introduction À OpenMP
3 pages
ARCH3 - Chapitre 6 - Architectures Multicoeurs - Parie 2
Pas encore d'évaluation
ARCH3 - Chapitre 6 - Architectures Multicoeurs - Parie 2
66 pages
Introduction à OpenMP pour Ingénieurs
Pas encore d'évaluation
Introduction à OpenMP pour Ingénieurs
37 pages
IATIC4 FBC CM3 v1.0
Pas encore d'évaluation
IATIC4 FBC CM3 v1.0
100 pages
Idris Openmp
Pas encore d'évaluation
Idris Openmp
121 pages
Programmation Parallele Et Distribuee - OpenMP
Pas encore d'évaluation
Programmation Parallele Et Distribuee - OpenMP
95 pages
Livre Openmp
Pas encore d'évaluation
Livre Openmp
157 pages
2-Atelier PROGPARA - TP2-OpenMP-23-24
Pas encore d'évaluation
2-Atelier PROGPARA - TP2-OpenMP-23-24
3 pages
FlashInformatique 32007
Pas encore d'évaluation
FlashInformatique 32007
12 pages
DD1 Bases Openmp
Pas encore d'évaluation
DD1 Bases Openmp
75 pages
Cours Parallelisme
Pas encore d'évaluation
Cours Parallelisme
100 pages
Cours 04
Pas encore d'évaluation
Cours 04
53 pages
OpenMP Cours
Pas encore d'évaluation
OpenMP Cours
88 pages
Introduction à OpenMP et Parallélisme
Pas encore d'évaluation
Introduction à OpenMP et Parallélisme
38 pages
Cours MPI
Pas encore d'évaluation
Cours MPI
21 pages
Optimisation OpenMP pour Calculs Parallèles
Pas encore d'évaluation
Optimisation OpenMP pour Calculs Parallèles
12 pages
Introduction à OpenMP et parallélisation
100% (1)
Introduction à OpenMP et parallélisation
13 pages
Parallelisme II TP 1 2019 2020
Pas encore d'évaluation
Parallelisme II TP 1 2019 2020
4 pages
TPs PDF
Pas encore d'évaluation
TPs PDF
18 pages
Programmation Parallèle: OpenMP & MPI
Pas encore d'évaluation
Programmation Parallèle: OpenMP & MPI
87 pages
TP14
Pas encore d'évaluation
TP14
9 pages
TP Parallélisme
Pas encore d'évaluation
TP Parallélisme
7 pages
TP11
Pas encore d'évaluation
TP11
9 pages
Introduction à OpenMP en C
Pas encore d'évaluation
Introduction à OpenMP en C
2 pages
TP2 Openmp
Pas encore d'évaluation
TP2 Openmp
3 pages
Optimisation du Parallélisme en C/C++
Pas encore d'évaluation
Optimisation du Parallélisme en C/C++
118 pages
Parallélisation avec OpenMP : TP1
Pas encore d'évaluation
Parallélisation avec OpenMP : TP1
4 pages
Les Langage de Programation Paralléle PDF
Pas encore d'évaluation
Les Langage de Programation Paralléle PDF
11 pages
Introduction à la programmation MPI
Pas encore d'évaluation
Introduction à la programmation MPI
52 pages
OpenMp - Directive
Pas encore d'évaluation
OpenMp - Directive
12 pages
Page de Garde
Pas encore d'évaluation
Page de Garde
10 pages
Correction Du TP Avancé Reduction
Pas encore d'évaluation
Correction Du TP Avancé Reduction
4 pages
Algorithme de Vigenère en Parallèle
Pas encore d'évaluation
Algorithme de Vigenère en Parallèle
53 pages
Presentation Open MP Et MPI
Pas encore d'évaluation
Presentation Open MP Et MPI
32 pages
Cours - Systèmes Parallèles-2
Pas encore d'évaluation
Cours - Systèmes Parallèles-2
76 pages
Synchronisation openMP
Pas encore d'évaluation
Synchronisation openMP
9 pages
Architectures et Programmation Parallèle
Pas encore d'évaluation
Architectures et Programmation Parallèle
67 pages
Programmation Parallèle: OpenMP et MPI
Pas encore d'évaluation
Programmation Parallèle: OpenMP et MPI
82 pages
Exercices OpenMPI
Pas encore d'évaluation
Exercices OpenMPI
22 pages
Exapro
Pas encore d'évaluation
Exapro
7 pages
Programmation parallèle avec MPI
Pas encore d'évaluation
Programmation parallèle avec MPI
52 pages
Open MP
Pas encore d'évaluation
Open MP
2 pages
Cours Mpi
Pas encore d'évaluation
Cours Mpi
47 pages
Introduction aux Threads et Processus Légers
Pas encore d'évaluation
Introduction aux Threads et Processus Légers
5 pages
Parallélisation d'algorithmes avec OpenMP et Boost
Pas encore d'évaluation
Parallélisation d'algorithmes avec OpenMP et Boost
31 pages
Pour Réaliser Ce TP Élémentaire Sur OpenMP Avec Le Langage C
Pas encore d'évaluation
Pour Réaliser Ce TP Élémentaire Sur OpenMP Avec Le Langage C
3 pages
TP Acc 2025
Pas encore d'évaluation
TP Acc 2025
4 pages
Travaux Pratiques Élémentaires Réduction
Pas encore d'évaluation
Travaux Pratiques Élémentaires Réduction
3 pages
Introduction à la Programmation Parallèle
Pas encore d'évaluation
Introduction à la Programmation Parallèle
45 pages
Theorie Threads Slides
Pas encore d'évaluation
Theorie Threads Slides
168 pages
Cours Calculateurs L2 Info
Pas encore d'évaluation
Cours Calculateurs L2 Info
85 pages
Examen de Calcul Parallèle M2-RSD
100% (1)
Examen de Calcul Parallèle M2-RSD
2 pages
Introduction au Multiprocessing avec MPI
Pas encore d'évaluation
Introduction au Multiprocessing avec MPI
56 pages
PPD-DS 2020
Pas encore d'évaluation
PPD-DS 2020
6 pages
Parallelisme
Pas encore d'évaluation
Parallelisme
41 pages
Modélisation et Contrôle de l'Éolienne 2.0
Pas encore d'évaluation
Modélisation et Contrôle de l'Éolienne 2.0
85 pages
Chapitre 3
Pas encore d'évaluation
Chapitre 3
54 pages
Introduction À La Programmation - Syllab - 2015
Pas encore d'évaluation
Introduction À La Programmation - Syllab - 2015
112 pages
53-Article Text-140-2-10-20210602-1
Pas encore d'évaluation
53-Article Text-140-2-10-20210602-1
10 pages
TP Automatisme 1° GIM 2013-14
Pas encore d'évaluation
TP Automatisme 1° GIM 2013-14
20 pages
Introduction à Matlab pour Graphiques
Pas encore d'évaluation
Introduction à Matlab pour Graphiques
7 pages
4 TP Timer PDF
Pas encore d'évaluation
4 TP Timer PDF
5 pages
Guide Flowcode pour PIC16F877A
Pas encore d'évaluation
Guide Flowcode pour PIC16F877A
35 pages
Transformé de Hough
Pas encore d'évaluation
Transformé de Hough
20 pages
Régulation d'air comprimé sur tank APV
100% (1)
Régulation d'air comprimé sur tank APV
75 pages
Projets de Stations d'Épuration en Bretagne
Pas encore d'évaluation
Projets de Stations d'Épuration en Bretagne
15 pages
TP Auto Percage
100% (1)
TP Auto Percage
21 pages
Mémoire PFE
Pas encore d'évaluation
Mémoire PFE
79 pages
Machines A Etats VHDL
Pas encore d'évaluation
Machines A Etats VHDL
12 pages
1 Adapter
Pas encore d'évaluation
1 Adapter
2 pages
Optimisation Datalog : Sets Magiques
Pas encore d'évaluation
Optimisation Datalog : Sets Magiques
43 pages
Fonctions de Groupes SQL Avancées
100% (1)
Fonctions de Groupes SQL Avancées
27 pages
TD N°1 - Algorithmique: Objectif
Pas encore d'évaluation
TD N°1 - Algorithmique: Objectif
5 pages
Ihm (C#)
Pas encore d'évaluation
Ihm (C#)
2 pages
Cours Labview
Pas encore d'évaluation
Cours Labview
43 pages
Larp
Pas encore d'évaluation
Larp
7 pages
03 TD Ordonnancement-Corr
Pas encore d'évaluation
03 TD Ordonnancement-Corr
4 pages
TP1 Prise en Main Spyder
Pas encore d'évaluation
TP1 Prise en Main Spyder
6 pages
Correction - TP4 - Processus Et Parallelisme 1
Pas encore d'évaluation
Correction - TP4 - Processus Et Parallelisme 1
3 pages
Programmation avec mBot2 : Guide Pratique
Pas encore d'évaluation
Programmation avec mBot2 : Guide Pratique
3 pages
TP de PL/SQL et Gestion de Données
Pas encore d'évaluation
TP de PL/SQL et Gestion de Données
11 pages
TD - TP Cours Javascriptinf 482 2022-2023
Pas encore d'évaluation
TD - TP Cours Javascriptinf 482 2022-2023
8 pages
Programmation CNC FANUC : Guide Pratique
100% (1)
Programmation CNC FANUC : Guide Pratique
20 pages
Controle 22 23 Corrige
Pas encore d'évaluation
Controle 22 23 Corrige
10 pages
Turbo Pascal 7 : Guide des chaînes
Pas encore d'évaluation
Turbo Pascal 7 : Guide des chaînes
3 pages
Examen Blanc C 24 25
Pas encore d'évaluation
Examen Blanc C 24 25
5 pages
Chapitre 3 Techniques Algorithmiques
Pas encore d'évaluation
Chapitre 3 Techniques Algorithmiques
77 pages
Super - Cours - KHAMMARI Mohammed - Administration de Bases de Données
Pas encore d'évaluation
Super - Cours - KHAMMARI Mohammed - Administration de Bases de Données
73 pages
Examen STIC L1 : Systèmes d'exploitation
100% (1)
Examen STIC L1 : Systèmes d'exploitation
4 pages
Projet Big Data : Apache Ambari
Pas encore d'évaluation
Projet Big Data : Apache Ambari
9 pages
Modélisation multi-physique avec MATLAB
100% (1)
Modélisation multi-physique avec MATLAB
7 pages
Exercices de Programmation C pour BAC1 ESI
Pas encore d'évaluation
Exercices de Programmation C pour BAC1 ESI
117 pages
02-Chapitre II Fichiers 19 11
Pas encore d'évaluation
02-Chapitre II Fichiers 19 11
7 pages
Programmation en C
Pas encore d'évaluation
Programmation en C
73 pages
Cours TypeScript
100% (5)
Cours TypeScript
67 pages
SIEMENS: Niveau 1 - TIA PORTAL - Fonctions de Base Et Diagnostic Sur Automates Siemens Simatic S7 1200/1500 Et S7 300/400 Avec Logiciel TIA Portal
Pas encore d'évaluation
SIEMENS: Niveau 1 - TIA PORTAL - Fonctions de Base Et Diagnostic Sur Automates Siemens Simatic S7 1200/1500 Et S7 300/400 Avec Logiciel TIA Portal
2 pages
Chap 4
Pas encore d'évaluation
Chap 4
23 pages
Cours Java - Chapitre 3 PDF
Pas encore d'évaluation
Cours Java - Chapitre 3 PDF
16 pages
Cours Excel Vba
Pas encore d'évaluation
Cours Excel Vba
8 pages