Théorie des Jeux et Stratégies Managériales
Mohammed Said RADJEF
Master 2 MOAD
Unité de Recherche LaMOS
Département de Recherche Opérationnelle
Faculté des Sciences Exactes
Université Abderrahmane Mira de Béjaia
Année universitaire 2024-2025
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Introduction
Ce cours est une suite au cours introductif de la théorie des jeux
(Master 1) qui offre des outils de :
modélisation et
d’analyse
des interactions stratégiques de preneurs de décisions agissant dans
un environnement commun.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Introduction
La théorie des jeux étudie plus généralement le comportement
stratégique d’individus dans des contextes économiques, sociaux,
politiques et militaires.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Introduction
Ce cours développe à la fois des éléments de la théorie générale et
donne des applications dans des domaines aussi divers que la
finance, le marketing, le sport, les échanges internationaux, la
biologie et les sciences politiques.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Introduction
La théorie des jeux partage avec la recherche opérationnelle
l’approche d’optimisation.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Introduction
Elle part du principe que les agents, dans une interaction
stratégique, choisissent leurs stratégies qui sont en en concordance
avec leurs intérêts (hypothèse de rationalité individuelle).
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Introduction
Elle part du principe que les agents, dans une interaction
stratégique, choisissent leurs stratégies qui sont en en concordance
avec leurs intérêts (hypothèse de rationalité individuelle).
D’autre part, il y a l’hypothèse d’apprentissage ou d’évolution
basée sur le fait que le choix des individus est exercé et appris au
cours des interactions répétées.
Par conséquent, comme dans le jeu des echecs, les joueurs sont
supposés être capables de trouver des stratégies optimales, soit à
travers le calcul, soit en apprenant par répétition.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Introduction
Dans le cas d’une entreprise, le management stratégique étudie,
entre autres,
le marché sur lequel l’entreprise se positionne,
la concurrence
les stratégies à mettre en oeuvre pour atteindre ses objectifs.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Introduction
Dans le cas d’une entreprise, le management stratégique étudie,
entre autres,
le marché sur lequel l’entreprise se positionne,
la concurrence
les stratégies à mettre en oeuvre pour atteindre ses objectifs.
Toutes les décisions et les actions qu’une entreprise sera amenée à
prendre auront un impact vital pour sa survie.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Introduction
Dans ce cours, nous nous limitons donc à la présentation des
éléments les plus simples de la théorie des jeux en nous appuyant
au maximum sur des exemples tirés de la gestion stratégique dans
l’économie industrielle.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu sous forme normale
Considérons un jeu sous forme normale
Γ = ⟨ I , {Xi }i∈I , {fi }i∈I ⟩. (1)
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu sous forme normale
Considérons un jeu sous forme normale
Γ = ⟨ I , {Xi }i∈I , {fi }i∈I ⟩. (2)
où
✓ I = {1, 2, . . . , N} avec N ≥ 2 - l’ensemble des joueurs ;
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu sous forme normale
Considérons un jeu sous forme normale
Γ = ⟨ I , {Xi }i∈I , {fi }i∈I ⟩. (3)
où
✓ I = {1, 2, . . . , N} avec N ≥ 2 - l’ensemble des joueurs ;
✓ Xi l’ensemble des stratégies (actions, alternatives, décisions)
du joueur i ∈ I ;
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu sous forme normale
Considérons un jeu sous forme normale
Γ = ⟨ I , {Xi }i∈I , {fi }i∈I ⟩. (4)
où
✓ I = {1, 2, . . . , N} avec N ≥ 2 - l’ensemble des joueurs ;
✓ Xi l’ensemble des stratégies (actions, alternatives, décisions)
du joueur i ∈ I ;
Q
✓ X = i∈I Xi est l’ensemble des issues x = (x1 , . . . , xN ) du
jeu ;
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu sous forme normale
Considérons un jeu sous forme normale
Γ = ⟨ I , {Xi }i∈I , {fi }i∈I ⟩. (5)
où
✓ I = {1, 2, . . . , N} avec N ≥ 2 - l’ensemble des joueurs ;
✓ Xi l’ensemble des stratégies (actions, alternatives, décisions)
du joueur i ∈ I ;
Q
✓ X = i∈I Xi est l’ensemble des issues x = (x1 , . . . , xN ) du
jeu ;
✓ fi (.) : X → R - la fonction des gains du joueur i ∈ I ; ∀i ∈ I .
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Equilibre de Nash
Un équilibre de Nash est une issue du jeu Γ où aucun joueur ne
souhaite modifier unilatéralement sa stratégie.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Equilibre de Nash
Un équilibre de Nash est une issue du jeu Γ où aucun joueur ne
souhaite modifier unilatéralement sa stratégie
Definition
Une issue x ∗ ∈ X est un équilibre de Nash du jeu Γ, si
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Equilibre de Nash
Un équilibre de Nash est une issue du jeu Γ où aucun joueur ne
souhaite modifier unilatéralement sa stratégie.
Definition
Une issue x ∗ ∈ X est un équilibre de Nash du jeu Γ, si
∀i ∈ I , ∀yi ∈ Xi , fi (x ∗ ) ≥ fi (yi , x−i
∗
), (6)
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Equilibre de Nash
Un équilibre de Nash est une issue du jeu Γ où aucun joueur ne
souhaite modifier unilatéralement sa stratégie.
Definition
Une issue x ∗ ∈ X est un équilibre de Nash du jeu Γ, si
∀i ∈ I , ∀yi ∈ Xi , fi (x ∗ ) ≥ fi (yi , x−i
∗
),
ou ce qui est équivalent
∗ , x ∗ , x ∗ , ..., x ∗ ) ≥
∀i ∈ I , ∀yi ∈ Xi , fi (x1∗ , x2∗ , ..., xi−1 i i+1 N
≥ fi (x1∗ ,∗2 , ..., xi−1
∗ ∗
, yi , xi+1 , ..., xN∗ )
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Considérons le jeu sous forme normale, où
✓ I = {1, 2} ;
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Considérons le jeu sous forme normale, où
✓ I = {1, 2} ;
✓ X1 = {x11 = T , x12 = C } ; X2 = {x21 = T , x22 = C }
T - décision ”trahir” ; C - décision ”coopérer” ;
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Considérons le jeu sous forme normale, où
✓ I = {1, 2} ;
✓ X1 = {x11 = T , x12 = C } ; X2 = {x21 = T , x22 = C } ;
✓ f1 (x11 , x21 ) = 1 = f2 (x11 , x21 ) ; f1 (x12 , x22 ) = 2 = f2 (x12 x22 ) ;
f1 (x11 , x22 ) = 3; f2 (x11 , x22 ) = 0 ;
f1 (x12 , x21 ) = 0; f2 (x12 , x21 ) = 3.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu sous forme normale
Considérons le jeu sous forme normale, où
✓ I = {1, 2} ;
✓ X1 = {x11 = T , x12 = C } ; X2 = {x21 = T , x22 = C } ;
✓ f1 (x11 , x21 ) = 1 = f2 (x11 , x21 ) ; f1 (x12 , x22 ) = 2 = f2 (x12 x22 ) ;
f1 (x11 , x22 ) = 3; f2 (x11 , x22 ) = 0 ;
f1 (x12 , x21 ) = 0; f2 (x12 , x21 ) = 3
Ainsi la forme normale s’écrit :
⟨ I , {Xi }i∈I , {fi }i∈I ⟩.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Le jeu peut s’écrire sous forme bimatricielle (et constitue le jeu du
dilemme du prisonnier modifié)
P2
x21 x22
(7)
P1 x11 (1,1) (3,0)
x12 (0,3) (2,2)
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Les deux joueurs (P1) et (P2) ont le choix entre coopérer (C) ou
trahir (T).
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Les deux joueurs (P1) et (P2) ont le choix entre coopérer (C) ou
trahir (T).
Le comportement égoı̈ste conduirait le joueur (P1) à raisonner de
la manière suivante :
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Les deux joueurs (P1) et (P2) ont le choix entre coopérer (C) ou
trahir (T).
Le comportement égoı̈ste conduirait le joueur (P1) à raisonner de
la manière suivante :
✓ Si le joueur (P2) trahit en jouant x21 , le joueur (P1) a le choix
entre ”trahir” (jouer x11 ) et gagner 1 ou coopérer (jouer x12 )
et gagner 0. Naturellement, il choisirait ”trahir” (jouer x11 ).
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Les deux joueurs (P1) et (P2) ont le choix entre coopérer (C) ou
trahir (T). Le comportement égoı̈ste conduirait le joueur (P1) à
raisonner de la manière suivante :
✓
✓ Si le joueur (P2) trahit, le joueur (P1) a le choix entre
”trahir” (jouer x11 ) et gagner 1 ou coopérer (jouer x12 ) et
gagner 0. Naturellement, il choisirait ”trahir” (jouer x11 ).
✓ Si le joueur (P2) coopère (jouer (jouer x22 ), le joueur (P1) a
le choix entre ”trahir” (jouer x11 ) et gagner 3 ou coopérer
(jouer x12 ) et gagner 2. Naturellement, il choisirait ”trahir”
(jouer x11 ).
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Les deux joueurs (P1) et (P2) ont le choix entre coopérer (C) ou
trahir (T). Le comportement égoı̈ste conduirait le joueur (P1) à
raisonner de la manière suivante :
✓ Si le joueur (P2) trahit, le joueur (P1) a le choix entre
”trahir” (jouer x11 ) et gagner 1 ou coopérer (jouer x12 ) et
gagner 0. Naturellement, il choisirait ”trahir” (jouer x11 ).
✓ Si le joueur (P2) coopère (jouer x22 ), le joueur (P1) a le choix
entre ”trahir” (jouer x11 ) et gagner 3 ou coopérer (jouer x12 )
et gagner 2. Naturellement, il choisirait ”trahir” (jouer x11 ).
✓ Ainsi, dans tous les cas, le joueur (P1) préfère trahir (jouer
x11 ) . Le même raisonnement conduirait le joueur (P2) à
choisir la décision de ”trahir” (jouer x21 ). Ainsi, les choix des
deux joueurs conduiraient à l’issue (trahir, trahir) = (x11 , x21 ).
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exercice
Est ce que l’issue (trahir, trahir)= (x11 , x21 ) vérifie les conditions
de la définition de l’équilibre de Nash ?
P2
x21 x22
P1 x11 (1,1) (3,0)
x12 (0,3) (2,2)
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Définition d’une solution de Pareto
Definition
Une issue x ∗ ∈ X est dominée par une autre issue x ∈ X dans le
jeu Γ, si
fi (x ∗ ) ≤ fi (x), ∀i ∈ I ,
fj (x ∗ ) < fj (x), pour au moins un j ∈ I
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Définition d’une solution de Pareto
Definition
Une issue x ∗ ∈ X est une solution de Pareto, s’il n’existe pas une
autre issue x ∈ X qui la domine.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Reprenons le jeu bimatriciel
P2
x21 x22
P1 x11 (1,1) (3,0)
x12 (0,3) (2,2)
Est ce que l’issue (Trahir, Trahir) = (x11 , x21 ) est une solution de
Pareto ?
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Reprenons le jeu bimatriciel
P2
x21 x22
P1 x11 (1,1) (3,0)
x12 (0,3) (2,2)
L’issue (trahir, trahir) = (x11 , x21 ) est dominée par l’issue
(Coopérer, Coopérer)=(x12 , x22 ) car chacun obtiendrait un gain de
2 au lieu de 1 dans la précédente issue.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Reprenons le jeu bimatriciel
P2
x21 x22
P1 x11 (1,1) (3,0)
x12 (0,3) (2,2)
L’issue (trahir, trahir) = (x11 , x21 ) est dominée par l’issue
(Coopérer, Coopérer) =(x12 , x22 ) car chacun obtiendrait un gain de
2 au lieu de 1 dans la précédente issue.
Cette sous-optimalité de l’équilibre de Nash constitue le dilemme
du prisonnier, que nous observons dans de nombreuses situations
stratégiques (concurrence oligopolistique, politique commerciale
entre pays, course aux armements,...)
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Reprenons le jeu bimatriciel
P2
x21 x22
P1 x11 (1,1) (3,0)
x12 (0,3) (2,2)
Cette sous-optimalité de l’équilibre de Nash constitue le dilemme
du prisonnier, que nous observons dans de nombreuses situations
stratégiques (concurrence oligopolistique, politique commerciale
entre pays, course aux armements,...).
Le dilemme du prisonnier décrit une situation dans laquelle les
joueurs ont intérêt collectivement à adopter un comportement
coopératif (coopérer), mais sont incités individuellement à adopter
un comportement agressif (égoı̈ste) ou opportuniste (trahir).
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
La répétition favorise-t-elle la coopération ?
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu répété
Un jeu répété est un jeu ordinaire réitéré plusieurs fois de suite.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu répété
Un jeu répété est un jeu ordinaire réitéré plusieurs fois de suite.
Par jeu ordinaire, nous entendons un jeu statique (joué une seule
fois) dans lequel les joueurs choisissent simultanément leurs
stratégies.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu répété
Un jeu répété au sens strict est un jeu répété stationnaire : c’est
le même jeu ordinaire appelé jeu constituant qui est répété de
période en période.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu répété
Les conditions du jeu ne se modifient pas au cours du temps :
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu répété
Les conditions du jeu ne se modifient pas au cours du temps :
✓ même nombre de joueurs ;
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu répété
Les conditions du jeu ne se modifient pas au cours du temps :
✓ même nombre de joueurs ;
✓ mêmes ensembles de stratégies des joueurs ;
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu répété
Les conditions du jeu ne se modifient pas au cours du temps :
✓ même nombre de joueurs ;
✓ mêmes ensembles de stratégies des joueurs ;
✓ mêmes fonctions de gains ;
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu répété
Les conditions du jeu ne se modifient pas au cours du temps :
✓ même nombre de joueurs ;
✓ mêmes ensembles de stratégies des joueurs ;
✓ mêmes fonctions de gains ;
✓ même facteur d’actualisation.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu répété
Les conditions du jeu ne se modifient pas au cours du temps :
✓ même nombre de joueurs ;
✓ mêmes ensembles de stratégies des joueurs ;
✓ mêmes fonctions de gains ;
✓ même facteur d’actualisation.
Si l’une des conditions évolue au cours du temps, nous parlerons
alors de super jeu (supergame).
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu répété
Les conditions du jeu ne se modifient pas au cours du temps :
✓ même nombre de joueurs ;
✓ mêmes ensembles de stratégies des joueurs ;
✓ mêmes fonctions de gains ;
✓ même facteur d’actualisation.
Si l’une des conditions évolue au cours du temps, nous parlerons
alors de super jeu (supergame).
Un super jeu est donc une séquence de jeux ordinaires qui peuvent
différer d’une période à l’autre.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu répété
Dans la théorie des jeux répétés, on suppose que :
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu répété
Dans la théorie des jeux répétés, on suppose que :
✓ le jeu constituant Γ vérifie les conditions d’existence d’un
équilibre de Nash ;
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu répété
Dans la théorie des jeux répétés, on suppose que :
✓ le jeu constituant Γ vérifie les conditions d’existence d’un
équilibre de Nash ;
✓ le jeu Γ est en information complète : chaque joueur connaı̂t
l’ensemble des joueurs, l’ensemble des stratégies et la fonction
de gains de chacun des autres joueurs. De plus cette
information complète sur I , X , f est une connaissance
commune.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu répété
Dans la théorie des jeux répétés, on suppose que :
✓ le jeu constituant Γ vérifie les conditions d’existence d’un
équilibre de Nash ;
✓ le jeu Γ est en information complète : chaque joueur connaı̂t
l’ensemble des joueurs, l’ensemble des stratégies et la fonction
de gains de chacun des autres joueurs. De plus cette
information complète sur I , X , f est une connaissance
commune.
✓ De plus, chaque joueur est parfaitement rationnel et qu’il a la
certitude que les autres joueurs sont aussi rationnels et que
cette certitude est connaissance commune.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Jeu répété
On notera par
✓ ΓT , si à chaque période t = 0, 1, 2, . . . , T le jeu Γ est répété.
✓ Γ∞ , si le jeu Γ est répété indéfiniment.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies
Considérons le jeu répété dans lequel les joueurs font face à chaque
période au jeu constituant Γ.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies
Considérons le jeu répété dans lequel les joueurs font face à chaque
période au jeu constituant Γ.
La répétition de ce jeu permet aux joueurs de conditionner leurs
choix présents et futurs sur les choix passés.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies
Considérons le jeu répété dans lequel les joueurs font face à chaque
période au jeu constituant Γ.
La répétition de ce jeu permet aux joueurs de conditionner leurs
choix présents et futurs sur les choix passés.
Cette interdépendance temporelle peut conduire à des solutions
plus coopératives ou plus agressives que celle observées dans le jeu
constituant.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies
Considérons le jeu répété dans lequel les joueurs font face à chaque
période au jeu constituant Γ.
La répétition de ce jeu permet aux joueurs de conditionner leurs
choix présents et futurs sur les choix passés.
Cette interdépendance temporelle peut conduire à des solutions
plus coopératives ou plus agressives que celle observées dans le jeu
constituant.
La répétition élargit l’ensemble des solutions.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies
✓ xi (t) l’action du joueur i ∈ I à la date t.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies
✓ xi (t) l’action du joueur i ∈ I à la date t.
✓ un profil d’actions sélectionnées par les N joueurs à la date t
s’écrit alors :
Y
x(t) = (x1 (t), . . . , xi (t), . . . , xN (t)) ∈ X = Xi .
i∈I
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
histoire d’un jeu
Definition
Une histoire du jeu à une date t est donnée par
t−1
Y
ht = (x(0), x(1), . . . , x(t − 1)) ∈ X t = X.
k=0
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
histoire d’un jeu
Definition
Une histoire du jeu à une date t est donnée par
t−1
Y
ht = (x(0), x(1), . . . , x(t − 1)) ∈ X t = X.
k=0
Une histoire du jeu correspond à l’ensemble des actions que les
joueurs ont choisies entre la période initiale k = 0 et la période
k = t − 1.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
histoire d’un jeu
Definition
Une histoire du jeu à une date t est donnée par
t−1
Y
t
ht = (x(0), x(1), . . . , x(t − 1)) ∈ X = X.
k=0
Une histoire du jeu correspond à l’ensemble des actions que les
joueurs ont choisies entre la période initiale k = 0 et la période
k = t − 1.
Dans un jeu répété, le profil d’actions sélectionnées par les joueurs
à chaque période crée un nouveau sous-jeu qui est entièrement
défini par l’histoire à cette date.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
histoire d’un jeu
Exemple
Reprenons le jeu (??) qui est répété deux fois, où :
✓ le joueur (P1) ait joué x12 = C et après x11 = T ;
✓ le joueur (P2) ait joué x22 = C et après x22 = C .
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
histoire d’un jeu
Avec les notations précédentes, on aura :
✓ x1 (0) = x12 = C , x1 (1) = x11 = T ; x2 (0) = x22 = C ;
x2 (1) = x22 = C .
✓ x(0) = (x1 (0), x2 (0)) = (x12 , x22 ) = (C , C )
✓ x(1) = (x1 (1), x2 (1)) = (x11 , x22 ) = (T , C ).
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
histoire d’un jeu
Avec les notations précédentes, on aura :
✓ x1 (0) = x12 = C , x1 (1) = x11 = T ; x2 (0) = x22 = C ;
x2 (1) = x22 = C .
✓ x(0) = (x1 (0), x2 (0)) = (x12 , x22 ) = (C , C )
✓ x(1) = (x1 (1), x2 (1)) = (x11 , x22 ) = (T , C ).
L’histoire du jeu à la date t = 1 est donnée par
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
histoire d’un jeu
Avec les notations précédentes, on aura :
✓ x1 (0) = x12 = C , x1 (1) = x11 = T ; x2 (0) = x22 = C ;
x2 (1) = x22 = C .
✓ x(0) = (x1 (0), x2 (0)) = (x12 , x22 ) = (C , C )
✓ x(1) = (x1 (1), x2 (1)) = (x11 , x22 ) = (T , C ).
L’histoire du jeu à la date t = 1 est donnée par
h1 = (x(0)) = ((x12 , x22 ) = (C , C )
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
histoire d’un jeu
Avec les notations précédentes, on aura :
✓ x1 (0) = x12 = C , x1 (1) = x11 = T ; x2 (0) = x22 = C ;
x2 (1) = x22 = C .
✓ x(0) = (x1 (0), x2 (0)) = (x12 , x22 ) = (C , C )
✓ x(1) = (x1 (1), x2 (1)) = (x11 , x22 ) = (T , C ).
L’histoire du jeu à la date t = 2 est donnée par
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
histoire d’un jeu
Avec les notations précédentes, on aura :
✓ x1 (0) = x12 = C , x1 (1) = x11 = T ; x2 (0) = x22 = C ;
x2 (1) = x22 = C .
✓ x(0) = (x1 (0), x2 (0)) = (x12 , x22 ) = (C , C )
✓ x(1) = (x1 (1), x2 (1)) = (x11 , x22 ) = (T , C ).
L’histoire du jeu à la date t = 2 est donnée par
h2 = (x(0), x(1)) = ((x12 , x22 ), (x11 , x22 )) = ((C , C ), (T , C ))
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
histoire d’un jeu
L’histoire du jeu à la date t = 2 est donnée par
h2 = (x(0), x(1)) = ((x12 , x22 ), (x11 , x22 )) = ((C , C ), (T , C ))
On notera par Ht l’ensemble des histoires possibles jusqu’à la date
t
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégie dans un jeu répété
Definition
Dans un jeu répété, une stratégie pour un joueur i ∈ I consiste en
une séquence de règles de décision, une par période.
Cette stratégie est notée par
σi = (σi(0) , σi(1) , σi(2) , . . . , σi(t) , . . .),
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégie dans un jeu répété
Definition
Dans un jeu répété, une stratégie pour un joueur i ∈ I consiste en
une séquence de règles de décision, une par période. Cette
stratégie est notée par
σi = (σi(0) , σi(1) , σi(2) , . . . , σi(t) , . . .),
où σi(t) est la règle de décision du joueur i ∈ I à la date t :
σi(t) (.) : X t → Xi .
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégie dans un jeu répété
Definition
Dans un jeu répété, une stratégie pour un joueur i ∈ I consiste en
une séquence de règles de décision, une par période. Cette
stratégie est notée par
σi = (σi(0) , σi(1) , σi(2) , . . . , σi(t) , . . .),
où σi(t) est la règle de décision du joueur i ∈ I à la date t :
σi(t) (.) : X t → Xi .
σi(t) (.) est une application de X t vers Xi qui spécifie pour chaque
histoire du jeu ht ∈ X t une action ou une conduite à tenir à la
date t.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégie dans un jeu répété
Definition
Dans un jeu répété, une stratégie (pure) pour un joueur i ∈ I
consiste en une séquence de règles de décision, une par période.
Cette stratégie est notée par
σi = (σi(0) , σi(1) , σi(2) , . . . , σi(t) , . . .),
où σi(t) est la règle de décision du joueur i ∈ I à la date t :
σi(t) (.) : X t → Xi .
σi(t) (.) est une application de X t vers Xi qui spécifie pour chaque
histoire du jeu ht une action ou une conduite à tenir à la date t.
Ainsi, le joueur i ∈ I joue à la date t l’action σi(t) (ht ) ∈ Xi s’il a
observé une histoire ht du jeu.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégie dans un jeu répété
On notera :
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégie dans un jeu répété
On notera :
✓ Σi(t) l’ensemble des règles de décision du joueur i à la date t ;
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégie dans un jeu répété
On notera :
✓ Σi(t) l’ensemble des règles de décision du joueur i à la date t ;
✓ Σi = Xi × Σi(1) × Σi(2) × . . . l’ensemble des stratégies du
joueur i ∈ I dans le jeu répété ; Xi = Σi(0) ;
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégie dans un jeu répété
On notera :
✓ Σi(t) l’ensemble des règles de décision du joueur i à la date t ;
✓ Σi = Xi × Σi(1) × Σi(2) × . . . l’ensemble des stratégies du
joueur i ∈ I dans le jeu répété ; Xi = Σi(0) ;
✓ σ = (σ1 , . . . , σi , . . . , σN ) un profil de stratégies du jeu répété ;
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégie dans un jeu répété
On notera :
✓ Σi(t) l’ensemble des règles de décision du joueur i à la date t ;
✓ Σi = Xi × Σi(1) × Σi(2) × . . . l’ensemble des stratégies du
joueur i ∈ I dans le jeu répété ; Xi = Σi(0) ;
✓ σ = (σ1 , . . . , σi , . . . , σN ) un profil de stratégies du jeu répété ;
✓ σ(t) = (σ1(t) , . . . , σi(t) , . . . , σN(t) ) un profil des règles de
décision à la période t.
On a σ ∈ Σ, oùQΣ est le produit cartésien des ensembles de
stratégies Σ = i∈I Σi .
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégie dans un jeu répété
Exemple
Reprenons le jeu (??) qui va être répété trois fois. On peut
imaginer différentes hypothèses sur l’information des joueurs sur le
jeu :
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégie dans un jeu répété
Exemple
Reprenons le jeu (??) qui va être répété trois fois. On peut
imaginer différentes hypothèses sur l’information des joueurs sur le
jeu :
✓ Les joueurs jouent simultanément et ne communiquent pas
leurs choix. Un arbitre diffusera les choix de chacun à la fin du
jeu. Dans ce cas, à chaque étape du jeu, aucun joueur n’a
l’information sur les choix précédents de son adversaire.
Un exemple de stratégies pour le joueur (P1) sera
σ1 = (σ1(0) , σ1(1) , σ1(2) ) = (x12 , x11 , x11 ) = (C , T , T ),
signifiant qu’il va coopérer dans la première partie du jeu, puis
trahir dans les deux parties suivantes.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégie dans un jeu répété
Exemple
Reprenons le jeu (??) qui va être répété trois fois. On peut
imaginer différentes hypothèses sur l’information des joueurs sur le
jeu :
✓ Les joueurs jouent simultanément et ne communiquent pas
leurs choix. Un arbitre diffusera les choix de chacun à la fin du
jeu. Dans ce cas, à chaque étape du jeu, aucun joueur n’a
l’information sur les choix précédents de son adversaire.
Un exemple de stratégies pour le joueur (P1) sera
σ1 = (σ1(0) , σ1(1) , σ1(2) ) == (x12 , x11 , x11 ) = (C , T , T ),
signifiant qu’il va coopérer dans la première partie du jeu, puis
trahir des les deux parties suivantes.
✓ Les joueurs jouent simultanément et communiquent les
décisions prises à chaque période.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégie dans un jeu répété
✓ Un exemple de stratégies pour le joueur (P1) sera
σ1 = (σ1(0) , σ1(1) , σ1(2) ), où :
x12 = C , si σ2(0) = x22 = C
σ1(0) = x12 = C , σ1(1) = ,
x11 = T , sinon.
x12 = c, si σ2(1) = x21 = T
σ1(2) =
x11 = T , sinon.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Différentes classes de stratégies dans un jeu répété
On distingue plusieurs classes de stratégies selon la place que
l’histoire occupe dans les règles de décision des joueurs.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Différentes classes de stratégies dans un jeu répété
On distingue plusieurs classes de stratégies selon la place que
l’histoire occupe dans les règles de décision des joueurs :
✓ Stratégies en boucle ouverte (open-loop)
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Différentes classes de stratégies dans un jeu répété
On distingue plusieurs classes de stratégies selon la place que
l’histoire occupe dans les règles de décision des joueurs :
✓ Stratégies en boucle ouverte (open-loop)
✓ Stratégies en feed-back
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Différentes classes de stratégies dans un jeu répété
On distingue plusieurs classes de stratégies selon la place que
l’histoire occupe dans les règles de décision des joueurs :
✓ Stratégies en boucle ouverte (open-loop)
✓ Stratégies en feed-back
✓ Stratégies en boucle fermée (Closed-loop)
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies en boucle ouverte (open-loop)
Une stratégie est dite en boucle ouverte quand le joueur ne tient
pas compte de l’histoire du jeu.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies en boucle ouverte (open-loop)
Une stratégie est dite en boucle ouverte quand le joueur ne tient
pas compte de l’histoire du jeu.
En fait cela revient à dire que le joueur choisit initialement une
séquence d’actions (une par période) et il applique ce programme
quel que soit le comportement de ses rivaux (C’est pourquoi, on les
appelle souvent commande programmable).
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies en boucle ouverte (open-loop)
Une stratégie est dite en boucle ouverte quand le joueur ne tient
pas compte de l’histoire du jeu.
En fait cela revient à dire que le joueur choisit initialement une
séquence d’actions (une par période) et il applique ce programme
quel que soit le comportement de ses rivaux (C’est pourquoi, on les
appelle souvent commande programmable).
Le comportement d’un tel joueur peut être qualifié de myope.
Toute la dimension dynamique du jeu répété est éliminée.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies en boucle ouverte (open-loop)
Une stratégie est dite en boucle ouverte quand le joueur ne tient
pas compte de l’histoire du jeu.
En fait cela revient à dire que le joueur choisit initialement une
séquence d’actions (une par période) et il applique ce programme
quel que soit le comportement de ses rivaux (C’est pourquoi, on les
appelle souvent commande programmable).
Le comportement d’un tel joueur peut être qualifié de myope.
Toute la dimension dynamique du jeu répété est éliminée.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies en boucle ouverte (open-loop)
Une stratégie en boucle ouverte s’écrit :
σi = {(xi(t) )t=0,1,... },
ou encore
σi = (σi(0) , σi(1) , σi(2) , . . . , σi(t) , . . .),
où σi(t) [ht1 ] = σi(t) [ht2 ] pour toutes les histoires ht1 ̸= ht2 ∈ X t .
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies en boucle ouverte (open-loop)
On démontre qu’un équilibre en boucle ouverte consiste
nécessairement en une séquence d’équilibres de Nash du jeu
constituant
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies en feed-back
Le joueur conditionne son choix présent sur les seules actions de la
période précédente et non sur toute l’histoire du jeu.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies en feed-back
Le joueur conditionne son choix présent sur les seules actions de la
période précédente et non sur toute l’histoire du jeu.
Ce type de stratégies revient à supposer une mémoire imparfaite
des joueurs.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies en feed-back
Le joueur conditionne son choix présent sur les seules actions de la
période précédente et non sur toute l’histoire du jeu.
Ce type de stratégies revient à supposer une mémoire imparfaite
des joueurs.
Nous pouvons aussi concevoir des stratégies qui se fonderaient sur
les seules actions de deux ou trois périodes précédentes.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies en boucle fermée (Closed-loop)
Les joueurs tiennent compte de l’histoire du jeu. Initialement,
chaque joueur adopte une séquence de règles de décision, une règle
par période.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies en boucle fermée (Closed-loop)
Les joueurs tiennent compte de l’histoire du jeu. Initialement,
chaque joueur adopte une séquence de règles de décision, une règle
par période.
A la période t, il observe l’histoire ht et joue l’action prescrite par
sa règle de décision σi(t) .
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Reprenons le jeu (??) répété.
Considérons la stratégie suivante du joueur (P1)
σ1(0) (∅) = x12 = C
x12 = C , si ∀τ ≤ t − 1, x2 (τ ) = x22 = C
σ1(t) (ht ) =
x11 = T , si ∃τ ≤ t − 1, x2 (τ ) = x21 = T
A quelle classe de stratégies appartient-elle ?
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Suivant cette stratégie, le joueur (P1) commence par coopérer
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Suivant cette stratégie, le joueur (P1) commence par coopérer puis
il continue à coopérer tant que l’adversaire fait de même.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Suivant cette stratégie, le joueur (P1) commence par coopérer puis
il continue à coopérer tant que l’adversaire fait de même.
Le jour où l’adversaire le trahit
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Suivant cette stratégie, le joueur (P1) commence par coopérer puis
il continue à coopérer tant que l’adversaire fait de même.
Le jour où l’adversaire le trahit, il arrête de coopérer et décide de
trahir pour toutes les étapes futures.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Suivant cette stratégie, le joueur (P1) commence par coopérer puis
il continue à coopérer tant que l’adversaire fait de même.
Le jour où l’adversaire le trahit, il arrête de coopérer et décide de
trahir pour toutes les étapes futures.
En quelque sorte, notre joueur est initialement sympathique mais
très rancunier : s’il est trahi une fois, il se venge pour toujours.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Suivant cette stratégie, le joueur (P1) commence par coopérer puis
il continue à coopérer tant que l’adversaire fait de même.
Le jour où l’adversaire le trahit, il arrête de coopérer et décide de
trahir pour toutes les étapes futures.
En quelque sorte, notre joueur est initialement sympathique mais
très rancunier : s’il est trahi une fois, il se venge pour toujours.
Cette stratégie est appelée Grim-Trigger (stratégie à seuil
-stratégie de déclic).
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Exemple
Suivant cette stratégie, le joueur (P1) commence par coopérer puis
il continue à coopérer tant que l’adversaire fait de même.
Le jour où l’adversaire le trahit, il arrête de coopérer et décide de
trahir pour toutes les étapes futures.
En quelque sorte, notre joueur est initialement sympathique mais
très rancunier : s’il est trahi une fois, il se venge pour toujours.
Cette stratégie est appelée Grim-Trigger (stratégie à seuil,
Stratégie de declic).
Elle illustre bien le concept de punition, essentiel pour l’étude des
équilibres dans les jeux répétés.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Stratégies
Dans un jeu répété, les règles de décision peuvent prendre des
formes extrêmement complexes, puisqu’elles sont supposées
spécifier la conduite à tenir dans n’importe quel sous-jeu et face à
n’importe quelle histoire.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Utilités des joueurs dans un jeu répété
Il nous reste à définir la fonction de paiement. Pour cela, il faut
déterminer comment les joueurs évaluent P le résultat d’un profil de
stratégies σ = (σ(0) , σ(1) , . . . , σ(t) , . . .) ∈ choisis par les N
joueurs. Le joueur i reçoit à l’étape t le paiement fi (σ(t)). On
supposera ici que le joueur donne plus de poids à une unité
d’utilité reçue aujourd’hui par rapport à une unité d’utilité reçue
demain. Pour modéliser cela, on utilise généralement en économie
un taux d’escompte δ ∈]0, 1[. Ainsi, 1 unité d’utilité reçue à l’étape
2 vaut seulement δ unité d’utilité à l’étape 1 et une unité d’utilité
reçue à l’étape t, vaut δ t−1 à l’étape 1.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Utilités des joueurs dans un jeu répété
La valeur présente des gains générés P par le profil de stratégies
σ = (σ(0) , σ(1) , . . . , σ(t) , . . .) ∈ choisis par les N joueurs est
égale pour le joueur i ∈ I à :
∞
X
Fi (σ) = δ t fi (σ(t)),
t=0
où δ est le facteur d’actualisation commun à tous les joueurs.
La valeur Fi (σ) = Fi (σ) ; Fi est la fonction de gains du jeu répété
avec actualisation.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Utilités des joueurs dans un jeu répété
On notera le jeu infiniment répété avec actualisation (jeu
escompté) par :
Γ∞ = ⟨I , {Σi }i∈I , {Fi }i∈I , δ⟩, (8)
P
où i est l’ensemble des stratégies et Fi la fonction des gains du
joueur i ∈ I .
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Concept de solution
Definition
Dans le jeu Γ∞ (??), le profil de stratégies σ ∗ est un équilibre de
Nash,
∀i ∈ I , ∀σi ∈ Σi , Fi (σ ∗ ) ≥ Fi (σi , σ−i
∗
).
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Concept de solution
Definition
Dans le jeu Γ∞ (??), le profil de stratégies σ ∗ est un équilibre de
Nash,
∀i ∈ I , ∀σi ∈ Σi , Fi (σ ∗ ) ≥ Fi (σi , σ−i
∗
).
Dans un jeu répété, l’équilibre de Nash est un concept
insatisfaisant parce qu’il n’est pas assez exigeant sur les profils
d’actions prescrits dans les sous-jeux hors équilibre. C’est pourquoi
les équilibres de Nash d’un jeu dynamique sont toujours soumis au
critère de sous-jeux parfaits.
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Equilibre parfait
Definition
Un profil de stratégies σ ∗ est un équilibre parfait dans le jeu répété
(??), si
1 σ ∗ est un équilibre de Nash sur l’ensemble du jeu (??)
Fi (σ ∗ ) ≥ Fi (σi , σ−i
∗
), ∀σi ∈ Ξi , ∀i ∈ I .
2 σ ∗ht est un équilibre de Nash pour tout t et toute histoire ht
∗ht
Fi (σ ∗ht ) ≥ Fi (σi , σ−i ), ∀t = 1, 2, ..., ht , ∀σi ∈ Ξhi t , ∀i ∈ I .
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales
Bibliographie
1 M. J. Osborne. An Introduction to Game Theory. University of
Toronto, Toronto, Canada.2004
2 M. Maschler, E. Solan, S. Zamir. Game Theory. Cambridge
university press, 2013
3 G.Umbhauer. Game Theory and Exercises. Routledge, 2016
Mohammed Said RADJEF Théorie des Jeux et Stratégies Managériales