TD n°4 : Théorie des Jeux en information complète :
Economie de l’assurance IR SAF
Avril 2016
Rappel :
Information complète :
Chaque joueur connait :
- ses possibilités d’actions
- les possibilités d’action des autres joueurs
- les gains résultants de ces actions
- les motivations des autres joueurs
Information parfaite :
Chaque joueur à une connaissance parfaite de toute l’histoire du jeu au moment de prendre une
décision.
Information incomplète info imparfaite (l’inverse n’est pas vrai)
Exercice 1 : Dilemme du prisonnier
Deux cambrioleurs, notés 1 et 2 sont arrêtés par la police et placés en garde à vue dans des cellules
différentes. Les preuves sont insuffisantes pour les inculper et la police leur propose la solution
suivante. S’ils avouent tous les deux, chacun sera condamné à 3 ans de prison (dans ce cas l’utilité
de chacun est de 1). Si seulement l’un des deux avoue, il sera libéré et servira de témoins contre
l’autre (dans ce cas, l’utilité de celui qui avoue est égale à 4 et celle de l’autre à 0). Si aucun des
deux n’avoue, ils seront inculpés pour un délit mineur et condamnés à 1 an de prison (dans ce cas,
l’utilité de chacun est égale à 3).
1) Après avoir identifié les différentes composantes de ce jeu stratégique, donner la forme
normale et extensive de ce jeu.
2) Déterminer l’équilibre en stratégies dominantes et l’équilibre de Nash résultant.
Correction :
Le jeu est non coopératif (ils ne se mettent pas d’accord sur le choix de la stratégie), il est simultané.
On assume que les deux individus ne pourront pas avoir de représailles en cas de déviance.
Le jeu est à information complète mais imparfaite car au moment de prendre ça décision le joueur ne
connait pas la décision de l’autre.
1) Jeux sous forme normale :
𝑁 = {1; 2}
𝑆1 = 𝑆2 = {𝑛𝑖𝑒𝑟; 𝑎𝑣𝑜𝑢𝑒𝑟} = {𝑛; 𝑎}
𝑃𝑟𝑜𝑓𝑖𝑙𝑠 𝑑𝑒 𝑠𝑡𝑟𝑎𝑡é𝑔𝑖𝑒𝑠 𝑝𝑜𝑠𝑠𝑖𝑏𝑙𝑒𝑠: 𝑆 = 𝑆1 × 𝑆2 = {(𝑛, 𝑛); (𝑎, 𝑎); (𝑎, 𝑛); (𝑛, 𝑎)}
𝑃𝑎𝑖𝑒𝑚𝑒𝑛𝑡𝑠:
𝑈1 (𝑛, 𝑛) = 𝑈2 (𝑛, 𝑛) = 3
𝑈1 (𝑎, 𝑎) = 𝑈2 (𝑎, 𝑎) = 1
𝑈1 (𝑎, 𝑛) = 𝑈2 (𝑛, 𝑎) = 4
𝑈1 (𝑛, 𝑎) = 𝑈1 (𝑎, 𝑛) = 0
Matrice de paiement :
𝐽1\𝐽2 𝐴 𝑁
𝐴 (1,1) (4,0)
𝑁 (0,4) (0,0)
Jeux sous forme extensive :
2) Equilibre en stratégies dominantes et équilibre de Nash du jeu.
Une stratégie est dominante pour un joueur si la stratégie est choisie par le joueur quelque soit les
stratégies des autres joueurs.
𝑆𝑖 𝐽2 𝑗𝑜𝑢𝑒 𝐴 ; 𝑆1∗ (𝐴) = 𝐴 𝑐𝑎𝑟 U1 (A, A) = 1 ≥ U(N, A) = 0
𝑆𝑖 𝐽2 𝑗𝑜𝑢𝑒 𝑁 ; 𝑆1∗ (𝑁) = 𝐴 𝑐𝑎𝑟 U1 (A, N) = 4 ≥ U(N, A) = 3
Ainsi peu importe ce que joue le joueur 2, 1 à toujours intérêt à jouer la stratégie Avouer. La stratégie
« avouer » et donc une stratégie dominante pour le joueur 1. Les paiements étant symétriques le
même raisonnement peut s’appliquer pour le joueur 2. Ainsi l’équilibre de Nash de ce jeu est (𝐴, 𝐴)
c’est un équilibre de Nash parfait.
Pourquoi parfait : car ne comprend qu’une seule stratégie, il n’est pas composé de probabilité de
jouer telle ou telle stratégie.
Rappel définition équilibre de Nash : Un équilibre de Nash est un ensemble de stratégies tel que
pour chaque joueur sa stratégie et la meilleure réponse étant donné les stratégies, appartenant à
l’équilibre, des autres. Personne n’a intérêt à dévier. Ici 𝑆1∗ (𝐴) = 𝐴 𝑒𝑡 𝑆2∗ (𝐴) = 𝐴.
Exercice 2: Bataille des sexes et jeu de coordination
Un couple désire sortir ensemble, mais l’homme et la femme ne sont pas d’accord sur le spectacle.
Monsieur désire assister à un match de boxe, madame à un spectacle de danse. S’ils vont à la
danse, Monsieur (resp. Madame) a une utilité égale à 1 (resp. 2) ; et s’ils vont au match de boxe,
Monsieur (resp. Madame) a une utilité de 2 (resp. 1). S’ils sont séparés, ils ont tous les deux une
utilité nulle.
1) Après avoir identifié les différentes composantes de ce jeu stratégique, donner la forme
normale de ce jeu et représenter ce jeu sous forme extensive.
2) Les joueurs peuvent-ils se coordonner ?
3) Déterminer l’équilibre en stratégies dominantes.
4) Répondre aux questions 1 et 2 lorsque, sils vont au match de boxe (resp . spectacle de
danse), l’utilité est égale à 2 (resp. 1) pour chacun.
Correction :
1) Le jeu est simultané et non coopératif. L’information est incomplète et parfaite.
Jeu sous forme normale :
𝑁 = {1; 2}
𝑆1 = 𝑆2 = {𝑚𝑎𝑡𝑐ℎ; 𝑑𝑎𝑛𝑠𝑒} = {𝑚; 𝑑}
𝑃𝑟𝑜𝑓𝑖𝑙𝑠 𝑑𝑒 𝑠𝑡𝑟𝑎𝑡é𝑔𝑖𝑒𝑠 𝑝𝑜𝑠𝑠𝑖𝑏𝑙𝑒𝑠: 𝑆 = 𝑆1 × 𝑆2 = {(𝑚, 𝑚); (𝑑, 𝑑); (𝑚, 𝑑); (𝑑, 𝑚)}
𝑃𝑎𝑖𝑒𝑚𝑒𝑛𝑡𝑠:
𝑈1 (𝑚, 𝑚) = 𝑈2 (𝑑, 𝑑) = 2
𝑈1 (𝑑, 𝑑) = 𝑈2 (𝑚, 𝑚) = 1
𝑈1 (𝑚, 𝑑) = 𝑈2 (𝑑, 𝑚) = 𝑈1 (𝑑, 𝑚) = 𝑈1 (𝑚, 𝑑) = 0
Matrice de paiement :
𝐽1\𝐽2 D M
𝐷 (1,2) (0,0)
𝑀 (0,0) (2,1)
Forme extensive :
2) Le plus important pour les deux joueurs est de se coordonner mais chacun d’eux a une
préférence contrastée avec celle de l’autre. Bien que les deux souhaitent se coordonner, ils
arrivent toujours à des résultants conflictuels.
En effet aucune stratégie n’est strictement dominé ou dominante.
3)
𝑆𝑖 𝐽2 𝑗𝑜𝑢𝑒 𝐷 ; 𝑆1∗ (𝐷) = 𝐷 𝑐𝑎𝑟 U1 (D, D) = 1 ≥ U(M, D) = 0
𝑆𝑖 𝐽2 𝑗𝑜𝑢𝑒 𝑀 ; 𝑆1∗ (𝑀) = 𝑀 𝑐𝑎𝑟 U1 (𝑀, 𝑀) = 2 ≥ U(𝐷, 𝑀) = 0
Et
𝑆𝑖 𝐽1 𝑗𝑜𝑢𝑒 𝐷 ; 𝑆2∗ (𝐷) = 𝐷 𝑐𝑎𝑟 U2 (D, D) = 2 ≥ U(M, D) = 0
𝑆𝑖 𝐽1 𝑗𝑜𝑢𝑒 𝑀 ; 𝑆2∗ (𝑀) = 𝑀 𝑐𝑎𝑟 U2 (𝑀, 𝑀) = 1 ≥ U(𝐷, 𝑀) = 0
Cependant il y a deux équilibres de Nash (𝑀, 𝑀)𝑒𝑡 (𝐷, 𝐷) dans ce jeu.
En effet : 𝑆1∗ (𝐷) = 𝐷 𝑒𝑡 𝑆2∗ (𝐷) = 𝐷 et 𝑆1∗ (𝑀) = 𝑀 𝑒𝑡 𝑆2∗ (𝑀) = 𝑀
Ainsi, tout jeux comportent deux (ou plus) équilibres de Nash en stratégie pure comprend aussi un
équilibre de Nash en stratégie mixtes. Attention l’inverse n’est pas vrai !
Comment déterminer l’équilibre de Nash mixte. On pondère chaque stratégie par une probabilité de
la choisir. Et nous devons déterminer les probabilités d’équilibre.
Supposons que 𝐽1 joue 𝐷 avec proba 𝑝 et 𝑀 avec proba (1 − 𝑝) et 𝐽2 joue 𝐷 avec proba 𝑞 et 𝑀 avec
proba (1 − 𝑞).
Nous avons donc :
𝑈1 (𝐷, 𝑝𝐷 + (1 − 𝑝)𝑀) = 𝑝 × 1 + (1 − 𝑝) × 0 = 𝑝
𝑈1 (𝑀, 𝑝𝐷 + (1 − 𝑝)𝑀) = 𝑝 × 0 + (1 − 𝑝) × 2 = 2(1 − 𝑝)
De plus,
𝑈2 (𝑞𝐷 + (1 − 𝑞)𝑀, 𝑀) = 𝑞 × 0 + (1 − 𝑞) × 1 = (1 − 𝑞)
𝑈2 (𝑞𝐷 + (1 − 𝑞)𝑀, 𝐷) = 𝑞 × 2 + (1 − 𝑞) × 0 = 𝑞
Ainsi pour quelle valeur de 𝑝 le joueur 1 joue toujours 𝑀
3
𝑈1 (𝑀, 𝑝𝐷 + (1 − 𝑝)𝑀) > 𝑈1 (𝐷, 𝑝𝐷 + (1 − 𝑝)𝑀) ⟺ 2 − 2𝑝 > 𝑝 ⟺ 𝑝 <
2
3 3 2
Ainsi pour 𝑝 < 2 nous avons 𝑞 = 0 et 𝑝 = 2 indifférent entre jouer 𝑀 𝑜𝑢 𝐷 et si 𝑝 > 3 𝑞 = 1 ;
2
1 𝑠𝑖 𝑝 > 3
2
On a donc 𝑆1∗ = 𝑞 ∗ (𝑝) = (0,1) 𝑠𝑖 𝑝 = 3
2
{ 0 𝑠𝑖 𝑝 < 3
Inversement :
Ainsi pour quelle valeur de 𝑞 le joueur 2 joue toujours 𝑀
1
𝑈2 (𝑞𝐷 + (1 − 𝑞)𝑀, 𝑀) > 𝑈2 (𝑞𝐷 + (1 − 𝑞)𝑀, 𝐷) ⟺ 1 − 𝑞 > 2𝑞 ⟺ 𝑞 <
3
1
1 𝑠𝑖 𝑞 > 3
1
On a donc 𝑆2∗ = 𝑝∗ (𝑞) = (0,1) 𝑠𝑖 𝑞 = 3
1
0 𝑠𝑖 𝑞 <
{ 3
On a donc les deux fonctions de réactions des joueurs et le ou les équilibre(s) Nash mixte(s) sont tous
les cordonnées (𝑝, 𝑞) tel que les fonctions de réactions se croisent.
1 2 2 1
Ainsi, l’équilibre en stratégie mixte de ce jeu est : (3 𝐷 + 3 𝑀, 3 𝐷 + 3 𝑀)
4) Le jeu est simultané et non coopératif. L’information est incomplète et parfaite.
Jeu sous forme normale :
𝑁 = {1; 2}
𝑆1 = 𝑆2 = {𝑚𝑎𝑡𝑐ℎ; 𝑑𝑎𝑛𝑠𝑒} = {𝑚; 𝑑}
𝑃𝑟𝑜𝑓𝑖𝑙𝑠 𝑑𝑒 𝑠𝑡𝑟𝑎𝑡é𝑔𝑖𝑒𝑠 𝑝𝑜𝑠𝑠𝑖𝑏𝑙𝑒𝑠: 𝑆 = 𝑆1 × 𝑆2 = {(𝑚, 𝑚); (𝑑, 𝑑); (𝑚, 𝑑); (𝑑, 𝑚)}
𝑃𝑎𝑖𝑒𝑚𝑒𝑛𝑡𝑠:
𝑈1 (𝑚, 𝑚) = 𝑈2 (𝑚, 𝑚) = 2
𝑈1 (𝑑, 𝑑) = 𝑈2 (𝑑, 𝑑) = 1
𝑈1 (𝑚, 𝑑) = 𝑈2 (𝑑, 𝑚) = 𝑈1 (𝑑, 𝑚) = 𝑈1 (𝑚, 𝑑) = 0
Matrice de paiement :
𝐽1\𝐽2 D M
𝐷 (1,1) (0,0)
𝑀 (0,0) (2,2)
Forme extensive :
Les joueurs peuvent se coordonné en choisissant(𝑀, 𝑀), les intérêts ne sont pas conflictuels.
Exercice 3: Modèle de Rubinstein (1982)
Supposons deux joueurs souhaitant se partager un gâteau d’une taille fixe normalisée à 1. L’un des
deux joueurs commence le jeu en proposant une séparation du gâteau. Le second joueur accepte
ou refuse, si il refuse la proposition du premier joueur il doit proposer une nouvelle séparation du
gâteau.
Cependant, chaque proposition est couteuse pour l’individu, autrement dit plus les échanges sont
nombreux plus l’utilité procuré par la part de gâteau finalement acquise diminue.
Ainsi nous rajoutons un facteur d’escompte psychologique noté 𝛅𝐢 ∈ (𝟎, 𝟏).
Ainsi ∀𝐢 = {𝟏, 𝟐}; chaque joueur 𝐢 demande 𝐱𝐢𝐭 ∈ (𝟎, 𝟏) à la période 𝒕. La fonction d’utilité de
chaque joueur est la suivante : 𝑼𝒊 (𝒙𝒕𝒊 ) = 𝒙𝒊 𝜹𝒕𝒊 .
1) Représenter sous forme extensive ce jeu stratégique.
2) Déterminer l’équilibre de Nash de ce jeu. Existe-t-il un équilibre de Nash en stratégies
pures ? En déduire les valeurs d’équilibres.
3) Que se passe-t-il lorsque l’on fait tendre le délai d’interaction vers 0 ?
Correction :
1)
2)
Prenons 𝑣𝑖 (resp. 𝑣𝑗 ) le paiement minimum de l’individu 𝑖 (𝑟𝑒𝑠𝑝. 𝑗) et 𝑣𝑖 (𝑟𝑒𝑠𝑝. 𝑣𝑗 ) le
paiement maximum de l’individu 𝑖 (𝑟𝑒𝑠𝑝 𝑗. ) dans le sous jeu ou 𝑖 (resp. 𝑗) propose l’offre
initiale.
Le joueur 𝑗 n’acceptera aucune proposition qui lui procure moins que le minimum qu’il peut
avoir s’il refuse donc :
𝛿𝑗 𝑣𝑗 ≤ (1 − 𝑣𝑖 ) ⟺ 𝑣𝑖 ≤ (1 − 𝛿𝑗 𝑣𝑗 )(1)
Autrement dit au minimum 𝑖 doit lui garantir un paiement supérieur ou égal au paiement
minimum qu’il aura si il refuse
D’autre part, le joueur 𝑗 acceptera toutes les propositions qui lui procurent un paiement
supérieur au maximum qu’il aura s’il refuse, or 𝑖 n’a aucun intérêt de proposer un paiement à
la fois supérieur au minimum et supérieur au maximum car cela lui fait diminuer son propre
paiement alors qu’il peut tout à fait proposer un paiement maximum inférieur étant donné
qu’il propose déjà un paiement minimum supérieur tout en garantissant l’acceptation de
l’offre sous les contrats suivants.
D’autre part, nous pouvons répliquer le raisonnement pour le joueur 𝑗.
𝛿𝑗 𝑣𝑗 ≥ (1 − 𝑣𝑖 ) ⟺ 𝑣𝑖 ≥ 1 − 𝛿𝑗 𝑣𝑗 (2)
Par raisonnement symétrique nous avons aussi :
𝑣𝑗 ≤ (1 − 𝛿𝑖 𝑣𝑖 )(3)
Et
𝑣𝑗 ≥ 1 − 𝛿𝑖 𝑣𝑖
Avec (1) + (2) 𝑒𝑡 (3) + (4)on en déduit :
𝑣𝑖 − 𝑣𝑖 ≤ 𝛿𝑗 (𝑣𝑗 − 𝑣𝑗 ) (5)
𝑒𝑡
𝑣𝑗 − 𝑣𝑗 ≤ 𝛿𝑖 (𝑣𝑖 − 𝑣𝑖 ) (6)
En multipliant (5) par 𝛿𝑖 nous avons :
𝑣𝑗 − 𝑣𝑗 ≤ 𝛿𝑖 (𝑣𝑖 − 𝑣𝑖 ) ≤ 𝛿𝑗 𝛿𝑖 (𝑣𝑗 − 𝑣𝑗 )
Ainsi,
𝑣𝑗 − 𝑣𝑗 ≤ 𝛿𝑗 𝛿𝑖 (𝑣𝑗 − 𝑣𝑗 )
Etant donné que 𝛿𝑗 𝛿𝑖 ≤ 1 nous avons donc 𝑣𝑗 = 𝑣𝑗 = 𝑣𝑗 même raisonnement pour trouver
𝑣𝑖 .
On peut donc remplacer dans (1) + (2) + (3) + (4)
1−𝛿 𝛿𝑗 (1−𝛿𝑖 )
On trouve donc : 𝑣𝑖 = 1 − 𝛿𝑗 𝑣𝑗 𝑒𝑡 𝑣𝑗 = 1 − 𝛿𝑖 𝑣𝑖 ⟺ 𝑣𝑖∗ = 1−𝛿 𝛿𝑗 1 − 𝑣𝑖∗ = 1−𝛿𝑖 𝛿𝑗
= 𝛿𝑗 𝑣𝑗∗
𝑖 𝑗
Etant donné que nous avons 1 − 𝑣𝑖∗ = 𝛿𝑗 𝑣𝑗∗ 𝑗 est indifférents et accepte l’offre.
Ainsi, le deuxième joueur acceptera la première proposition conduisant à un accord
immédiat et sans délais. (stratégie pure).
D’autre part on remarque que plus le joueur est patient plus il tire avantage de sa patiente
dans le paiement final.
D’autre part nous remarquons que le premier annonceur tire avantage de sa position
puisque : 𝑣𝑖∗ ≤ 𝛿𝑖 𝑣𝑖∗ .
Il y a donc gain de préemption, c’est à dire une lutte pour le premier coup.
3)
Lorsque le délai d’interaction tend vers 0 alors 𝛿𝑖𝑡 → 1 𝑐𝑎𝑟 𝑡 → 0 ainsi l’avantage du premier coup
disparait.