0% ont trouvé ce document utile (0 vote)
93 vues31 pages

Equilibre de Nash

Ce document est une thèse préparée par Elcin Sarikaya pour obtenir un diplôme en mathématiques à l'Université Galatasaray, sous la direction de Yılmaz Akyıldız, et se concentre sur l'équilibre de Nash dans la théorie des jeux. Il présente les concepts fondamentaux de la théorie des jeux, y compris les jeux stratégiques, et explique en détail l'équilibre de Nash ainsi que des méthodes pour le trouver. La thèse inclut également des remerciements et une table des matières détaillant les sections abordées.

Transféré par

ndimbiarisoadino
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
93 vues31 pages

Equilibre de Nash

Ce document est une thèse préparée par Elcin Sarikaya pour obtenir un diplôme en mathématiques à l'Université Galatasaray, sous la direction de Yılmaz Akyıldız, et se concentre sur l'équilibre de Nash dans la théorie des jeux. Il présente les concepts fondamentaux de la théorie des jeux, y compris les jeux stratégiques, et explique en détail l'équilibre de Nash ainsi que des méthodes pour le trouver. La thèse inclut également des remerciements et une table des matières détaillant les sections abordées.

Transféré par

ndimbiarisoadino
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

PROJET DE FIN D’ETUDES

pour obtenir le diplôme de

Université Galatasaray
Spécialité : Mathématiques
Directeur : YILMAZ AKYILDIZ

ÉQUILIBRE DE NASH

préparée par Elcin SARIKAYA

Juin ’12

THÈSE

pour obtenir le diplôme de l’ Université De Galatasaray

Spécialité : Mathématiques

Directeur : YILMAZ AKYILDIZ


ÉQUILIBRE DE NASH

préparée par Elcin SARIKAYA

Juin ’12

2
INTRODUCTION

Si on disait la vie, lui-même, est un jeu stratégique, on ne aurait pas


du tout tort. Car, dès l’enfance jusqu’à la mort, nous sommes dans
une intéraction avec des personnes et nous attendons, le plus souvant,
une gain à la suite de interactions. Pour atteindre les but personnels,
parfois on agit égoı̈stement envers les gens et parfois nous nous mettons
d’accord avec eux. Ceux-ci définissent, en fait, un jeu strategique.

John F. Nash, Jr. est l’un des scientifiques les plus connus au monde
grâce à ses études sur la théorie des jeux. Il s’est interéssé aux jeux
stratégiques joués par des joueurs rationnels. En 1949 John Forbes
Nash a écrit ”le théorème fondamental de la théorie des jeux à n-
joueurs” dans sa thèse appelée ”Jeux non-coopérative”. Dans cette
thèse, Il a introduit la fameuse notion l’équilibre de Nash. Nash a aussi
présenté le problème de négotiation qui concerne les jeux coopérative.

Dans cette thèse, on commence par définir les notions de la théorie


des jeux et le jeu stratégique avec ses propriétés. Ensuite, on explique
l’équilibre de Nash et on présenté les jeux plus connus de la thérie des
jeux du point de vue de l’équilibre de Nash.

3
REMERCIEMENTS

Je tiens tout d’abord à remercier mon directeur de thèse, Prof. Yılmaz


Akyıldız, pour m’avoir fait confiance en me laissant une grande liberté
et en me faisant l’honneur de me déléguer plusieurs responsabilités.

Mes remerciements vont également à Prof. Meral Tosun, pour la gen-


tillesse et la patience qu’elle a manifestées à mon égard et pour l’aide
qu’elle m’a apportée au cours de cette recherche. Son intérêt et ses
précieux conseils m’ont été d’un grand profit.

Je remercie à tous mes professeurs du département de mathématiques,


en particuluier Mme Ulus Yıldız dont le cours de la Théorie des jeux
m’a assisté beaucoup, pour m’avoir donné la connaissance mathémath-
ique grâce à laquelle j’ai été capable d’écrire ma thèse.

Un grand merci à tous mes amis, en particulier à Ceren Tozlu qui m’a
appris les bases de LATEX.

Merci enfin à ma famille, notamment à mes parents et Burçin dont


l’affection et les encouragements m’ont rendue la vie vraiment plus
agréable.

4
Table des Matières

Introduction 3

Remerciements 4

1 Préliminaires 6
1.1 Glossaire . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 La thérie des jeux . . . . . . . . . . . . . . . . . . . . . 9
1.3 Qu’est-ce qu’un jeu stratégique . . . . . . . . . . . . . 10
1.4 Classification des jeux . . . . . . . . . . . . . . . . . . 12
1.4.1 Jeux coopératifs / non-coopératifs . . . . . . . . 12
1.4.2 Jeux simultanés/séquentiels . . . . . . . . . . . 12
1.4.3 Jeux répétés . . . . . . . . . . . . . . . . . . . . 12
1.4.4 Jeux à somme nul/somme constante . . . . . . 13
1.5 Représention des jeux . . . . . . . . . . . . . . . . . . . 13

2 Equilibre de Nash 15
2.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2 Comment trouver l’équilibre de Nash . . . . . . . . . 17
2.2.1 Domination . . . . . . . . . . . . . . . . . . . 17
2.2.2 Analyse de meilleure réponse . . . . . . . . . . 19
2.2.3 Méthode de Minimax . . . . . . . . . . . . . . 21

Références 29

5
Chapitre 1

Préliminaires

1.1 Glossaire
Définition 1.1.1. Un joueur est la personne qui fait la décision dans
un jeux.

Définition 1.1.2. Une stratégie est la spécification du comportement


d’un joueur dans n’importe quelle situation.

Définition 1.1.3. La récompense, est une mésure de satisfaction.


Dans les jeux stratégiques, on donne une échelle numérique avec laque-
lle les joueurs peuvent comparer les résultats associés à chaque combi-
naison des choix des stratégies.
On peut aussi l’appeler l’utilité. En générale, le nombre de la récom-
pense plus élevé est attaché au meilleur résultat.

Exemple 1. La compétition électorale entre des partis politiques est un


jeu stratégique où les joueurs sont des partis politiques, les stratégies
des partis sont des campagnes publicitaires et les récompenses sont des
votes obtenus à la fin de la campagne.
Définition 1.1.4. Un résultat d’un jeu est pareto-efficace si c’est le
meilleur résultat pour chaque jouer. Un résultat pareto-efficace ne peut
pas être amélioré sans faire mal au moins un joueur.

6
Figure 1.1: Pareto-efficacité

Sur le dessin, le point X n’est pas pareto-efficace, parce que nous pou-
vons produire plus de voitures sans diminuer la production du vélo en
rapprocheant le point Z. Par contre, si on deplace le point Z vers le
point W alors la production de la voiture augmente et la production
du vélo diminue ou l’inverse vers Y. Donc, les points Z,Y et W sont
pareto-efficaces.

Définition 1.1.5. L’idée de la meilleure réponse est de penser à


une stratégie qui est le mieux que vous pouvez faire en considérant ce
que des autres font.

Exemple 2. Les stratégies qui m‘ene au résultat Pareto-efficace sont


des meilleures réponses. La r’eciproque n’est pas toujours vrai, voir la
dilemme du prisonnier.
Définition 1.1.6. Un joueur est dit rationnel s’il essaye de max-
isimiser sa récompense. La théorie des jeux assume, en général, les

7
joueurs font le calcul et suivent parfaitement leurs meilleures straté-
gies. Ceci est dit le comportement rationnel.

Exemple 3. Imaginons que vous voulez acheter une voiture dont vous
avez déjà choisi le marque et vous visitez deux vendeurs de voitures
d’occasion. Ils vendent exactement la même voiture mais le premier
vendeur la vend à 5.000 euro et l’autre à 6.000 euro. Si vous êtes ra-
tionnel, vous choissez celle à 5.000 euro.

Définition 1.1.7. Un fait ou une situation est une connaissance


commune si tous les joueurs le connaissent, et savent que les autres
le connaissent.

Exemple 4. La rationalité des joueur est une connaissance commune.


Définition 1.1.8. Une stratégie mixte est une randomisation avec
des probabilités données qui déterminent la décision du joueur.

Exemple 5. Dans un jeu stratégique, si un joueur décide ses stratégies


à pile ou face, on les appelle stratégies mixtes.
Définition 1.1.9. Une stratégie pure définit une action spécifique
qu’un joueur va suivre à chaque situation possible dans un jeu. Une
telle stratégie ne peut pas être aléatoire.

Exemple 6. La stratégie pure est un cas particulier de stratégie mixte


où la probabilité de la straégie chosie est 1, et des autres sont 0.
Définition 1.1.10. Deux biens sont des substituts parfaits si le
consommateur peut complètement substituer un bien à l’autre. Peu
importe la composition des deux biens, ce qui importe est la quantité
totale.

Exemple 7. Un ordinateur produit par deux entreprises diffèrents, dis-


ons Acer et Casper, est un substitut parfait. Dans un marché où il n’y a
que Casper et Acer, si Casper augmentent le prix des ordinateurs alors
les consummateurs les substituent avec les ordinateurs d’Acer. Dans ce
cas, la quantité totale des achats ne changera pas.

8
Définition 1.1.11. Un jeu est à information complète si chaque
joueur connait tous les autres joueurs, le chronomètrage du jeu et
l’ensemble de stratègies et des rècompenses pour chaque joueur.

Exemple 8. Le jeu de dames est un jeu à information complète dont


tous les éléments sont connus par les joueurs.
Définition 1.1.12. Un jeu est fini si les nombres des joueurs et des
stratégies sont finis.

Exemple 9. L’échecs est un jeu fini où il n’y a que deux joueurs et
ses stratégies sont finis.

1.2 La théorie des jeux


Les psychologues appellent la théorie des situations sociales ce que les
économistes appellent la théorie des jeux. La théorie de jeux se fo-
calise sur l’analyse des comportements humaines et permet de décrire
nombreuses relations économique et sociales sous la forme de jeux
stratégique[1].

Il y a deux branches principales : Théorie des jeux coopérative et


Théorie des jeux noncoopérative.

La théorie des jeux coopérative décrit les résultats qui apparaissent


quand les joueurs viennent ensemble dans différentes combinaisons[2].
La théorie des jeux non-coopérative s’intéresse comment les individus
rationnels interagissent entre eux afin d’atteindre leurs propres but.
Dans cette théorie, un jeu est une modèle détaille de tous les stratégies
et les résultats valables pour chaque jouer.

Le premier théorème formel dans la théorie de jeux a été prouvé par


Antoine Cournot en 1838. Cournot a présenté une modèle de la manière
suivante :
Définition 1.2.1. (Duopole de Cournot) Une modèle de duopole est le
jeu stratégique dans lequel
1. Les joueurs sont des entreprises,
2. Les actions de chaque entreprise sont des productions possibles,
3. Les récompenses de chaque entreprise sont ses profits.

9
On verrà un exemple de la duopole de Cournot plus tard.
En 1928, John von Neumann a énoncé sont théorème de Minimax, qui
a été un vrai progrès dans l’histoire de le théorie des jeux. La théoreme
dit, dans un jeu non-coopératif à nombre fini de stratégies pures et è
somme nulle qui est joué par deux joueurs à information complète, il
existe au moins un point d’équilibre, dans laquelle personne n’a intérêt
à changer sa stratégie mixte si l’autre ne la change pas.

Le progrès suivant a été représenté par la publication de ”Theory of


Games and Economic Behavior ”[3] en 1944, aux Etats-Unis, qui était
le résultat d’une collaboration de von Neumann et l’économiste Oskar
Morgenstern. On considère en générale cet événement comme le début
de l’existence de la théorie des jeux comme une discipline mathéma-
tique. Von Neumann et Morgenstern ont commencé avec une formu-
lation détaillée du problème économique et ont montré les possibilités
d’application de la théorie des jeux à l’économie.[4]

Théorèm 1.2.2. de Von Neumann Considérer un jeu fini à somme


nulle à deux joueurs. Soient θ la stratègie mixte choisie par le premier
joueur et η la stratègie mixte choisie par le deuxiéme joueur. Si l’on
indique la récompense attendue par le premier joueur de la forme bil-
inéer h(θ, η), alors il existe toujours des stratégies mixtes θ∗ , η∗ tel que:

h(θ∗ , η∗ ) = maxθ minη h(θ, η) = minη maxθ h(θ, η) [5].

1.3 Qu’est-ce qu’un jeu stratégique


Un jeu est une interaction entre plusieurs joueurs dont le résultat
dépend des stratégies de chacun. Plus précisement, une personne est
engagée dans un jeu stratégique avec une autre personne (ou plusieurs
personnes) si son utilité et ses gains sont affectés non seulement par les
actions qu’il effectue mais aussi par les actions des autres.

Définition 1.3.1. Un jeu stratégique a n-joueurs definie par :

(1) Un ensemble, N = 1, 2, ..., n, des joueurs,


(2) Pour chaque joueur i, un ensemble des stratégies Si = (s1 , ..., sin ),
(3) Pour chaque joueur i, une fonctions d’utilité ui : S1 ×...×Sn −→ R.
On note S = S1 × ... × Sn l’espace des stratégies.
Les joueurs ont des stratégies qui mènent aux résultats différents avec
des récompenses associées.[6]

10
Exemple 10. Examinons un jeu stratégique:

Dans ce jeu, les joueurs sont Alice et Frank. Chacun d’eux n’a que
deux stratégies a jouer : Aller ou Rester.
Ici, les récompenses sont exprimé aves les nombres, celle d’Alice à
gauche et celle de Frank à droite. Notez que, en générale, le nom-
bre de la récompense plus élevé est attaché au meilleur résultat.
Maintenant, nous regardons les meilleurs réponses de chaque joueur.

Figure 1.2: Jeu stratégique

Si Alice choisit la stratégie ”Aller”, la meilleure réponse de Frank est


”Rester”. Si, autrement, Alice choisit la stratégie ”Rester”, la meilleure
réponse de Frank est toujours ”Rester” qui le donne la récompense plus
haute dans tous les deux cas.

11
1.4 Classification des jeux
Les jeux stratégiques peuvent apparaı̂tre dans plusieurs situations dif-
férentes et ont donc plusieurs propriétés différentes à étudier. Pour
simplifier l’analyse, on groupe les jeux.

1.4.1 Jeux coopératifs / non-coopératifs


Si les joueurs font les décisions collectivement et avec la pleine confi-
ance, pour que tous les joueurs profitent à la mesure possible cela est
dit le jeu coopérative. Il y a les questions de négociation et la formation
de coalition au sein de laquelle les joueurs cherchent à se regrouper afin
d’optimiser leurs gains. Si on ne permet aucune coopération parmi les
joueurs, donc nous somme dans un jeu non-coopérative, où on étudie
les réactions individuelles des joueurs face aux stratégies adoptées par
leurs adversaires.
Exemple 11. (a) Le poker est un jeu non-coopératif. Parce que, les
gains d’un joueur sont les pertes de l’autre. (b) Deux entreprises ri-
vals peuvent se coopérer à un nouveaux investissement et le jeu non-
coopératif entre eux devient un jeu coopératif.

1.4.2 Jeux simultanés/séquentiels


Dans un jeu stratégique si les joueurs decident leurs action simultané-
ment, alors on va l’appeler jeu simultané. Contrairement, si les joueurs
decident leur actions l’une après l’autre, on dirais alors c’est un jeu
séquentiel.

Exemple 12. (a) L’échecs est un jeu séquentiels. Les joueur décident
leur stratégie l’un après l’autre. (b) Le tir de penalty est un jeu simul-
tané, parce que le tireur de penalty et le gardien de but se décident leur
stratégie simultanément.

1.4.3 Jeux répétés


Les jeux répétés sont des jeux qui sont joués plus qu’une fois. Les
joueurs peuvent choisir les actions différentes en considérant combien
de fois un jeu va être joué. Parce que, l’expérience que les joueur ont
acquies après les répétition est importante pour définir les actions suiv-
antes. En plus, certain joueur pourrait choisir de perdre au début afin
de ganger plus à la fin.

12
Exemple 13. Le tennis est un jeu répété. Un joueur gagne le set s’il
atteint 7 points, mais le match se déroule au minimum deux sets.

1.4.4 Jeux à somme nul/somme constante


Un jeu à somme nulle est un jeu où la somme des utilités de tous les
joueurs est égale à 0, donc quand un joueur gagne, l’autre perd dans la
même échelle. Dans les jeux à somme positif, les jouers peuvent perdre
ou gagner à l’échelle différente. Donc, la somme des récompense est
égale à une constante c fixe.

Exemple 14. Le jeu Pierre Feuille Ciseau est un jeu à somme nulle.
Le jeu du duopole de Cournot est un jeu à somme constante. Parce
que, la somme des gains est égale à la quantité totale de production qui
ne change jamais.

1.5 Représention des jeux


On représente le jeu simultané à 2-joueurs aves des stratégies finies
sous la forme de la matrice des gains. Examinons la matrice des gains
ci-dessous.

Figure 1.3: Matrice de gains

13
A chaque coté de matrice des gains, on écrit les stratégies valables A,
B de Mehmet et Zeynep. A la cellule où une stratégie de Mehmet et
une stratégie de Zeynep coincident, on écrit l’utilités de chaque joueur
de façon que l’utilité de Mehmet à gauche et celle de Zeynep à droite.

Les jeux séquentiels sont représentés, en générale, sous la forme ex-


tensive, aussi appelée l’arbre de décision dont chaque point est associé
au joueur qui décide. Chaque branche représente une stratégie. Les
récompenses de tous sont associés aux feuilles de l’arbre.

Dans le jeu séquentiel ci-dessous:

Figure 1.4: Forme extensive

Zeynep commence au jeu et elle a deux stratégies possibles x et y.


Après la décision de Zeynep, Mehmet fait son choix entre ses straté-
gies a et b. On montre la récompense de Zeynep à gauche et celle de
Mehmet à droite aux feuilles de l’arbre.

14
Chapitre 2

Equilibre de Nash

2.1 Définition
J. F. Nash a appliqué la théorie des jeux à toutes les formes d’intéraction
humaine. Nash a montré qu’un système poussé par le méfiance et
l’égoı̈sme pourrait toujours y avoir un point d’équilibre dans lequel
l’intérêt personnel de chacun est parfaitement équilibré l’un contre
l’autre.

Dans une telle intéraction, on suppose que les jouers sont seuls et
égoı̈ste. La stabilité d’équilibre donc arriverait seulement si chacun se
comportent égoı̈stement. Parce que s’ils coopèrent le résultat devient
imprévisible. D’ici, on comprend bien que l’idée n’est pas coopérative.

Un équilibre de Nash est un état dans lequel aucun joueur ne souhaite


changer sa stratégie en tenant compte les stratégiques choisies par les
autres joueurs. Chaque stratégie est une meilleure-réponse aux straté-
gies des autres (n − 1)-joueurs[7].

Soient n ∈ N, n ≥ 2, le nombre des joueurs et Si l’ensemble des straté-


gies du joueur i. On appelle une profile de stratégie s = (s1 , s2 , ...sn ) ∈
S1 × ... × Sn où si est la stratégie du joueur i. On note par ŝi =
(s1 , ..., si−1 , si+1 ...sn ) la profile de stratégies des autres (n − 1)joueurs.

Définition 2.1.1. Avec les notation précedentes, s est une équilibre de


Nash si, pour ∀i ∈ N∗ , le choix si du joueur i est sa meilleure réponse
aux choix ŝi des autres (n − 1)joueurs.
(⇔ pour ∀i ∈ N∗ et ki ∈ Si , ui (s) ≥ ui (ki , ŝi ) où ui est la fonction de
la récompense du joueur i.)

15
Théorèm 2.1.2. (de Nash) Soit G un jeu fini. Alors il existe un équili-
bre de stratégies mixtes pour G [8].

Ceci est la solution la plus généralement utilisée dans la théorie des


jeux. Pourtant, il y a des jeux dans lequel les joueur ne jouent pas
toujours un équilibre de Nash dans un premier temps. Mais, si c’est
un jeu répété alors le premier résult converge à l’équilibre de Nash par
suite de la répétition.

Exemple 15. Imaginer un jeu où on demande à une groupe de per-


sonnes (joueurs) d’écrire un numéro entre 1-100 de la façon qu’il soit
plus proche à la moyen arithmétique de tous.
Les études déjà faits nous indiquent, dans un premier temps, la moyenne
sera entre 30 − 40. Il est donc assez loin d’équilibre de Nash de ce jeu
qui est 1. Mais si les joueurs jouent le même jeu plusieurs fois, la
moyenne convergera à 1.
Néanmoins, il y a trois motivations pour joueur l’équilibre de Nash
dans un jeu. On peut définir ces motivations de la manière suivante :

1) Aucun regret

L’idée d’aucun regret dit, au point d’équilibre de Nash, si on tient les


stratégies de chacun fixé, aucun individu n’a une motivation stricte de
s’éloigner du point d’équilibre. Donc aucun individu ne peut avoir une
strictement meilleure récompense en changeant sa stratégie, quand les
actions de chacun d’autres sont fixés.

Pourquoi nous l’appelons aucun regret ? Cela signifie ayant joué le jeu,
vous avez en fait joué un équilibre de Nash et ensuite vous regardez ce
que vous avez fait et vous savez ce que tous les autres ont fait, alors
vous dites :
-”Regrette-je mon action ? ”
-”Non, j’ai fait de mon mieux en considérant ce qu’ils ont fait.”
Donc si tous les joueurs ont annoncé leurs stratégies simultanément,
personne ne voudrait reconsidérer.

2) Les croyances auto-réalisatrices

Une deuxième idée est qu’un équilibre de Nash peut être considéré
comme une croyance auto-réalisatrices. Cela veut di que si un joueur
croit que - si tout le monde dans le jeu croit que tous les autres vont

16
jouer leur partie d’un équilibre de Nash, alors chacun jouera, en fait,
leur partie d’équilibre de Nash. Nous voyons que ceux-ci sont des croy-
ances auto-réalisatrices.

3) Les accords auto-exécutoire

Une troisième motivation est qu’un équilibre de Nash est un accord


auto-exécutoire, c’est-à-dire un accord entre deux joueurs qui est mis
en application seulement par ces deux joueurs; un troisième joueur ne
peut pas le mettre en application ni interférer et les deux joueurs se
conformeront l’accord tant que cela sera dans leur intérêt.

Vu de cette façon, l’équilibre de Nash aide à clarifier une distinction


faite entre des jeux ”coopératifs” et ”noncoopératifs”, avec des jeux
coopératifs étant ceux dans lesquels les accords peuvent mettre en ap-
plication et des jeux noncoopératifs étant ceux dans lesquels aucun
tel mécanisme d’exécution n’existe, donc les accords d’équilibre sont
durables.[9].

2.2 Comment trouver l’équilibre de Nash


L’équilibre de Nash peut être trouvé par une recherche de stratégies
dominantes, par l’élimination successive de stratégies dominées, ou par
l’analyse de meilleure réponse. Sur les jeux à somme nulle on pourrait
aussi appliquer la méthode de MiniMax qui nous donne l’équilibre de
Nash[10].

2.2.1 Domination
Puisque tous les joueurs sont assumés d’être rationnels, ils font les choix
qu’ils préfèrent le plus, en réflechissant ce que les autres font.

Dans certains jeux, un joueur peut avoir deux stratégies A et B tel


que, étant donné n’importe quelle combinaison des stratégies des autres
joueurs, la stratégie A soit meilleure que la stratégie B. Alors on dit
la stratégie A domine la stratégie B ou la stratégie B est dominée par
la stratégie A. Un joueur rationnel ne veut jamais jouer une stratégie
dominée. Alors, on elimine les stratégies dominées dans un jeu et cela
nous aide à trouver l’équilibre de Nash facilement.

17
Exemple 16. Regardons le jeu suivant :

-Jouer : (Saniye, Sarper)


-Stratégies de Saniye: A, B, C
-Stratégies de Beta : A, B

A est une stratégie dominante de Sarper et elle domine strictement B.


Parce qu’on a (6 > 2, 5 > 4 et 7 > 3).

En effet, la stratégie A donne toujours l’utilité plus haut que la stratégie


B. Donc, Sarper jouera toujours la stratégie A indépendemment ce que
Saniye choisit. Saniye n’a pas de stratégie dominante. Pourtant, on
note que A est une stratégie dominée de Saniye qui donne l’utilité le
plus bas.

Figure 2.1: Domination

18
Dans ce cas, Saniye ne jouera jamais la stratégie A, donc nous pouvons
l’éliminer. Il nous reste un jeu de la façon suivante :

Figure 2.2: Après l’élimination

Comme Sarper ne joue que A, Saniye joue la stratégie B qui donne la


récompe plus haut par rapport que la statégie C (7 > 2), alors l’équilibre
de Nash est (B,A).

2.2.2 Analyse de meilleure réponse


Plupart des jeux simultanés n’ont pas de stratégie domainante ni stratégie
dominée. Dans ce cas-là, on fait l’analyse de meilleure réponse pour
chaque joueur. Tout simplement, nous regardons la meilleure réponse
d’un joueur par rapport à toutes les stratégies des autres et nous faisons
cette analyse pour chaque joueur. Donc, cette analyse est une bonne
moyenne de trouver tous les équilibres de Nash possible dans un jeu.

19
Exemple 17. Considèrons le jeu ci-dessous :

Soient Tony et Boris deux jouers et M Rt (resp.M Rb ) la fonction de


meilleure réponse de Tony (resp. Boris).

Si Boris joue X, la meilleure réponse de Tony est de jouer Y .


Si Boris joue Y , la meilleure réponse de Tony est de jouer X.
Si Boris joue Z, la meilleure réponse de Tony est de jouer Z.
Nous écrivons les fonctions de meilleure réponse comme suivante :
M Rt (X) = Y , M Rt (Y ) = X , M Rt (Z) = Z.

Maintenant, nous trouvons les meilleures réponses de j2 .


Si Tony joue X, la meilleure réponse de Boris est de jouer X.
Si Tony joue Y , la meilleure réponse de Boris est de jouer Y .
Si Tony joue Z, la meilleure réponse de Boris est de jouer Z. M Rb (X) =
X , M Rb (Y ) = Y , M Rb (Z) = Z.

Dans le tableau, On dessine un cercle bleu autour de meilleures réponses


de Tony selon les choix de Boris et un cercle rouge à celles de Boris.
Donc, on note que les meilleurs choix s’interséctent en (Z,Z) qui est
l’équilibre de Nash de ce jeu avec la récompense (5,5). On le note
N E = (Z, Z).

Figure 2.3: L’analyse de meilleure réponse

20
2.2.3 Méthode de Minimax
La méthode de Minimax est un concept de solution alternative pour
les jeux simultanés. On ne l’applique qu’aux jeux à somme nulle, parce
que dans ce type de jeux quand un joueur perd, l’autre gagne exacte-
ment la même quantité. Cela veut dire que le meilleur résultat d’un
jouer est équivalent au pire résultat d’autre.

L’idée est de trouver la pire de meilleures réponses d’un joueur et la


meilleure de pires réponses d’autre joueur. Cette logique peut sembler
extrêmement pessimiste, mais il compte toujours sur un type de cal-
cul de meilleure réponse et c’est approprié à trouver l’équilibre d’un
jeu à somme nulle. Dans l’équilibre, chaque joueur choisit sa propre
meilleure réponse, selon ses croyances de ce que l’autre a fait.

Exemple 18. Nous examinons le jeu ci-dessous montré par le tableau.

On commence en trouvant le nombre le plus bas dans chaque rang ( la


pire récompense de Pierre de chaque stratégie) et le nombre le plus haut
dans chaque colonne (la pire récompense de Marie de chaque stratégie).

La pire récompense de Pierre de A est 3, de B est 1 et de C est 4.


La meilleure récompense de Marie de X est 4, de Y est 5 et de Z est 7.

Nous écrivons le minimum de chaque rang et le maximum de chaque


colonne comme vous voyez sur le figure. Le plus grand des minimums
de rang est 4; ceci est son Maximin. Le plus bas des maximums de
colonne est 4 qui est son Minimax.

21
Figure 2.4: Méthode de Minimax

Regardant ces deux choix de stratégie, nous voyons que le Maximin et


Minimax estimés sont trouvés dans la même cellule de la table de jeu.
Ainsi la stratégie de Maximin de Pierre est sa réponse la meilleure à
MiniMax de Marie et vice versa; On a trouvé l’équilibre Nash de ce jeu.

Exemple 19. (Dilemme du prisonnier)


L’équilibre de Nash est utile non seulement dans les jeux mais aussi
dans les sciences sociales. Les dilemmes sont des modèles les plus im-
portantes des problèmes sociales.

Imaginons qu’une femme et un homme coupables d’un délit sont ar-


rêtés et interrogés séparément par la police.

Ils ont deux choix possible: Dénoncer ou Avouer le délit.

Confrontés à ce choix et sans possibilité de communiquer l’un avec


l’autre, l’homme et la femme se rétrouvent à une situation que l’on ap-
pelle dilemme du prisonnier. Plus généralement, il s’agit d’une situa-
tion où chaque individu peut faire un choix entre une stratégie coopéra-
tive (avouer) et une stratégie trichant (dénoncer) oû chacun fait mieux
pour avouer, indépendamment de ce que l’autre joueur fait.

22
Figure 2.5: Dilemme du prisonnier

Le résultat d’équilibre exige que les deux joueurs décident d’avouer et


chacun passe 10 ans en prison. Si tous les deux avaient voulu dénoncer
n’importe quelle participation, cependant, ils auraient été mieux avec
seulement 3 ans en prison. On voit que l’équilibre de Nash de ce jeu
n’est pas pareto efficace. Donc, l’existence d’un équilibre n’implique
pas que celui-ci soit nécessairement optimal.

Imaginons que nous permettons l’homme et la femme de se commu-


niquer, alors tous les deux décideront ”dénoncer” qui est l’équilibre
pareto-efficace. Mais, cette équilibre n’est pas stable. Parce que, dans
ce cas, chacun d’eux désire de changer ses stratégies à ”avouer” en croy-
ant que l’autre jouerrait ”dénoncer”. Donc, ils reviennent à l’équilibre
de Nash.

Exemple 20. (Jeux de coordinations)


Les jeux de coordination représentent les jeux avec des équilibres de
Nash multiples où les stratégies sont idéntiques. Dans ces jeux, deux
structure de communication sont valables :

1) communication à sens unique


2) commnuication à double sens

23
Nous considérons qu’il y a deux types pricipales de jeux de coordina-
tion, l’un avec une stratégie coopérative ce que l’on appelle les jeux de
pure coordination et l’autre dans lequel une stratégie est moins risqué
par rapport à l’autre ce que l’on dit la bataille des sexes. On verrà la
distinction plus clairement dans les exemples suivants[11].

Jeux de pure coordination

Imaginons que Martin et Quentin veulent faire une activité pour di-
manche soir et il y a deux possibilité : ou ils vont au match de football
ou bien il vont au match de basketball. Les récompenses de chacun
sont comme suivant :

Figure 2.6: Jeux de pure coordination

• S’ils vont au match de football, ses récompenses seront


(F ootball, F ootball) = (15, 15). Parce que, tous les deux préferent
le match de football au match de basketball.
• Si tous les deux vont au match de basketball, ils seront contents
mais, ses récompenses seront (Basketball, Basketball) = (2, 2).
• S’ils vont des matchs différents, c’est le pire cas pour tous les deux
(Basketball, F ootball) = (F ootball, Basketball) = (0, 0).

24
Car, ils font ses choix sans communication, il apparaı̂t deux équilibres
de Nash de jeux, ou (F ootball, F ootball) est l’équilibre Pareto domi-
nant qui est la meilleure pour tous les deux et (Basketball, Basketball)
est l’équilibre moins favorable. Donc, ils veulent coordonner ses choix
sur l’équilibre Pareto dominant.

Ce jeu est un exemle de jeu de pure coordination. C’est différent de


dilemme du prisonnier de deux façons : premièrement, il n’y pas de
stratégies dominantes dans les jeux de pure coordination et la commu-
nication peut faire une différence dans les jeux de pure coordination
contrairement à la dilemme du prisonnier.

Si, par exemple, ils se téléphonent avant de sortir, ils s’accordent proba-
blement pour aller au match de foot. Donc, nous voyons bien que dans
les jeux de pure coordination la communication à double sens mène a
l’équilibre Pareto dominant.

Bataille des sexes

La bataille des sexes est un jeu de coordination où les joueur veulent
coordonnner sur les équilibres différents. Examinons le jeu suivant:

Henry et Audrey se décident d’aller au cinéma et il y a deux films qu’ils


peuvent voir : Avatar et Reader.

Puisque Henry aime le science fiction il a tendance à préférer aller


Avatar à Reader et réciproquement Audrey a tendence à préférer d’aller
Reader à Avatar.

S’ils vont à voir Avatar la récompense sera (Henry, Audrey) = (3, 1) et


s’ils vont à voir Reader, la récompense sera (Henry, Audrey) = (1, 3).
Au cas oû ils vont des films différents, la récompense de chacun sera 0.
Parce que tous les deux veulent voir le film ensemble.

25
Figure 2.7: Bataille des sexes

Si nous les permettons de se communiquer, il s’agira d’une négation en-


tre les deux qui ne mène pas toujours un accord parce qu’ils préferent
les équilibres différentes. Dans ce cas, la communication à sens unique
peut fonctionner. Par exemple, si Audrey dit qu’elle va certainement
aller à Reader, Henry fait mieux d’accorder avec cette décision ou vice
versa.

Exemple 21. (Duopole de Cournot)


La duopole de Cournot est intéressante, parce qu’il y a deux entreprises
qui rivalisent dans le même marché avec plusieus stratégies et que la
duopole se trouve entre les deux cas extrêmes : la compétition parfaite
et la monopole.

On l’examinera mieux dans l’exemple suivant :

Dans ce jeu, chaque entreprise choisit sa production indépendamment


et le marché détermine le prix auquel il est vendu.

26
• Les joueurs : 2 entreprises (Nokia, Samsung)

• Les stratégies : les quantités d’un produit idéntique qu’ils pro-


duisent.
q1 : quantité de Nokia, q2 : quantité de Samsung, q = q1 + q2 :
quantité totale. Notons que ces deux produit sont des substitut
parfait.

• Le coût de production : cq ou q est la quantité totale et c est


constante du coût marginale.

• Le prix : Soient a et b constants, on montre le prix de la manière


suivante p = a − b(q1 + q2 )
Cette équation nous montre que plus ces entreprises produisent,
moins les produits coûtent. Voyons sur le figure :

Figure 2.8: Prix-Production

• Les récompenses : les profits u1 , u2 .

u1 (q1 , q2 ) = pq1 − cq1 et idéntiquement u2 (q1 , q2 ) = pq2 − cq2


Le but des entreprises est de maximiser ses profit.

Dans ce probleme, on va essayer de trouver la quantité de meilleure


réponse de Samsung par rapport à chaque choix possible de Nokia, et
vice versa. Apres on verrà où elles s’interséchent sur le dessin.

27
Premièrement, on remplace la fonction du prix p dans la fonction u1
par a − b(q1 + q2 ); on obtient: u1 (q1 , q2 ) = aq1 − 2bq12 − bq1 q2 − cq1

Afin de trouver le maximum nous la différentions par rapport à q1 et


la faisons équivalente à 0 : a − 2bq1 − bq2 − c = 0

Redifférentiant, il devient −2b < 0 donc on trouve bien un maxi-


mum à la place d’un minimum. Alors M R1 (q2 ) = q1∗ = (a−c) 2b
− q22
et M R2 (q1 ) = q2∗ = (a−c)
2b
− q21 sont de meilleures réponses de Nokia
et Samsung respectivement. Avant de décrire le figure, on trouve les
points critiques :
(a−c) (a−c)
q2 = 0 =⇒ M R1 (0) = q1∗ = 2b
et q1∗ = 0 =⇒ 2
= q2 et c’est le
même pour Samsung.

Figure 2.9: Prix-Production 2

Pour trouver où ces deux fonctions de meilleure réponse coincı̈dent, on


résoudre l’égalité suivante : M R1 (q2 ) = M R2 (q1 )

Nous trouvons q1∗ = (a−c)


b
− q2∗ et q2∗ = (a−c)
b
− q1∗ , alors q1∗ = (a−c)
3b
= q2∗ .
On appelle cette quantité : La quantité de Cournot.

28
Figure 2.10: Duopole de Cournot

Qui se passe si l’on produit la moitié de la quantité de Monopole ?


Signer un contrat pour produire le moitié de la quantité est illégal donc
ils peuvent s’accordent sans un papier officiel. Dans ce cas, il y aura
toujours un qui triche pour maximiser sa récompense et à la fin ils
convergent au point d’équilibre de Nash. Si, autrement, ils produisent
ses quantités competitives, alors les nouveaux entreprises vont entrer
au marché.

29
Références

Articles
[1]DAVID K. LEVINE : What is Game Theory? Department of
Economics, UCLA

[2]ADAM BRANDENBURGER : Cooperative Game Theory:


Characteristic Functions, Allocations, Marginal Contribution
Version 01/04/07

[3]J. VON NEUMANN et [Link] : Theory of


Games and Economic Behavior Princeton University Press,
Princeton, NJ, 2nd ed., 1947 (first edition: 1944).

[4]MAGDALENA HYKSOVA : Several Milestones in the


History of Game Theory Prague

[5]SEBASTIEN KONIECZNY : Introduction à la Théorie


des Jeux Universite d’Artois - Lens

[6]TINNE HOFF KJELDSEN : John von Neumann,Äôs Con-


ception of the Minimax Theorem: A Journey Through Different
Mathematical Contexts Springer-Verlag 2001

[7] J. F. NASH JR. : Equilibrium points in n-person games


[Link]. Acad. Sci. USA 36 (1950).

[8]JOHN F. NASH JR : Non Cooperatif Games The An-


nals of Mathematics, Second Series, Volume 54, Issue 2, Sept,
1951.

[9]CHARLES A. HOLT et ALVIN E. ROTH : The Nash


equilibrium: A perspective Department of Economics, University
of Virginia, Charlottesville, VA 22904-4182; and Department
of Economics and Harvard BusinessSchool, Harvard University,

30
Cambridge, MA 02138

[10] AVINASH DIXIT et SUSAN SKEATH : Games of Strategy


Second Edition 2004 , W:W Norton and Company,Inc.

[11] RUSSEL COOPER, DOUGLAS V. DEJONG, ROBERT


FORSYTHE et THOMAS W. ROSS : Communicatcation in Co-
ordination Games The Quarterly Journal of Economics,Vol.107,
No.2 May,1992.

[12] BEN POLAK : Game Theory Open Yale Courses,


ECON 159, Fall 2007.

MARTIN J. OSBORN : An introduction to game theory


2002/7/23, Chapter 2 :Nash Equilibrium: Theory

ERIC VAN DAMME : John Nash and the Analysis of Ra-


tional Behavior Tilburg University, April 2000.

JOHN F. NASH, Jr.: The Bargaining Problem Economet-


rica, Vol. 18, No. 2. (Apr., 1950), pp. 155-162.

MARTIN J. OSBORN : An introduction to game theory


2002/7/23, Chapter 2 :Nash Equilibrium: Theory

31

Vous aimerez peut-être aussi