Chapitre 2
Les critères de décision en univers non
mesurable (univers incertain)
2.1 Introduction
En univers non mesurable (incertain) le décideur a une connaissance, exhaustive ou non, des diverses
éventualités, toutefois, en dépit de tous ces éléments d’information, il ne se sent pas en mesure d’affecter
une quelconque probabilité de réalisation à chacune des réactions possibles de la nature. C’est dans le
cadre d’une situation de ce type qu’un recours aux critères de décision en univers non mesurable est
souvent proposé.
Un très grand nombre de ces critères de décision ont été formulés : nous nous limiterons dans ce cours
à la présentation et à l’évaluation des critères les plus significatifs, à savoir le critère : de LAPLACE,
de WALD, de MAXMAX, de SAVAGE, d’HURWITZ, de BERNOULLI et le critère de MOYENNE-
VARIABILITE. Chacun de ces critères correspond à un type de comportement particulier des décideurs.
Nous définirons pour chacun de ces critères une fonction de valorisation V et un critère de choix, qui
permettront d’établir un classement dans l’ensembles des actions possibles A et définir ainsi l’action
optimale.
2.2 Le critère de LAPLACE
Il consiste à faire usage du ”principe de raison insuffisante” pour supposer que la vraisemblance
des divers états de la nature est identique puisque l’on ne dispose d’aucune information quant à leur
vraisemblance relative. Ce critère consiste donc à effectuer une simple moyenne arithmétique des revenus
espérés, associés pour chaque action aux divers états de la nature, puis à retenir l’action dont la moyenne
est la plus élevée. En effet, la fonction de valorisation et le critère de choix de ce critère sont donnés
comme suit :
Fonction de valorisation :
Évaluer la moyenne des résultats de chaque action :
en
1 X
V (aj ) = moy(aj ) = Raj ,ei .
n e =e
i 1
15
2.3 Le critère de WALD ou critère du MAXMIN 16
Critère de choix :
Classer les actions par moyenne croissante, puis choisir l’action optimale comme celle dont la
moyenne est la plus élevée. i.e :
h i h i
ak al ⇔ V (ak ) = moy(ak ) > V (al ) = moy(al ) .
Donc on a :
a∗ ∈ arg max V (aj ).
Exemple :
Dans l’exemple introductif donné, le choix du critère de LAPLACE comme aide à la décision conduirait
les dirigeants de l’entreprise à retenir l’action a4 , c’est-à-dire une baisse de prix. En effet :
e3
1 X 1
V (a1 ) = moy(a1 ) = Raj ,ei = (−600.000 + 400.000 + 1.100.000) = 300.000;
3 e =e 3
i 1
e3
1 X 1
V (a2 ) = moy(a2 ) = Raj ,ei = (−50.000 + 100.000 + 300.000) = 116.667;
3 e =e 3
i 1
e3
1 X 1
V (a3 ) = moy(a3 ) = Raj ,ei = (−400.000 + 200.000 + 700.000) = 166.667;
3 e =e 3
i 1
e3
X1 1
V (a4 ) = moy(a4 ) = Raj ,ei = (−100.000 + 300.000 + 800.000) = 333.333.
3 e =e 3
i 1
On a : V (a4 ) > V (a1 ) > V (a3 ) > V (a2 ) ⇒ a4 a1 a3 a2 ⇒ a∗ = a4 .
L’avantage de ce critère réside dans sa simplicité de calcul, son inconvénient majeur est d’être peu
réaliste : on prétend raisonner en avenir indéterminé, c’est-à-dire dans le cadre d’une situation où l’on
ne peut pas, ou ne veut pas, affecter une probabilité de réalisation à chacun des états de nature, alors
que le choix du critère de LAPLACE équivaut, par l’intermédiaire du choix de l’instrument «moyenne
arithmétique», à attribuer implicitement la même probabilité d’arrivée aux divers états de la nature. Par
ailleurs, ce critère correspond à un type de comportement des dirigeants d’entreprises tout à fait parti-
culier, caractérisé par une neutralité totale à l’égard du risque. Nous verrons ultérieurement qu’un tel
comportement est peu représentatif de leur attitude réelle à l’égard du risque : en effet ils sont rarement
neutres à cet égard ; tantôt l’amour du jeu les conduira à un optimisme déraisonné, tantôt au contraire
la crainte de l’échec les conduira à des évaluations systématiquement pessimistes du rendement de leurs
projets d’investissement. C’est à des règles d’action correspondant à chacun de ces deux types de com-
portement que conduisent les critères suivants.
2.3 Le critère de WALD ou critère du MAXMIN
Le critère de WALD (dit aussi critère de MAXMIN) est le critère du ”pessimisme absolu” : on fonde
son choix uniquement sur ce qui arrivera de pire. L’adoption de ce critère correspond à une attitude
prudente du preneur de décision : celui-ci cherchera à identifier pour chaque action possible l’état de
nature qui conduirait aux moins bons résultats. Après quoi, il cherchera à se couvrir en adoptant l’action
qui est susceptible de lui fournir, si l’évolution de la concurrence s’avère défavorable à l’entreprise, le
résultat le moins mauvais possible (le maximum des minimums potentiels). Plus formellement le critère
de WALD conduira à choisir l’action dont la fonction de valorisation suivante est la plus élevée.
2.4 Le critère du MAXMAX 17
Fonction de valorisation :
V (aj ) = inf Raj ,ei .
ei
Critère de choix :
h i h i
On a : ak al ⇔ V (ak ) > V (al ) ;
l’action optimale consistera à opter pour le plus grand maximum. C’est à dire :
a∗ ∈ arg max V (aj ).
Ce critère est trop pessimiste, en effet, en utilisant le critère de WALD, l’agent se comporte comme un
pessimiste qui se dit : «je n’ai pas de chance donc je vais choisir l’action qui a le plus grand résultat
minimum : je suis certain d’avoir au moins ce minimum». Ce critère convient au décideur ayant une
aversion au risque.
Exemple :
Dans l’exemple introductif donné, le choix du critère de WALD conduira à choisir a2 , c’est-à-dire ”le
lancement d’une campagne publicitaire”, qui donne une perte maximale de −50.000. En effet :
V (a1 ) = inf Ra1 ,ei = inf {−600.000, 400.000, 1.100.000} = −600.000.
ei ei
V (a2 ) = inf Ra2 ,ei = inf {−50.000, 100.000, 300.000} = −50.000.
ei ei
V (a3 ) = inf Ra3 ,ei = inf {−400.000, 200.000, 700.000} = −400.000.
ei ei
V (a4 ) = inf Ra4 ,ei = inf {−100.000, 300.000, 800.000} = −100.000.
ei ei
h i h i
On a : V (a2 ) > V (a4 ) > V (a3 ) > V (a1 ) ⇒ a2 a4 a3 a1 ⇒ a∗ = a2 .
2.4 Le critère du MAXMAX
Le critère du MAXMAX est le critère de ”l’optimisme absolu” : on fonde son choix uniquement
sur ce qui arrivera de meilleur. L’adoption de ce critère correspond à une attitude trop optimiste du
preneur de décision : celui-ci cherchera à identifier pour chaque action possible l’état de nature qui
conduirait aux meilleur bons résultats. Après quoi, il cherchera à gagner plus en adoptant l’action qui est
susceptible de lui fournir le résultat dont le gain est le plus bon (le maximum des maximums potentiels).
Plus formellement le critère de MAXMAX conduira à choisir l’action dont la fonction de valorisation
suivante est la plus élevée.
Fonction de valorisation :
V (aj ) = sup Raj ,ei .
ei
2.5 Le critère de SAVAGE 18
Critère de choix :
h i h i
On a : ak al ⇔ V (ak ) > V (al ) ;
d’où :
a∗ ∈ arg max V (aj ).
Ce critère est trop optimiste, en effet, en utilisant le critère du MAXMAX, l’agent se comporte comme
un optimiste qui ne voit que la possibilité de gagner le plus possible en omettant les possibilités de gain
inférieur.
Exemple : Dans l’exemple introductif donné, le choix du critère du MAXMAX conduit à choisir a1 ,
c’est-à-dire ”le lancement d’un produit nouveau”, qui donne un gain maximal de 1.100.000. En effet :
V (a1 ) = sup Ra1 ,ei = sup{−600.000, 400.000, 1.100.000} = 1.100.000.
ei ei
V (a2 ) = sup Ra2 ,ei = sup{−50.000, 100.000, 300.000} = 300.000.
ei ei
V (a3 ) = sup Ra3 ,ei = sup{−400.000, 200.000, 700.000} = 700.000.
ei ei
V (a4 ) = sup Ra4 ,ei = sup{−100.000, 300.000, 800.000} = 800.000.
ei ei
On a : V (a1 ) > V (a4 ) > V (a3 ) > V (a2 ) ⇒ a1 a4 a3 a2 ⇒ a∗ = a1 .
2.5 Le critère de SAVAGE
Comme le critère de WALD, ce critère de SAVAGE traduit une attitude de prudence de la part du
décideur. Le principe de ce critère consiste à identifier pour chacun des états de la nature l’action la
plus favorable, puis à évaluer le manque à gagner (regret) que présenterait, par rapport à cette action
l’adoption de chacune des autres actions, enfin à retenir l’action conduisant au plus petit des regrets
maximums.
Fonction de valorisation :
en
X
V (aj ) = SR(aj ) = sup Raj ,ei − Raj ,ei
aj
e1
Critère de choix :
Choisir l’action dont la fonction de regret est la plus faible ; i.e. :
a∗ ∈ arg min SR(aj ).
Exemple : Reprenons l’exemple introductif déjà considéré. Les regrets associés dans cet exemple à
chacune des actions concurrentes sont les suivants :
2.6 Le critère d’HURWICZ 19
En effet :
V (a1 ) = SR(a1 );
= (−50.000 − (−600.000)) + (400.000 − 400.000) + (1.100.000 − 1.100.000) = 550.000;
V (a2 ) = SR(a2 );
= (−50.000 − (−50.000)) + (400.000 − 100.000) + (1.100.000 − 300.000) = 1.000.000;
V (a3 ) = SR(a3 );
= (−50.000 − (−400.000)) + (400.000 − 200.000) + (1.100.000 − 700.000) = 950.000;
V (a4 ) = SR(a4 );
= (−50.000 − (−100.000)) + (400.000 − 300.000) + (1.100.000 − 800.000) = 450.000;
On a : min{550.000, 1.000.000, 950.000, 450.000} = 450.000, il en résulte de ce critère que c’est l’action
a4 qu’il faut choisir, i.e. a∗ = a4 .
2.6 Le critère d’HURWICZ
Les deux critères (SAVAGE et WALD) ont un caractère commun : celui d’être associé à l’idée que
la nature est fondamentalement hostile au décideur. C’est cette idée que HURWICZ remet en cause,
en introduisant la possibilité d’une nature plus clémente à l’égard du décideur. Le critère d’HURWICZ
défini un degré d’optimisme (α) et un degré de pessimisme (1−α). Concrètement le critère qu’il propose
HURWICZ consiste à calculer pour chacune des stratégies une moyenne pondérée H du pire et du
meilleur de ses résultats potentiels, et à choisir l’action pour laquelle H est la plus grande, c’est à dire
on a :
Fonction de valorisation :
V (aj ) = H(aj ) = (1 − α)m + αM = (1 − α) inf Raj ,ei + α sup Raj ,ei ;
ei ei
avec :
m : le pire des résultats ;
M : le meilleur des résultats ;
α : est un coefficient compris entre 0 et 1, traduisant le degré d’optimisme du décideur.
2.6 Le critère d’HURWICZ 20
Critère de choix :
On a :
ak al ⇔ H(ak ) > H(al )
d’où :
a∗ ∈ arg max H(aj ).
Exemple :
On reprend notre exemple introductif, on aura :
V (a1 ) = H(a1 ) = (1 − α)(−600.000) + α1.100.000 = 1.700.000α − 600.000;
V (a2 ) = H(a2 ) = (1 − α)(−50.000) + α300.000 = 350.000α − 50.000;
V (a3 ) = H(a3 ) = (1 − α)(−400.000) + α700.000 = 1.100.000α − 400.000;
V (a4 ) = H(a4 ) = (1 − α)(−100.000) + α800.000 = 900.000α − 100.000;
Comparaison de a1 et a2 :
11
H(a1 ) > H(a2 ) ⇔ 1.700.000α − 600.000 > 350.000α − 50.000 ⇔ α > 27 .
Comparaison de a1 et a3 :
H(a1 ) > H(a3 ) ⇔ 1.700.000α − 600.000 > 1.100.000α − 400.000 ⇔ α > 31 .
Comparaison de a1 et a4 :
H(a1 ) > H(a3 ) ⇔ 1.700.000α − 600.000 > 900.000α − 100.000 ⇔ α > 85 .
Comparaison de a3 et a2 :
H(a3 ) > H(a2 ) ⇔ 1.100.000α − 400.000 > 350.000α − 50.000 ⇔ α > 87 .
Comparaison de a4 et a2 :
1
H(a4 ) > H(a2 ) ⇔ 900.000α − 100.000 > 350.000α − 50.000 ⇔ α > 11 .
Comparaison de a3 et a4 :
H(a3 ) > H(a4 ) ⇔ 1.100.000α − 400.000 > 900.000α − 100.000 ⇔ α > 23 .
1
Le choix dépendra étroitement du niveau d’optimisme α. Ainsi, si on suppose que α = 4
alors :
1
H(a1 ) = 1.700.000( ) − 600.000 = −175.000;
4
1
H(a2 ) = 350.000( ) − 50.000 = 375.000;
4
1
H(a3 ) = 1.100.000( ) − 400.000 = −125.000;
4
1
H(a4 ) = 900.000( ) − 100.000 = 125.000.
4
Donc :
H(a2 ) > H(a4 ) > H(a3 ) > H(a1 ) ⇒ a2 a4 a3 a1 ⇒ a∗ = a2 .
Remarque 2.1.
I Ce critère d’HURWITZ est une généralisation du choix d’un agent qui ne serait ni complètement
optimiste, ni complètement pessimiste.
Si α = 0, l’agent est résolument pessimiste ; mais si α = 1, l’agent est résolument optimiste.
I Pour ce critère l’agent doit connaı̂tre son degré d’optimisme α. Il peut être déterminé par des
spécialistes avec des tests psychologiques.
2.7 Le critère MOYENNE-VARIABILITE 21
I Lorsque α = 0, le critère d’HURWITZ se confond avec le critère de WALD : la meilleure action
est alors a2 i.e. ”le lancement de la campagne publicitaire”.
I Lorsque α = 1, il conduit le décideur à ne prendre en considération que le meilleur des résultats
potentiels (à cette éventualité correspondrait un optimisme à toute épreuve du décideur) et le choix
de l’action a1 , i.e. ”lancement d’un produit nouveau”.
I Si par contre, α = 0.5 i.e. le décideur n’est ni trop optimiste ni trop pessimiste, alors :
H(aj ) = (1 − 0.5)m + 0.5M = 0.5(m + M );
donc :
H(a1 ) = 0.5(m + M ) = 0.5(−600.000 + 1.100.000) = 250.000;
H(a2 ) = 0.5(m + M ) = 0.5(−50.000 + 300.000) = 125.000;
H(a3 ) = 0.5(m + M ) = 0.5(−400.000 + 700.000) = 100.000;
H(a4 ) = 0.5(m + M ) = 0.5(−100.000 + 700.000) = 300.000;
M ax{H(a1 ), H(a2 ), H(a3 ), H(a4 )} = H(a4 ) = 300.000 ⇒ a∗ = a4 . Donc, le meilleur choix est
alors l’action a4 , i.e. le même résultat obtenu avec le critère de LAPLACE, correspondant à ”une
baisse de prix”.
I Il y’a des ouvrages et des cours sur le net où la fonction de valorisation du critère HURWITZ est
donnée par :
V (aj ) = H(aj ) = αm + (1 − α)M ;
alors, il faut faire attention, ici le α est le degré du pessimisme du décideur et non son degré
l’optimisme.
2.7 Le critère MOYENNE-VARIABILITE
On sait tous que la moyenne est un critère de position donc quand on évalue chaque action d’un
problème de décision par le biais de sa moyenne, nous ne tenons pas compte de son caractère variable
(aléatoire).
Exemple : Supposons que je vous donne la moyenne générale de vos notes l’examen du module ”Eco-
nomie de l’incertain et théorie de risque” que j’ai évaluée à 10. Sachant que votre section est de 240
étudiants, est ce que vous serez ravies de cette nouvelle ? Autrement dit, est ce vous allez dire que vos
résultats sont bons dans ce module ?
Bien sûr, la réponse à cette question ne peut pas être affirmative sans donner d’autres informations. En
effet, comme on l’a déjà dit, la moyenne est un critère de position, elle ne tient pas compte du caractère
aléatoire de vos notes. Donc, on peut avoir par exemple une situation où la moitié de votre section i.e.
120 étudiants ont eu des 20 et l’autre moitié ont eu des 0, ce qui donne une moyenne de 10. Cependant,
dans ce cas le niveau de la section n’est pas bon, puisque la moitié de son effectif a eu des notes nulles.
Il est à signaler que dans ce cas, la dispersion de vos notes est très grande, elle est d’ordre 20-0=20. Bien
sûr, on peut avoir une situation, disant que je préférerai en ton votre enseignante, celle où tout le monde a
un 10, donc la moyenne vaut 10 et il n’y a pas de dispersion dans vos notes, donc le niveau de la section
dans ce cas est vraiment moyen.
Ce critère de MOYENNE-VARIABILITE tient compte de ce caractère aléatoire on introduisant la va-
riabilité mesurant l’écart entre le meilleur et le pire résultat. C’est pour cela que chaque action est ca-
ractérisée dans ce critère par un couple composé de sa moyenne et sa variabilité. Ainsi :
2.7 Le critère MOYENNE-VARIABILITE 22
Fonction de valorisation :
La fonction de valorisation est caractérisée par le couple (moy(aj ), ∆(aj )) défini par :
n e
1X
moy(aj ) = Raj ,ei ;
n e
1
∆(aj ) = sup Raj ,ei − inf Raj ,ei .
ei ei
Critère de choix n˚ 1 :
moy(ak ) > moy(al ) et ∆(ak ) < ∆(al );
ak al si ou bien
moy(ak ) > moy(al ) et ∆(ak ) ≤ ∆(al ).
Ce premier critère est assez restrictif. En effet, selon ce critère le décideur apprécie une action à forte
moyenne et à variabilité faible. Cependant, il ne prend pas en considération le fait qu’une forte variabilité
compensée par une forte moyenne puisse être intéressante. Donc ce critère ne fonctionne pas toujours :
il faut le compléter. Ainsi, si ce critère n˚1 ne permettait pas de se prononcer, on utiliserait le critère de
choix n˚ 2 ou n˚3 qui seront définis par la suite.
Exemple :
Appliquons ce premier critère de choix à notre exemple introductif. On a :
moy(a1 ) = 300.000; ∆(a1 ) = 1.100.000 − (−600.000) = 1.700.000;
moy(a2 ) = 116.667; ∆(a2 ) = 300.000 − (−50.000) = 350.000;
moy(a3 ) = 166.660; ∆(a3 ) = 700.000 − (−400.000) = 1.000.000;
moy(a4 ) = 333.333; ∆(a4 ) = 800.000 − (−100.000) = 700.000;
On va comparer les actions deux à deux. Ainsi, pour chaque action, nous calculons le couple (moyenne,
variabilité) :
moy(a1 ) > moy(a2 ) et ∆(a1 ) > ∆(a2 ) ⇒ on ne peut rien conclure;
moy(a1 ) > moy(a3 ) et ∆(a1 ) > ∆(a3 ) ⇒ on ne peut rien conclure;
moy(a4 ) > moy(a1 ) et ∆(a4 ) < ∆(a1 ) ⇒ a4 a1 ;
moy(a3 ) > moy(a2 ) et ∆(a3 ) > ∆(a2 ) ⇒ on ne peut rien conclure;
moy(a4 ) > moy(a2 ) et ∆(a4 ) > ∆(a1 ) ⇒ on ne peut rien conclure;
moy(a4 ) > moy(a3 ) et ∆(a4 ) < ∆(a3 ) ⇒ a4 a3 .
On remarque que cette première règle permet de classer a4 et a1 , ansi que a4 et a3 , en effet on a a4 a1
et a4 a3 . Cependant pour classer le reste des autres actions on devra faire appel aux autres critères de
la MOYENNE-VARIABILITE, à savoir les critères n˚2 et n˚3 suivants :
Critère de choix n˚ 2 :
Cette règle consiste à mesurer le pourcentage de moyenne par unité de variabilité. La meilleur action
sera celle qui aura la plus grande moyenne par unité de variabilité, c’est à dire :
moy(ak ) moy(al )
ak al si > ;
∆(ak ) ∆(al )
2.7 Le critère MOYENNE-VARIABILITE 23
Exemple : On va essayer de classer le reste des autres actions de notre exemple introductif, que le critère
n˚1 n’a pas pu classer.
Comparaison des deux actions a1 et a2 :
h moy(a ) 300.000 i h moy(a ) 116.667 i
1 2
= = 0, 1764 < = = 0, 3333 ⇒ a2 a1 .
∆(a1 ) 1.700.000 ∆(a2 ) 350.000
Comparaison des deux actions a1 et a3 :
h moy(a ) 300.000 i h moy(a ) 166.660 i
1 3
= = 0, 1764 > = = 0, 1666 ⇒ a1 a3 .
∆(a1 ) 1.700.000 ∆(a3 ) 1.000.000
Comparaison des deux actions a3 et a2 :
h moy(a ) i h moy(a ) i
3 2
= 0, 1666 < = 0, 3333 ⇒ a2 a3 .
∆(a3 ) ∆(a2 )
Comparaison des deux actions a4 et a2 :
h moy(a ) 333.333 i h moy(a ) i
4 2
= = 0, 4761 > = 0, 3333 ⇒ a4 a2 .
∆(a4 ) 700.000 ∆(a2 )
Ce deuxième critère nous a permis de classer les quatre actions. En effet, on a :
a4 a2 a1 a3 ⇒ a∗ = a4 .
Critère de choix n˚ 3 :
moy(ak ) − moy(al )
ak al si > λ.
∆(ak ) − ∆(al )
Ce critère apporte une notion de déplacement mesuré par le TMS (Taux Marginal de Substitution) entre
la moyenne et la variabilité. On peut donc changer d’action à condition que le taux d’échange soit assez
élevé.
Rappel : Le TMS correspond pour un panier de biens donné (atemporel ou intertemporel), au taux
d’échange maximum entre les deux biens sans que l’utilité du détenteur du panier ne s’en trouve
modifié.
Remarque 2.2. Il faut toujours tester deux actions de telle façon que le numérateur et le dénominateur
soient positifs
Exemple : Toutes les actions de notre exemple introductifs sont classées d’après le deuxième critère de
la MOYENNE-VARIABILITE précédent. Cependant, on va essayer d’appliquer ce troisième critère à
titre illustratif seulement. Donc on suppose que λ est connu :
Comparaison des deux actions a1 et a2 par ce troisième critère : On a :
moy(a1 ) − moy(a2 ) 300.000 − 116.667 183.333
= = = 0, 135 > λ.
∆(a1 ) − ∆(a2 ) 1.700.000 − 350.000 1.350.000
Comparaison des deux actions a1 et a3 par ce troisième critère : On a :
moy(a1 ) − moy(a3 ) 300.000 − 166.660 133.340
= = = 0, 190 > λ.
∆(a1 ) − ∆(a3 ) 1.700.000 − 1.000.000 700.000
2.8 Comparaison des critères pour traiter l’incertitude 24
Comparaison des deux actions a3 et a2 par ce troisième critère : On a :
moy(a3 ) − moy(a2 ) 166.660 − 116.660 49.993
= = = 0, 0769 > λ.
∆(a3 ) − ∆(a2 ) 1.700.000 − 350.000 650.000
Comparaison des deux actions a4 et a2 par ce troisième critère : On a :
moy(a4 ) − moy(a2 ) 333.333 − 116.660 216.666
= = = 0, 619 > λ.
∆(a4 ) − ∆(a2 ) 700.000 − 350.000 350.000
D’après le critère n˚1 on a a4 a1 et a4 a3 et d’après ce critère n˚3 on a : a1 a2 si λ < 0, 1358 ;
a1 a3 si λ < 0, 1904 ; a3 a2 si λ < 0, 0769 et a4 a2 si λ < 0, 619. Avec un petit schéma on peut
conclure que :
a4 si λ < 0, 619;
∗
a = a4 où a2 si λ = 0, 619;
a2 si λ > 0, 619.
Lorsque λ = 0, 619 on aura a4 ≈ a2 , le choix ne pourrait se faire qu’à pile au face.
2.8 Comparaison des critères pour traiter l’incertitude
Si nous récapitulons les choix opérés par les divers critères qu’on a définis dans ce chapitre sur notre
exemple introductif (On a omis le critère HURWICZ puisque l’action optimale choisie par ce critère
varie selon le degré d’optimisme et notre exemple a beaucoup de cas à étudier), on aura :
Critères Actions optimales
LAPLACE a4
WALD a2
MAXMAX a1
SAVAGE a4
MOYENNE-VARIABILITE a4
Il est aisé de remarquer que le choix dépend étroitement du critère utilisé, d’où une question principale
se pose :
Quel critère faut-il retenir ?
surtout qu’on le décideur peut se retrouver face au paradoxe de Condorcet illustré ci après par un
exemple.
Exemple illustratif du Paradox de Condorcet : Considérons le classement suivant de quatre actions
suivant quatre critères :
Critère Action a1 a2 a3 a4
Critère 1 n˚1 n˚2 n˚3 n˚4
Critère 2 n˚2 n˚3 n˚4 n˚1
Critère 3 n˚3 n˚4 n˚1 n˚2
Critère 4 n˚4 n˚1 n˚2 n˚3
On constate que chaque action l’emporte trois fois sur chacune des trois autres. Par conséquent, on ne
peut pas en déduire qu’une action parmi les quatre est optimale.
Pour répondre à la question posée et faire face au paradoxe précédent, on peut faire recours aux notions
de concordance et de discordance.
2.9 Conclusion 25
Définition 2.1. La concordance mesure le nombre de fois qu’une action est préférée par rapport aux
reste des autres actions.
Définition 2.2. La discordance évalue la somme pondérée par le poids attribué aux différents critères
par le décideur.
Exemple : Illustrons les deux notions définies précédemment par cet exemple. Soit le tableau, récapitulatif
des choix opérés par les six critères de décision (LAPLACE, MAXMAX, WALD, HURWICZ, SAVAGE,
MOYENNE-VARIABILITE) dans un problème de décision à quatres actions, suivant :
Critère Action optimale
LAP LACE a2
M AXM AX a3
W ALD a2
HU RW ICZ a3
SAV AGE a2
M OY EN N E − V ARIABILIT E a2
I La concordance de a2 , dans cet exemple, est égale à 2, alors que celle de a3 vaut 1, donc il est claire
qu’usant de la notion de concordance le décideur optera pour a2 .
I Supposons que le décideur est optimiste, n’aime pas regretter ses choix serait enclin à opter pour
les critères (MAXMAX, SAVAGE et MOYENNE-VARIABILITE). Si pour ce décideur le critère de
SAVAGE pèse deux fois plus que les deux autres, alors la discordance de l’action a sera donnée par :
h i h i h i
0, 25 M ax(a)−M ax(a3 ) +0, 5 SR(a)−SR(a2 ) +0, 25 moy(a)−λ∆(a) − moy(a2 )−λ(a2 )
Ainsi, l’action a2 dotée de la plus forte concordance sera retenue comme action optimale par ce décideur
si sa discordance n’excède pas un seuil qu’il aurait fixé. Sinon, l’action suivante (celle ayant la plus
grande discordance après a2 i.e. a3 sera retenue.
Remarque 2.3. Mentionnons enfin qu’il est facile de bâtir des exemples où les critères divergent de
façon radicale. Ainsi avec la matrice de décision :
Critère Action e1 e2 e3 e4
a1 2 2 0 1
a2 1 1 1 1
a3 0 4 0 0
a4 1 3 0 0
le critère de WALD conduit à retenir a2 , le critère du Max Max a3 , le critère de LAPLACE a1 et le critère
de SAVAGE a4 ! ! !.
2.9 Conclusion
On a remarqué qu’aucun des critères étudiés jusqu’ici n’était pleinement satisfaisant. Vouloir décider
dans l’incertain sans se poser la question de la vraisemblance relative des divers états de la nature semble
artificiel.
2.9 Conclusion 26
Il convient de noter que les critère de WALD et de MAXMAX sont d’un point de vue informationnel
moins exigeants que les autres critères, en ce sens qu’ils requièrent des informations moins élaborées. En
effet, la mise en oeuvre des critères de LAPLACE, SAVAGE et HURWICZ exigent une mesure cardinale
(qualitative) des conséquences des actions. Le critère de WALD et le critère de MAXMAX en revanche
peuvent se contenter d’une mesure ordinale (qualitative).
Remarque 2.4. En avenir incertain, si l’agent se retrouve devant un adversaire rationnel i.e. à la place
des états de la nature, on trouves les actions de l’adversaire alors on sera en face d’un problème de la
”théorie des jeux”. Ainsi, la théorie des jeux est l’étude des modèles de prise de décisions en avenir
incertain non probabilisables.