CHAPITRE
PRISE DE
11 DÉCISION ET
ESTIMATION
Sommaire
Partie A (s17) 2
1 Échantillonnage...................................................................................................................2
1.1 Intervalle de fluctuation d’une fréquence 2
1.2 Prise de décision 3
Partie B (s20) 4
2 Estimation...........................................................................................................................4
2.1 Intervalle de confiance d’une proportion 4
2.2 Comparaison de deux échantillons 5
Ch.11 PRISE DE DÉCISION ET Tale STI2D
ESTIMATION
Partie A (s17)
Lorsqu’on s’intéresse à une caractéristique d’une population, il est
parfois impossible de tester chaque individu, on est alors amené
à travailler sur des échantillons. L’inférence statistique consiste
à induire les caractéristiques inconnues d’une population à partir
d’un échantillon issu de cette population.
Les méthodes d’inférence statistiques ont connu deux grandes
phases de développement. La première commence à la fin du XIXe
siècle, avec des travaux qui dégagent les notions de test d’hypo-
thèse et d’intervalle de confiance.
La seconde, qui perdure aujourd’hui, a été rendue possible grâce à
la puissance de calcul des ordinateurs et à la banalisation de l’outil
informatique à partir de la fin des années 1940.
1 Échantillonnage
1.1 Intervalle de fluctuation d’une fréquence
La théorie de l’échantillonnage se pose la question suivante :
en supposant connus les paramètres statistiques d’une population, que peut-on en
déduire sur les échantillons prélevés dans la population ?
On suppose que ces échantillons de taille n sont prélevés au hasard et que le tirage
de ces échantillons est effectué avec remise. On connait la proportion p du caractère
C de la population P et on cherche la fréquence f théorique de ce caractère.
Population P Échantillon
de taille n
Proportion p
fréquence
du caractère C
f de C ?
Définition 1.
Soit p la proportion d’un caractère C d’une population P . Dans un
échan- tillon de taille n vérifiant n ≥ 30, np ≥ 5 et n(1 − p) ≥ 5, la
fréquence f du caractère C appartient à l’intervalle :
s s
en seconde, on avait
1 1 p − 1,
p(1 − p(1 −
−√ ; p+ √ p) n ; p + 1, p) n
p n n 96 96
avec un probabilité de 95 %.
Cet intervalle est appelé intervalle de fluctuation asymptotique à
95 %.
http://mathematiques.daval.free.fr 2/5 Lycée Georges Brassens
Ch.11 PRISE DE DÉCISION ET Tale STI2D
ESTIMATION
Mais pourquoi cette formule étrange ? À quoi correspond 1,96 ?
Soit X la variable aléatoire qui a un échantillon de taille n associe le nombre
d’indi- vidus présentant le caractère C de proportion p dans la population totale.
√
voir chapitre 10 X suit la loi binomiale B(n, p) qui peut être approchée par la loi normale N np,
np(1 − p) .
Dans ce cas, P(µ − 2σ ≤ X ≤ µ + 2σ) ≈ 0, 95 à 10−2 près mais on peut préciser
davantage : à 10−5 près, on obtient P(µ − 1, 96 σ ≤ X ≤ µ + 1, 96 σ) ≈ 0, 95.
√ √
D’où : P np − 1, 96 np(1 − p) ≤ X ≤ np + 1, 96 np(1 − p) ≈ 0, 95.
X
On considère maintenant la variable aléatoire F =
n correspondant à la fréquence :
√ √ !
admis np − 1, 96 np(1 − p) X np + 1, 96 np(1 − p)
P ≤ ≤ ≈ 0, 95
n n n
s s
p(1 − p) p(1 − p)
P p − 1, 96 ≤ F ≤ p + 1, 96 ≈ 0, 95 !
n n
Exemple 2
Dans une chaîne de production fonctionnant normalement, 6 % des pièces produites pré-
sentent un défaut de fabrication. Le responsable de la chaîne souhaite savoir s’il est néces-
saire de procéder à un entretien de la chaîne. Pour cela, il prélève au hasard 100 pièces. Il
détermine l’intervalle de fluctuation au seuil de 95 % :
" r r #
0, 06 × 0, 94 0, 06 × 0, 94
I = 0, 06 − 1, 96 100 ; 0, 06 + 1, 96 100 = [ 0, 015 ; 0, 107 ].
1.2 Prise de décision
À l’aide d’un échantillon de taille n, on souhaite vérifier si on peut raisonnablement
penser que la proportion p de la population est bien celle annoncée. Pour cela, on
effectue un adopte la procédure suivante :
Test 3.
• on détermine l’intervalle de fluctuation de la fréquence au seuil de 95 % ;
• on calcule la fréquence f réelle dans l’échantillon ;
• on conclut :
– si f est dans l’intervalle, on accepte l’hypothèse selon laquelle p est
bien la proportion de la population ;
– si f n’est pas dans l’intervalle, l’hypothèse faite sur p est rejetée.
Exemple 4
On reprend l’exemple 2 précédent. Si le responsable trouve 9 pièces défectueuses, doit-il
procéder à un entretien de sa chaîne ? Même question si 12 pièces sont défectueuses.
9
• 9 pièces correspondent à une fréquence de = 0, 09. Or, 0, 09 ∈ [ 0, 015 ; 0, 107 ] donc,
on peut considérer, au seuil de 95 % que 100
la chaîne fonctionne normalement ;
12
• 12 pièces correspondent à une fréquence de = 0, 12. Or, 0, 12 ∈/ [ 0, 015 ; 0, 107
] 100
donc, on peut considérer, au seuil de 95 % que la chaîne doit être réparée.
http://mathematiques.daval.free.fr 3/5 Lycée Georges Brassens
Ch.11 PRISE DE DÉCISION ET Tale STI2D
ESTIMATION
Partie B (s20)
2 Estimation
2.1 Intervalle de confiance d’une proportion
Dans cette partie, on se pose la question inverse : dans de nombreux cas, la
proportion p du caractère C d’une population est inconnu (dû au fait de la taille
trop grande par exemple). En revanche, il est possible d’étudier la fréquence f de
ce caractère sur un échantillon de taille n et d’en déduire des caractéristiques sur
la population.
Population P Échantillon
de taille n
Proportion p
fréquence
du caractère C ?
f de C
Définition 5.
Soit f la fréquence d’un caractère C d’un échantillon de taille n vérifiant
n ≥ 30, np ≥ 5 et n(1 − p) ≥ 5, alors la proportion p du caractère C
dans la population totale appartient à l’intervalle :
s s
on remarque
l’analogie avec f − 1, f − f) f (1− f )
; f + 1, 96
l’intervalle de (1 n n
fluctuation 96
avec un probabilité de 95 %.
Cet intervalle est appelé intervalle de confiance de p à 95
%.
Remarque 6
• l’intervalle de confiance varie en fonction de l’échantillon prélevé ;
• plus l’échantillon est grand plus l’estimation est précise.
Exemple 7
Un sondage dans une commune révèle que sur les 500 personnes interrogées, 42 % sont
mécontentes de l’organisation des transports. Il détermine un intervalle de confiance du
pourcentage p de personnes mécontentes dans la commune au niveau de confiance de 95 % :
" r r #
0, 42 × 0, 58 0, 42 × 0, 58
I = 0, 42 − 1, 96 500 ; 0, 42 + 1, 96 500 = [ 0, 377 ; 0, 463 ].
Donc, on peut estimer, au seuil de 95 % que le nombre de personnes mécontentes oscille
entre 37,7 % et 46,3 %.
http://mathematiques.daval.free.fr 4/5 Lycée Georges Brassens
Ch.11 PRISE DE DÉCISION ET Tale STI2D
ESTIMATION
2.2 Comparaison de deux échantillons
On souhaite comparer deux proportions p1 et p2 du même caractère dans deux
populations différentes.
Test 8.
• on prélève un échantillon dans la première population dont on mesure la
fréquence f1, puis on en déduit l’intervalle de confiance I1 pour p1 ;
• on prélève un échantillon dans la deuxième population dont on mesure
la fréquence f2, puis on en déduit l’intervalle de confiance I1 pour p2 ;
• on compare les deux intervalles :
– s’ils sont disjoints, on considère que la différence entre les deux
fréquences observées est significative ;
– s’ils ne sont pas disjoints, on accepte l’hypothèse au seuil de de 95 %.
Exemple 9
Un industriel français fabrique des smartphones. Pour contrôler la qualité de la production,
il en teste 200 : 92% fonctionnent correctement.
Durant 6 mois, l’entreprise de smartphones travaille à améliorer la qualité de sa production.
Un nouvel échantillon de 200 smartphones est prélevé : 97% fonctionnent correctement.
Est-il raisonnable, au niveau de confiance de 95 %, de penser que la production s’est amé-
liorée ?
"
• avant l’amélioration, r a f = 0, 92 donc,
on r #
0, 92 × 0, 08 0, 92 × 0, 08
I1 = 0, 92 − 1, 96 ; 0, 92 + 1, 96 = [ 0, 882 ; 0, 958
];
200 200
• après l’amélioration, on a f = 0, 97 donc,
" r r #
0, 97 × 0, 03 0, 97 × 0, 03
I1 = 0, 97 − 1, 96 ; 0, 97 + 1, 96 = [ 0, 946 ; 0, 994
200 200
];
• on a [ 0, 882 ; 0, 958 ] ∩ [ 0, 946 ; 0, 994 ] /= ∅, donc la différence entre les deux
échan- tillons n’est pas significative : il n’y a pas d’évolution significative de la qualité
de la production au niveau de confiance de 95 %.
http://mathematiques.daval.free.fr 5/5 Lycée Georges Brassens