ESTIMATION PAR INTERVALLE DE
CONFIANCE
A. DAOUI
10 décembre 2015
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 1 / 40
Intervalle de con…ance
Jusqu’à présent, on a estimé un paramètre θ par une unique valeur b θn
b
(estimation ponctuelle). Si l’estimateur θ n est sans biais et de faible
variance, on peut s’attendre à ce que chaque réalisation de b θn
(statistique) soit proche de la vraie valeur de θ. Cependant, b θ n ne
sera sûrement pas exactement égale à θ. Il semble donc raisonnable
de donner un ensemble de valeurs vraisemblables pour θ. Comme on
suppose ici que θ 2 R, on donnera un intervalle (une "fourchette")
ayant une forte "probabilité" de contenir la vraie valeur de θ
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 2 / 40
Intervalle de con…ance
Dé…nition
Un intervalle de con…ance est un intervalle de la forme [L1 , L2 ] ayant
une certaine probabilité de contenir la vraie valeur θ du paramètre à
estimer. La probabilité p (θ 2 [L1 , L2 ]) = 1 α est appelée
niveau de con…ance où la probabilité α = p (θ 2 / [L1 , L2 ]) est appelée
risque d’erreur ou niveau de signi…cation. On note
[L1 , L2 ] = I .C (1 α)
Remarque
Le risque d’erreur doit être petit. Les valeurs usuelles de α sont 10%,
5%, 1%, ...
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 3 / 40
Remarque fondamentale : Les intervalles de con…ance suscitent
souvent des erreurs d’interprétation et des abus de langage. La raison
essentielle est la suivante : dans l’écriture p (θ 2 [L1 , L2 ]), θ est une
valeur inconnue mais non une variable aléatoire ; ce sont les bornes L1
et L2 qui sont aléatoires liées à l’estimateur (variable aléatoire) b θ n . Il
semble donc logique de chercher un I .C . pour θ où toutes les
réalisations de bθ n y sont avec une probablité 1 α. C.à.d.
p (b
θ n 2 [L1 , L2 ]) = 1 α
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 4 / 40
Distribution d’échantillonnage et estimation d’une
moyenne par I.C.
Objectif : estimer la moyenne m d’un caractèra quantitatif X
On prélève des échantillons, E1 , E2 ,..., Ek , de taille n <<< N.
A chaque échanntillon Ei , on peut associer une estimation ponctuelle
x n de m. On sait que x n est une réalisation de l’estimateur X n de
m.
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 5 / 40
Distribution de l’estimateur
L’estimateur Xn dit moyenne d’échantillonnage est une variable
aléatoire.
Soit σ l’écart type du caractère X . En considérant que la mesure
Xi de X sur chaque individu de l’échantillon est une v.a. de moyenne
m et d’écart type σ et en utilisant le T .C .L. , on peut supposer que
Xn possède les caractéristiques suivantes :
mXn = m
σXn = pσn
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 6 / 40
Remarque
L’expression σXn = pσn est valable dans le cas où le tirage est avec
remise (tirage bernoullien) et dans le cas où le taux de sondage est
t = Nn < 5% (cas où l’approximation d’une loi binomiale par une loi
hypergéométrique est satisfaisante). Dans le cas où le tirage est
exhaustif avec t = Nn > 5%, on a :
r
σ N n
σXn =p
n N 1
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 7 / 40
Distribution d’échantillonnage d’une moyenne
De plus la loi suivie par la v.a. Xn dite distribution d’échantillonnage
est donnée dans les cas suivants :
Si la loi parente est normale ; c.a.d. X N (m, σ) avec σ connu
alors Xn N (mXn , σXn ).
Si la loi parente est normale ; c.a.d. X N (m, σ) avec σ
inconnu alors, d’après le théorème de Fisher, la loi centrée
Xn m X n
réduite. S0
stn 1 (loi de student à n 1 degrés de
Xn
Sn0
liberté) avec SX0 = p
n
n
Cependant, d’après le T .C .L., Xn N (mXn , σXn ) dès que
n 30
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 8 / 40
Estimation de la moyenne par intervalle de
con…ance
Etant donnée un risque d’erreur α, appelé aussi seuil de signi…cation,
on cherche donc un intervalle [L1 ; L2 ] tel que
p (m 2 [L1 = Xn e; L2 = Xn + e]) = 1 α ; ceci revient à ce que
l’intervalle [L1 ; L2 ] contienne toutes les estimations de m avec une
probabilité 1 α ; i.e.
p (Xn 2 [L1 ; L2 ]) = 1 α.
Cet intervalle de con…ance sera construit autour d’une estimation
ponctuelle x n de m.
Pour un I.C symétrique, on a : p (Xn < L1 ) = α2 et p (Xn > L2 ) = α
2
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 9 / 40
Intervalle de con…ance relatif à une loi normale
(Subsubsubsection head:)
On est donc dans le cas où
Xn N (mXn , σXn )
p (Xn 2 [L1 ; L2 ]) = p ( Lσ1 m
Z L2 m
σX n ) =1 α ; où Z suit la loi
Xn
normale centrée réduite N (0; 1).
D’après les propriétés de symétrie de N (0; 1), on peut poser que
L2 m L1 m
= zα/2 et = zα/2 ,
σXn σXn
où
α
p (Z zα/2 ) = 1 .
2
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 10 / 40
On a donc :
σ σ
L2 = m + zα/2 . p et L1 = m zα/2 . p
n n
.
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 11 / 40
En estimant l’inconnue m par x, on obtient :
σ σ
IC (1 α ) = [x zα/2 . p ; x + zα/2 . p ]
n n
On peut dire aussi qu’un intervalle de con…ance de seuil α pour le
paramètre m relativemen à une loi normale est :
σ σ
IC (1 α) = [Xn zα/2 . p ; Xn + zα/2 . p ]
n n
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 12 / 40
Remarques
Lorsque l’écart type est inconnu, on le remplace par une
éstimation ponctuelle (statistique estimée sur un échantillon)
notée s 0 et on a :
S0 S0
IC (1 α) = [Xn zα/2 . pn ; Xn + zα/2 . pn ]
n n
L’erreur maximale d’estimation est :
σ
Eα = zα/2 . p
n
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 13 / 40
EXERCICE
Compléter le tableau suivant :
α zα/2
10%
5%
2%
1%
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 14 / 40
Exemple
X = "dépenses des ménages casablancais en nourriture"
Exemple
Un échantillon représentatif de taille n = 100 a fourni les
statistiques : x = 2857 Dhs et s 0 = 330 Dhs.
Estimer la moyenne m de X par un IC avec un risque d’erreur de 5%
puis de 1%.
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 15 / 40
Intervalle de con…ance relatif à une loi de student
(Subsubsubsection head:)
Xn m
On se place dans le cas où σ Xn stn 1 .
Xn
Par un développemment analogue au précédent, on obtient :
S0 S0
IC (1 α ) = [x tα/2 . pn ; x + tα/2 . pn ] ;
n n
avec :
α
p (Stn 1 tα/2 ) = 1
2
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 16 / 40
Exemple
On considère la V.A. X de l’exemple précedent et on suppose que X
est normalement distribuée.
Un échantillon 16 familles a fourni les statistiques : x = 2815 Dhs et
s 0 = 282 Dhs.
Estimer la moyenne m de X par un IC (95%) puis un IC (99%).
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 17 / 40
Exemple
Supposons que l’on veuille estimer par sondage la moyenne m des
dépenses des étudiants en transport en …xant α = 1% et E = 50 Dhs.
Déterminer la taille de l’échantillon à prélever. On donne σ = 100 Dh
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 18 / 40
Distribution d’échantillonnage et estimation d’une
proportion ou d’une fréquence par I.C
Supposons que l’on veuille estimer la proportion p des individus d’une
certaine population qui véri…e un certain caractère C (souvent
qualitatif).
Si on prélève un échantillon de taille n alors la V.A X ="Nombre
d’individus véri…ant le caractère C au sein de l’échantillon" est une
V.A. suivant une loi binômiale ou un loi hypergéométrique selon le
mode de tirage ou le taux de sondage.
La V.A b p = Xn = Xn est un estimateur sans biais et e¢ cace de la
fréquence p.
Si x est la statistique de X donnée par l’échantillon alors p = xn est
une réalisation de bp ; c’est donc une estimation ponctuelle de p.
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 19 / 40
X
La distribution des fréquences ou l’estimateur b
p= n possède les
caractéristisues suivantes :
(
p (1 p )
(tirage avec remise ou Nn < 5%)
p ) = p et σ2pb =
E (b n
p (1 p ) N n
n n 1 (tirages exhaustifs et Nn > 5%)
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 20 / 40
Remarque
Dans le premier cas, l’estimation de p est équivalente à l’évaluation
de la probabilité p pour qu’un evénement A
se produise au cours d’une expérience donnée : p = p (A). Pour cela,
on fait n expériences identiques et indépendantes et on compte le
nombre de fois x où A s’est produit. x est la réalisation de la V.A. X
qui suit la la loi binômiale B (n, p ). On estime donc le paramètre p de
cette loi binômiale ou d’une loi de bernoulli.
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 21 / 40
Exemple
Une élection oppose deux candidats A et B. Un institut de sondage
interroge 800 personnes sur leurs intentions de vote. 420 déclarent
voter pour A et 380 pour le candidat B. Estimer le résultat de
l’élection, c’est estimer le pourcentage p qu’obtiendrait le candidat A.
En supposant que les réponses des 800 personnes sont indépendantes,
on est bien dans le cas de …gure de l’estimation d’une proportion.
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 22 / 40
Estimation d’une proportion par intervalle de
con…ance
On se place dans le cas où on pourra estimer p par un intervalle de
con…ance relatif à une loi normale : c’est le cas où les lois binômiale
et hypergéométrique peuvent être convenablement approchée par une
loi normale. Ceci est réalisé sous les hypothèses : n 30, np 5 et
n(1 p ) 5.
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 23 / 40
Dans ce cas l’I .C . au seuil de signi…cation 1 α s’écrit :
IC (1 α ) = [p zα/2 .spb ; p + zα/2 .spb ]
Où 8 q
< p (1 p )
(1er cas)
spb = q n
: p (1 p ) N n
(2ème cas)
n N 1
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 24 / 40
Exemple
Reprendre l’exemple de l’élection et estimer la proportion p des
intentions de vote de la population pour le candidat A avec un risque
d’erreur de 5% puis de 1%.
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 25 / 40
Remarque
Taille de l’echantillon versus la précision de l’I .C .
Dans la pratique, en …xant le risque d’erreur α et la marge d’erreur
tolérée E , on cherche la taille minimale n de l’échantillon qui
garantirait cette précision.
On obtient :
z
n ( α/2 )2 p (1 p )
E
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 26 / 40
Exemple
Quelle devrait être la taille de l’échantillon à choisir pour estimer la
proportion des personnes se déclarant en faveur vdu candidat A si
l’on désire une erreur maximale de 1% et qu’on évalue cette
proportion à 55% ? L’I .C .doit avoir 95% de chances de contenir la
proportion correspondante à la population.
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 27 / 40
Intervalle de con…ance pour la variance d’une loi
normale
Soit X un caractère quantitatif d’une population
normalement distribuée ;
X N (m, σ) de variance inconnue.
2
On sait que la variance estimée Sn0 est un "bon" estimateur de la
variance σ2 mais ce dont on a besoin est estimateur dont on connait
la distribution et que cette loi de probabilité ne dépend pas des
paramètres inconnus m et σ2 . Une telle fonction est donnée par le
théorème de Fisher :
2 2
nSn (n 1)Sn0
= χ2n 1
σ2 σ2
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 28 / 40
Un I .C . pour σ2 avec un risque d’erreur α et construit en utilisant
une statistiqur s 0 est alors donné par :
2 2 2 2
(n 1)sn0 (n 1)sn0 ns ns
IC (1 α) = [ 2 , 2
] = [ 2 n , 2n ]
χ1 α/2 χα/2 χ1 α/2 χα/2
Où :
p (χ2n 1 < χ21 α/2 ) = 1 α
2
p (χ2n 1 < χ2α/2 ) = α2
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 29 / 40
Exemple
On suppose que le poids X des adhérents à un club de sport suit une
loi normale N (m, σ).
Si un échantillon de 15 adhérents a donné un écart-type sn0 = 5, 68
kg, estimer par IC (95%) puis IC (99%) la variance σ2 de X .
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 30 / 40
Remarques
L’I .C . est de la forme [e1 s, e2 s ] et non pas de la forme
2
[s e, s + e] car la loi de probabilité de eSn est plus facile à
manipuler.
p p
Comme p (a < σ2 < b) = p ( a < σ < b), un I.C. au risque
α pour l’écart-type σ est
s s
( n 1) 0 ( n 1) 0
[ sn , s ]
2
χ1 α/2 χ2α/2 n
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 31 / 40
Dans le cas où n est assez grand (n 30), on peut supposer que
Sn0 N (σ, pσ ).
2n
Dans ce un Un I .C . pour l’écart-type σ avec un risque d’erreur α
s’écrit :
s0 s0
IC (1 α) = [ zα/2 , z ]
1+ p 1 pα/2
2n 2n
Exemple
Supposons que l’on considère dans l’exemple précédent, un
échantillon de 50 sportifs. Donner un I .C . pour σ à 95%.
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 32 / 40
Estimation d’une di¤érence de moyennes
On aura souvent à comparer les moyennes m1 et m2 du même
caractère mesurées sur deux pouplations di¤érentes P1 et P2 avec des
écarts-types respectifs σ1 et σ2 .
On procède à un échantillonnage dans chacune des populations, de
tailles respectives n1 et n2 . La di¤érence des moyennes
d’échantillonnage X n1 X n2 est un estimateur de la di¤érence
m1 m2 .
Cet estimateur a pour caractéristiques :
mX n X n2 = m1 m2
1 q 2
σ1 σ22
σX n X n2 = n1 + n2
1
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 33 / 40
Si les échantillons sont tirés de populations indépendantes
normalement distribuées et de variances connues ou que les
tailles respectives des deux échantillons sont telles que n1 30
et n2 30, alors on peut supposer que :
1
X n1 X n2 N (mX n X n2 , σX n1 X n2 )
1
De plus un I .C . au seuil α pour la di¤érence m1 m2 est donné par :
IC (1 α) = [(x 1 x2) zα/2 .σX n X n 2 ; (x 1 x 2 ) + zα/2 .σX n X n2 ]
1 1
Remarque
Lorsque les écarts-types sont inconnus, on les remplace par des
estimations ponctuelles s10 et s20
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 34 / 40
Dans le cas de petits échantillons (n1 < 30 , n2 < 30), si les
populations sont normales et si les variances sont inconnues mais
supposées égales alors la V.A centrée réduite
(X n1 X n2 ) (m1 m2 )
Stn1 +n2 2
SX0 X n2
n1
où s
s2 s2
SX0 X n2
= +
n1 n1 n2
(n1 1)s102 + (n2 1)s202
s2 =
n1 +n2 2
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 35 / 40
Dans ce cas un I .C . au seuil α pour la di¤érence m1 m2 est donné
par :
I .C (1 α) = [(x 1 x2) tα/2 .sX0 X n2
; (x 1 x 2 ) + tα/2 .sX0 X n2
]
n1 n1
avec
α
p (Stn1 +n2 1 tα/2 ) = 1
2
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 36 / 40
Exemple
On veut véri…er l’ajustement qu’un même mécanicien a e¤ectué sur
deux machines. Deux échantillon de 10 boites prélevés sur les deux
machines a donné les relevés (en g) :
machine 1 :165,171, 174, 172, 167, 168, 168, 172, 172, 173
machine 2 :172,170, 167, 169, 171, 167, 173, 165, 163, 174
Estimer la di¤érence des moyennes à l’aide d’un I .C .(95%), en
supposant que les distributions des poids sont normales, de même
variance inconnue.
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 37 / 40
Estimation d’une di¤érence de proportions
Supposons que l’on veuille comparer les proportions p1 et p2 du
même caractère qualitatif mesurées sur deux populations di¤érentes.
La procédure est la même que dans le cas de deux moyennes. la
di¤érence des proportions d’échantillonnage b
p1 b p2 est un estimateur
de la di¤érence des proportions ayant pour caractéristiques :
mpb1 b2
p = q p1 p2
p1 (1 p1 )
σpb1 b2
p = n1 + p2 (1n2 p2 )
De plus, si les tailles des deux échantillons sont su¢ samment
grandes, on peut supposer que la distribution de cet estimateur est
normale ; ce qui pemettra d’écrire des I .C . pour p1 p2 relativement
à une loi normale.
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 38 / 40
Exemple
Sur un échantillon de 400 femmes, 260 sont en faveur du nouveau
code de la famille alors que parmi 400 hommes interrogés, 208 sont
en faveur de ce code. Estimer la di¤érence des proportions des
femmes et des hommes qui sont en faveur de ce nouveau code de la
famille à l’aide d’un I .C .(95%).
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 39 / 40
A. DAOUI () ESTIMATION PAR INTERVALLE DE CONFIANCE 10 décembre 2015 40 / 40