Intro IC pour une moyenne IC pour une variance Rcmdr
STT 1900
Méthodes statistiques pour ingénieurs
Module 7
Estimation par intervalle de confiance
Livre, 3e éd: section 9.2 (sauf 9.2.4)
Livre, 2e éd: section 10.2 (sauf 10.2.4)
Thierry Duchesne et Emmanuelle Reny-Nolin
1/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Module 7 : Estimation par intervalle de confiance
1 Introduction aux intervalles de confiance
2 Intervalles de confiance pour une moyenne
Loi normale, variance connue
Loi normale, variance inconnue
Loi de X1 , . . . , Xn inconnue, mais n grand
3 Intervalles de confiance pour une variance
Loi normale
4 Rcmdr
2/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Sommaire de la section
1 Introduction aux intervalles de confiance
2 Intervalles de confiance pour une moyenne
3 Intervalles de confiance pour une variance
4 Rcmdr
3/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Introduction : estimation ponctuelle imparfaite
Un échantillon donne lieu à UNE estimation du paramètre.
Quelle confiance peut-on avoir en cette estimation ?
Ci-dessous, chaque échantillon X1 , ...X25 provient d’une N(15, 16).
258
--
175
80 - -
A N
( x 14.25 =
4/34
Intro IC pour une moyenne IC pour une variance Rcmdr
QUIZ !
Dans l’histogramme de gauche (page précédente),
les 1000 valeurs de x pourraient servir d’estimation pour µ.
Dans cette situation, environ quelle proportion des échantillons
mènent à une erreur d’estimation inférieure à 1,5 tonne ?
ENVIRON 80 175 250 250 150588
+
+ + +
5/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Concept d’estimation par intervalle de confiance
Un intervalle de confiance :
complète l’estimation ponctuelle en l’entourant d’une
marge d’erreur.
donne une idée de la précision obtenue avec l’échantillon.
est associé à un niveau de confiance (probabilité que
l’intervalle contienne la vraie valeur du paramètre).
6/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Définition formelle
SDE(
X1 , . . . , Xn : échantillon aléatoire de taille n ;
q : paramètre d’intérêt (comme µ ou s 2 ) ;
-
Intervalle de confiance de niveau 1 a pour un paramètre q
Deux statistiques [C1 ,C2 ] calculées à partir de l’échantillon
telles que
P(C1 q C2 ) = 1 a
O
LA LE
PROB. QUE VRAIPARAMETRE SONT
DANS [C, C2] EST EGRE A1-2
7/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Définition formelle
X1 , . . . , Xn : échantillon aléatoire de taille n ;
q : paramètre d’intérêt (comme µ ou s 2 ) ;
Intervalle de confiance de niveau 1 a pour un paramètre q
Deux statistiques [C1 ,C2 ] calculées à partir de l’échantillon
telles que
P(C1 q C2 ) = 1 a
1 a : niveau de confiance de l’intervalle RECOLTE
(fixé arbitrairement par le chercheur).-> AVANT DE DONNEES
1 a = 0, 95. Parfois 1
Souvent 1 a = 0, 90 ou 0, 99 ou autre.
7/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Plusieurs intervalles de confiance
C1 C2
A I
Cr 12
R A
⑪ D
1 DONC A A
50% DESIC
DE
NE
NIVEAUSENT
DAS O
8/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Rappel sur les lois échantillonnales
Lorsque X1 , ..., Xn i.i.d. N(µ, s 2 ), on connaît les lois
échantillonnales des statistiques suivantes :
Statistique Loi échantillonnale Espérance Variance
Z=
X µ
p
s/ n
N(0,1) 0 1
T=
X µ
p
S/ n
tres 03 n -
U=
(n 1)S2
s2 - n -
1 2(n 1) -
9/34
Intro IC pour une moyenne IC pour une variance Rcmdr
4 cas étudiés
Nous construirons 4 intervalles de confiance :
Cas Paramètre Situation
1 µ X1 , ..., Xn ⇠ N(µ, s 2 ) avec s 2 connue
2 µ X1 , ..., Xn ⇠ N(µ, s 2 ) avec s 2 inconnue
3 µ X1 , ..., Xn ⇠ loi inconnue, mais n est grand
4 s2 X1 , ..., Xn ⇠ N(µ, s 2 )
10/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Sommaire de la section
1 Introduction aux intervalles de confiance
2 Intervalles de confiance pour une moyenne
Loi normale, variance connue
Loi normale, variance inconnue
Loi de X1 , . . . , Xn inconnue, mais n grand
3 Intervalles de confiance pour une variance
4 Rcmdr
11/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Cas 1 pour µ : loi normale, variance CONNUE
On suppose que X1 , . . . , Xn i.i.d. loi N(µ, s 2 ),
où s 2 est une valeur connue.
✓ ◆
s2 X µ
On déduit que X ⇠ N µ, , donc que Z = p ⇠ N(0, 1)
n s/ n
se
QuwE Soit za/2 , la valeur telle que P(Z > za/2 ) = a/2. On a donc que
z P( za/2 Z za/2 ) = 1 a.
⑤>
P(Z <- zxe)=P(z> zxic) C12 =
12/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Cas 1 pour µ : loi normale, variance connue
~PARAMETREEEr
On cherche [C1 ,C2 ] tels que P(C1 µ C2 ) = 1 a
✓ ◆ sz
0
-
X µ
On sait que P za/2 p za/2 = 1 a
s/ n
CREENAU. Nere
P/X-zx M(X zE)= 1 +
- 2
en en
C1 C2
BORNE INF. SUP.
BORNE 13/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Cas 1 pour µ : loi normale, variance connue
On cherche [C1 ,C2 ] tels que P(C1 µ C2 ) = 1 a
✓ ◆
X µ
On sait que P za/2 p za/2 = 1 a
s/ n
DONe ICn: [X-zc;X+ zx]
II
QUI CORRESPOND is
-MARet
POUR CET IC. ON A QUE
MEST DANS L'IC AVEC PROB 1-2
13/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Exemple 1
Soit X, le diamètre (en cm) des disques de frein produits par une
machine, où X ⇠ N(µ, 0, 0009). On choisit un échantillon de 9 disques
au hasard et on calcule un diamètre moyen de 12, 05 cm.
a) Donnez un intervalle de confiance de niveau 95% pour µ.
I 2095:
[X-Z0,02 ; + 2002
n]
ou X= 12,05;0= 19; =3
e
70,025= 1,96
IC0,95:12,051 1,94.109 3
-
12,0510,0194-x[12,03;12,07] 14/34
Intro IC pour une moyenne IC pour une variance Rcmdr
IC0,95: [12,03;72,07]
QUIZ !
Déterminez si les énoncés suivants (liés à l’exemple 1) sont
vrais ou faux.
95% des disques de cette compagnie ont un diamètre
entre 12,03 et 12,07 cm. FAUX
95% des intervalles calculés avec cette formule (à partir
d’échantillons différents) contiendraient le vrai diamètre
moyen. URAl
On a confiance à 95% que la vraie valeur de µ est
comprise entre 12,03 et 12,07 cm. URAI
Si on prenait un nouvel échantillon de taille n = 9, la
probabilité que sa moyenne x soit entre 12,03 et 12,07 cm
est de 95%.
FAUX
15/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Exemple 1 : taille d’échantillon
b)Quelle taille d’échantillon devrait-on collecter pour que la
marge d’erreur sur l’estimation du diamètre moyen ne dépasse
pas 0,01 cm, si on conserve un niveau de confiance de 95% ?
MEL0,01 AVEL Zx
=
1,96;0:09
Exer 0,01-1
1,96.030,01
1003
5,882
34,572R
-
Dn 35 =
16/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Cas 2 pour µ : loi normale, variance INCONNUE
On suppose que X1 , . . . , Xn i.i.d. loi N(µ, s 2 ),
où s 2 est une valeur inconnue, donc à estimer par S2 .
✓ ◆
s2 X µ
On déduit que X ⇠ N µ, , donc T = p ⇠ tn 1
n S/ n
Soit ta/2;n 1 , la valeur telle que P(T > ta/2; n 1 ) = a/2. Ainsi,
P( ta/2; n 1 T ta/2; n 1 ) = 1 a.
DAMSYMETRE
PITtaxir):PA tair 17/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Cas 2 pour µ : loi normale, variance inconnue
On cherche [C1 ,C2 ] tels que P(C1 µ C2 ) = 1 a
✓ -T ◆r tn
D
X µ
On sait que P ta/2; n 1 p ta/2; n 1 = 1 a
S/ n
ON ISOLE M
P(X-tein u X+ tein)=1-2
IC..:
E-MARSe
18/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Exemple 2
Retournons à l’exemple des disques. Supposons que s 2 n’était
pas connue et qu’on l’estime par la variance échantillonnale
des 9 diamètres observés, soit s2 = 0, 0008 cm2 .
Donnez un intervalle de confiance à 95% pour µ. Comparez-le
avec l’intervalle obtenu en supposant la variance connue.
IC-c: [X-taine ; x+
tzinen]
5=0; n 9;x 12,05;
=
=
t0,025,8 = 2,304
12,0512,306
3
IC0,95:[12,028;12,072]
19/34
ON A UN IC is 1
- 2
Pour M
QUI EST
[11,98; 14,02].
Que vour X?
DE PAR LA CONSTRUCTION XIza ou
*
I
tain-
EST LE POINT MILIEU LIC
DE
DONC X 13 =
Intro IC pour une moyenne IC pour une variance Rcmdr
Cas 3 pour µ : loi inconnue, n grand
-n-38
On suppose que X1 , . . . , Xn sont i.i.d. d’une loi inconnue.
Peut-on construire des intervalles de confiance ?
20/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Cas 3 pour µ : loi inconnue, n grand
On suppose que X1 , . . . , Xn sont i.i.d. d’une loi inconnue.
Peut-on construire des intervalles de confiance ?
L’idée : utiliser le théorème central limite et le fait que pour
n grand :
s2 ' s 2 et X ⇡ N(µ, s2 /n) )
=(0,1)
Si n est grand, on peut construire des intervalles de
confiance dont le niveau sera approximativement du
niveau désiré.
20/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Cas 3 pour µ : loi inconnue, n grand
On cherche [C1 ,C2 ] tels que P(C1 µ C2 ) = 1 a
✓ ◆
N
X µ
On sait que P za/2 p za/2 ⇡ 1 a
S/ n
-D N10,1)
=
On
✓ déduit que ◆
S S
P X za/2 p µ X + za/2 p ⇡1 a
n n
un
u
Ce C2
21/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Exemple 3
Pour estimer le salaire moyen annuel de jeunes diplômés dans un
certain domaine, on a prélevé un échantillon de taille n = 100 et
obtenu x = 34 224 $ et s = 4 668 $.
Donnez un intervalle de confiance de niveau 90% pour le salaire
moyen annuel des jeunes diplômés dans ce domaine.
ICqo%: [X-20,05 ix 7005] +
X 34224; S4668;n 100;
= =
=
70,05 1,64
=
NIVEAU
ICoy: 342241 1,64 IC DE
90%
->
[33456,114;34991,886] APPROX.
22/34
Intro IC pour une moyenne IC pour une variance Rcmdr
La marge d’erreur et l’erreur-type
Les trois intervalles de confiance pour µ sont symétriques :
X ± marge d’erreur
X ± quantile ⇥ erreur-type
Ec
taxine L
u
Eck:*
Longueur de l’intervalle= 2⇥ marge d’erreur
on
*
ON PEUT AVOIR DES IC APPROX. on
CONNAIT O2
23/34
Intro IC pour une moyenne IC pour une variance Rcmdr
QUIZ !
Déterminez si les énoncés suivants sont vrais ou faux.
La marge d’erreur d’un IC sur la moyenne µ augmente
(donc la précision diminue) si :
la variabilité des mesures augmente. 0,02
URAI
la taille d’échantillon augmente.
FAUX
le niveau de confiance augmente.
WRAl
24/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Sommaire de la section
1 Introduction aux intervalles de confiance
2 Intervalles de confiance pour une moyenne
3 Intervalles de confiance pour une variance
Loi normale
4 Rcmdr
25/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Cas 4 pour s 2 : loi normale, µ et s 2 inconnues
QuWE On suppose que X1 , . . . , Xn i.i.d. loi N(µ, s 2 ),
Etant
où µ et s 2 sont inconnues.
EDEe On sait que U =
(n 1) S2
s2
⇠ cn2 1 et
[Link] 2
Soit ca/2; 2
n 1 , la valeur telle que P(U > ca/2; n 1 ) = a/2.
J'Al E Ainsi,
-
A
DROITE
P(c12 a/2; n 1
2
U ca/2; n 1 ) = 1 a.
Xzin- 26/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Cas 4 pour s 2 : loi normale, µ et s 2 inconnues
On cherche [C1 ,C2 ] tels que P(C1 s 2 C2 ) = 1 a
✓ ◆
2 (n 1) S2 2
On sait que P c1 a/2; n 1 ca/2; n 1 = 1 a
s2
ON VEUT ISOLER OF AU CENTRE
Pleine *n Ein)= 1-
pla?) 1-
=
27/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Intervalle pour l’écart-type s
P C1 s 2 C2 = 1 a
est équivalent à
⇣p p p ⌘
P C1 s 2 C2 = 1 a.
Pour avoir un IC(s ), on prend la racine carrée des bornes de
IC(s 2 ).
28/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Exemple 4
On veut calibrer la machine qui fabrique les disques de frein pour
qu’elle soit le plus stable possible. On veut d’abord estimer la
variation du diamètre des disques produits, avec un intervalle de
confiance à 95%.
Un échantillon de taille 25 a donné une variance échantillonnale de
0, 015 cm2 . On suppose que les diamètres sont i.i.d. de loi normale.
Siteinit 4
ICoas (o2:
-
e
[0,01528 azsizu n z
3
5
[0,0091;0,0290] 29/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Sommaire de la section
1 Introduction aux intervalles de confiance
2 Intervalles de confiance pour une moyenne
3 Intervalles de confiance pour une variance
4 Rcmdr
30/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Rcmdr
Les intervalles de confiance s’obtiennent avec des procédures
appelées des tests d’hypothèses, que nous étudierons dans le
prochain module.
Moyenne :
cas 2 directement (loi normale, variance inconnue, loi t)
cas 1 et 3 : calculer les composantes séparément :
x, za/2 , n, s
Variance :
cas 4 : calculer les composantes séparément : (n 1), s2 ,
quantiles c12 a/2;n 1 et ca/2;n
2
1
31/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Exemple : Naissances (Rcmdr)
Calculez un intervalle de confiance pour le nombre de naissances
annuelles au Québec, en vous basant sur les 10 dernières années.
32/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Exemple : Naissances (Rcmdr)
Quelles hypothèses avez-vous posées pour utiliser cette formule ?
Ces hypothèses vous paraissent-elles raisonnables dans ce
contexte ?
33/34
Intro IC pour une moyenne IC pour une variance Rcmdr
Réponses aux exemples
1 a) IC(µ) à 95% : [12, 030; 12, 070]
b) n = 35
2 IC(µ) à 95% : [12, 028; 12, 072]
3 IC(µ) à 90% : [33 456, 114; 34 991, 886]
4 IC(s )à 95% : [0, 096; 0, 170]
34/34