Estimation par intervalle de confiance
Estimation par intervalle de confiance
1/Estimation par intervalle de confiance d’ une proportion :
Soit A le caractère observé dans la population ; X la (V.A) qui observe le caractère A
Pour un individu deux issus sont possibles
succès(avoir la caractère A) 𝑃(𝐴) = 𝑝
échec (ne pas avoir la 𝑃(𝐴̅) = 1 − 𝑝 X suit une loi de Bernoulli
caractère A)
Pour n≥ 2 , X suit une loi de binomiale B(n,p)
Théorème
Si 𝑛 > 30, 𝑛𝑝 > 5 𝑒𝑡 𝑛(1 − 𝑝) > 5 alors loi de binomiale B(n,p) peut être approximée par une loi
normale 𝑁(𝑛𝑝 ; √𝑛𝑝(1 − 𝑝))
intervalle de confiance d’une proportion
condition d’application IC
𝑛 > 30, 𝑛𝑝 > 5 𝑒𝑡 𝑛(1 − 𝑝) > 5
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
échantillon aléatoire simple 𝐼𝐶𝑝𝑝𝑜𝑝 = [𝑝 − 𝑈𝛼 √ ; 𝑝 + 𝑈𝛼 √ ]
2 𝑛 2 𝑛
La table de la loi normale N(0,1)
niveau de niveaude 𝐹(𝑈𝛼 ) 𝑈𝛼
2 2
confiance risque ∝ ∝
=1−
2
90% 10% 0.950 1.645
95% 5% 0.975 1.96
𝑈𝛼 98% 2% 0.990 2.325
2
99% 1% 0.995 2.575
Exemple Gregor Mendel a mené ses fameuses expériences génétiques avec des pois, un
des échantillons des croisements a été obtenu en croisant des pois à gousses vertes et
des pois à gousses jaunes. Cette lignée comportait 580 pois. Parmi ces pois, 428 avait
des gousses vertes et 152 gousses jaunes.
A partir de sa théorie des gènes, Mendel s’attendait à ce que 25% des pois aient des
gousses jaunes. Le pourcentage de gousses jaunes est de 26.2%.
a. Trouver la marge d’erreur qui correspond à un intervalle de confiance à 95%
b. Trouver l’intervalle de confiance à 95% de p de la population
c. A partir de ces résultats, que pouvons- nous conclure sur la théorie de Mendel qui
déclare que le pourcentage de pois à gousse jaune devrait être de 25%?
Solution
On a: n𝒑̂=152 ≥ 5, n𝒒 ̂=428≥ 5
𝟎.𝟐𝟔𝟐∗𝟎.𝟕𝟑𝟖
a. E=1.96√ = 0.036
𝟓𝟖𝟎
b. ICp=[0.226, 0.298] cet intervalle est décrit comme suit :
Le pourcentage de pois à gousse jaune est estimé à 26.2% avec une marge d’erreur de
plus ou moins 3.6%.
c. A partir de ces résultats nous sommes sûr à 95% que les limites 22.6% et 29.8%
contiennent le vrai pourcentage de pois à gousses jaunes.
Le vrai pourcentage peut être vraisemblablement n’importe quelle valeur entre ces deux
limites. Comme cet intervalle contient la valeur 25%, la valeur de Mendel ne peut pas être
considéré comme fausse.
2/Estimation par intervalle de confiance d’une moyenne
Soit 𝑋 𝑠𝑢𝑖𝑡 𝑁(𝜇, 𝜎 2 )
cas de variance connue cas de variance inconnue
𝑋 𝑠𝑢𝑖𝑡 𝑁(𝜇, 𝜎 2 ) ou N>30 𝑋 𝑠𝑢𝑖𝑡 𝑁(𝜇, 𝜎 2 ) ou N>30 ou N≤ 30
𝜎 𝜎 échantillon aléatoire simple
𝜇 ∈ [𝑚 − 𝑈𝛼 ; 𝑚 − 𝑈𝛼 ]
2 √𝑛 2 √𝑛 𝑆𝑒𝑠𝑡 𝑆𝑒𝑠𝑡
𝑚 : moyenne estimée 𝜇 ∈ [𝑚 − 𝑡𝛼;𝑣 ; 𝑚 + 𝑡𝛼;𝑣 ]
2 √𝑛 2 √𝑛
U/2 est lue sur la table normale 𝑚 : moyenne estimée.
𝜎 : écart-type de la population or ici il est inconnu on va le remplacer
. par l’ écart-type estimé𝑆𝑒𝑠𝑡
𝑡𝛼,𝑣 : une valeur lue sur la table Student
2
un d.d.l (v=n-1)
𝑆𝑒𝑠𝑡 𝑆𝑒𝑠𝑡
𝜇 ∈ [𝑚 − 𝑡𝛼;𝑣 ; 𝑚 + 𝑡𝛼;𝑣 ]
2 √𝑛 2 √𝑛
niveau de niveaude 𝐹(𝑈𝛼 ) 𝑈𝛼
2 2
confiance risque ∝ ∝
= 1− comme l’intervalle de confiance et aussi bilatérale donc on lit
2 directement de la table
90% 10% 0.950 1.645 ∝𝑟𝑖𝑠𝑞𝑢𝑒 =∝𝑡𝑎𝑏𝑙𝑒
95% 5% 0.975 1.96 pour 𝛼 = 0,05 et v=24
98% 2% 0.990 2.325 ↓ 𝑣 ⁄𝛼 → 0.9 0.8 0.7 0.6 …. .02 0.01
99% 1% 0.995 2.575
1 0.1584 0.3249
0.509
0.7265 1 12.706 31.821 63.656
5
… … …
24 0.6
0.127 0.2562 0.39 0.5314 84 2.0639 2.4922 0.127
8
Exemple 1 « Température du corps humain ».
Pour un échantillon des températures corporelles, on a n=106 et 𝑥̅ =36.78°C.
Supposer que l’échantillon est un échantillon aléatoire simple et que σ est connue et
vaut 0.34° 𝐶 .
Donner l’intervalle de confiance à 95% de la température corporelle.
Il faut d’abord vérifier les conditions requises pour estimer µ
On a la normalité de la population et n>30.
n>30 est suffisante même si on n’a pas la normalité.
𝜎 0.34
𝐸 = 𝑡𝛼 ∗ = 1.96 = 0.06
2 √𝑛 √106
ICµ =[36.72, 36.84]
Exemple 2 Considérons l’exemple de la température corporelle mais avec l’écart type estimé
s=0.34.
Les conditions requises pour l’estimation de µ sont satisfaites.
(n étant >30 , on n’a pas besoin de vérifier la normalité)
pour α=0.05, n-1=105 on a tα/2,n-1=1.984
𝑠 0.34
𝐸 = 𝑡𝛼 ∗ = 1.984 = 0.06
2 √𝑛 √106
ICµ= [36.72, 36.84]
Interprétation à partir des résultats de l’échantillon on peut être sûr à 95% que l’intervalle
[36.72; 36.84] contient effectivement la vraie valeur de la moyenne de la population
3/ Estimation par intervalle de confiance d’une variance
intervalle de confiance d’une variance 𝜎 𝟐
conditions d’application IC
2 2
* l’échantillon est aléatoire simple (𝑛 − 1)𝑆𝑒𝑠𝑡 (𝑛 − 1)𝑆𝑒𝑠𝑡
𝐼𝐶𝜎𝟐 = [ ; ]
* la population doit avoir une distribution 𝜒12 𝜒22
normale (même si n>30). un d.d.l (v=n-1)
∝ ∝
𝐹(𝜒12 ) = 1 − ; 𝐹(𝜒22 ) =
2 2
si N est assez grand et ne se trouve pas dans la
table du 𝜒 2 ; on fait une approximation par laloi
normale
théorème si X suit une loi du 𝜒 2 𝑠𝑖 𝑙𝑒 𝑑. 𝑑. 𝑙 >
30 𝑎𝑙𝑜𝑟𝑠 𝑙𝑎 (𝑉. 𝐴)𝑈 = √2𝑋² − √2𝑣 − 1 suit une loi
normale N(0 ,1)
Exercice dans un échantillon de taille n=20 on a pu établir une estimation de la variance d’une (V.A) X
2
𝑆𝑒𝑠𝑡 = 25.3
Donner un IC de la variance au risque 5%.Refaire l’exercice pour N=45
Exemple : « Températures corporelles »
On liste 106 températures corporelles prises par des chercheurs. Supposer que c’est un
échantillon simple et utiliser les caractéristiques suivantes pour construire un intervalle de
confiance à 95% de l’écart type pour les températures corporelles de l’ensemble de la
population.
a. D’après la représentation graphique (histogramme) de l’échantillon, Il n’y a pas de
valeurs extrêmes et les données semblent suivre une loi normale.
̅ = 36.78°C, 𝒔 = 0.34 °C, 𝒏 = 𝟏𝟎𝟔
𝒙
Solution
1. La condition de normalité est satisfaite.
2. n=106, le ddl=106-1=105 . Si ce ddl n’est pas dans la table, nous prendrons la valeur
la plus proche. Par exemple ddl=100.
3. Pour un niveau de confiance 95%, on se réfère aux valeurs 0.975 et 0.025 comme
en- têtes de colonnes, On a pour ddl=105 :𝜒 21 = 78,54, 𝜒 2 2 =135,2
4. Pour ddl=100 : 𝜒 21 = 74.22, 𝜒 2 2 =129.561
(𝑛−1)𝑠 2 (𝑛−1)𝑠 2
5. 𝐼𝐶𝜎2 = [ , ]
𝜒2 2 𝜒2 1
(106−1)∗(0.34)2 (106−1)∗(0.34)2
6. 𝐼𝐶𝜎2 = [ , ]
135.2 78.54
7. 𝑰𝑪𝝈𝟐 =[0.0898, 0.155]
8. Si on prend la racine carré IC σ=[0.3, 0.39]