0% ont trouvé ce document utile (0 vote)
2K vues8 pages

Estimation par intervalle de confiance

Ce document présente les corrigés de plusieurs exercices portant sur l'estimation par intervalle de confiance. Les exercices concernent notamment l'estimation de la teneur moyenne en potassium d'une solution, de la probabilité d'avoir de l'asthme et du temps de réaction moyen d'un conducteur. Pour chaque exercice, le corrigé détaille le calcul des intervalles de confiance à différents niveaux ainsi que les hypothèses et outils statistiques utilisés.

Transféré par

Touhemi Syrina
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
2K vues8 pages

Estimation par intervalle de confiance

Ce document présente les corrigés de plusieurs exercices portant sur l'estimation par intervalle de confiance. Les exercices concernent notamment l'estimation de la teneur moyenne en potassium d'une solution, de la probabilité d'avoir de l'asthme et du temps de réaction moyen d'un conducteur. Pour chaque exercice, le corrigé détaille le calcul des intervalles de confiance à différents niveaux ainsi que les hypothèses et outils statistiques utilisés.

Transféré par

Touhemi Syrina
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Université d’Evry-Val d’Essonne 2019-2020

L2 Mathématiques / DL2 Mathématiques Economie


L2 Informatique / DL2 Biologie Informatique
Statistiques

Corrigé de la feuille de TD 4 : Estimation par intervalle de


confiance

Exercice 1.
Pour déterminer la teneur en potassium d’une solution, on effectue des dosages à
l’aide d’une technique expérimentale donnée.
On admet que le résultat d’un dosage est une variable aléatoire suivant une loi
gaussienne N (µ, σ 2 ) dont l’espérance µ est la valeur que l’on cherche à déterminer,
et dont l’écart-type σ est de 1 mg/litre si l’on suppose que le protocole expérimental
a été suivi scrupuleusement.
Les résultats pour cinq dosages indépendants réalisés en suivant rigoureusement le
protocole expérimental sont les suivants (en mg/litre) : 74.0, 71.6, 73.4, 74.3, 72.2.
1. Déterminer à partir de ces mesures un intervalle de confiance pour µ de niveau
de confiance 95% et calculer l’intervalle observé.
Outils : CM [Link], §1 "Intervalle de confiance pour l’espérance d’un n-
échantillon gaussien", §§ 1.1."Cas où la variance est connue.
Corrigé : Soit X le résultat d’un dosage en mg/litre. Alors X ∼ N (µ, 1).
Soient X1 , . . . , Xn i.i.d. de loi de X. L’espérance µ est naturellement estimée
par la moyenne empirique
n
1X
X̄n = Xi ,
n i=1
estimateur sans biais et consistant. Comme moyenne de n variables aléatoires
indépendantes de loi N (µ, 1), la moyenne empirique suit la loi gaussienne. Plus
précisément :
1 √
X̄n ∼ N (µ, ) et donc n(X̄n − µ) ∼ N (0, 1). (1)
n
On sait que si Z ∼ N (0, 1), alors, lu dans les tables de N (0, 1)

P(Z ≤ 1, 96) = 0, 975

et donc, par symétrie de la densité de N (0, 1) par rapport à l’axe des ordonnées,

P(−1, 96 ≤ Z ≤ 1, 96) = 0, 95.


Ce qui donne, en utilisant (1)

P(−1, 96 ≤ n(X̄n − µ) ≤ 1, 96) = 0, 95.

En résolvant la double inégalité on obtient :


1, 96 1, 96
P(X̄n − √ ≤ µ ≤ X̄n + √ ) = 0, 95
n n

et donc l’intervalle de confiance pour µ de niveau de confiance 95% est

1, 96 1, 96
IC95% (µ) = [X̄n − √ ; X̄n + √ ].
n n
Pour trouver l’intervalle de confiance observée on calcule la valeur de la moyenne
empirique sur l’échantillon donnée :
1
x̄ = (74.0 + 71.6 + 73.4 + 74.3 + 72.2 + 73, 1)
5
où on a utilisé n = 5. On obtient :

IC95%,obs (µ) = [72, 22346; 73, 97654].

2. Quelle taille d’échantillon est nécessaire pour avoir au même niveau de confiance
un intervalle de longueur inférieure à 0.1 mg/litre ?
Corrigé : Notons l la longueur de l’intervalle de confiance. On a
2 × 1, 96
l= √ .
n
On cherche n tel que l ≤ 0, 1, i.e. n tel que
2 × 1, 96
√ ≤ 0, 1.
n
D’ou
n ≥ (2 × 1, 96/0, 1)2 = 1536, 64.
C’est donc à partir de n = 1537 que la longueur l sera plus petite que 0, 1.
Exercice 2.
Suite de l’exercice 1 du TD 3.
Lors d’un sondage effectué en Ile de France, auprès de 550 personnes, il est apparu
que 42 avaient de l’asthme. On se propose d’estimer par intervalle de confiance la
probabilité p d’avoir de l’asthme en Ile de France. On note Zi la variable aléatoire
qui vaut 1 si la i-ème personne de l’échantillon sondé est atteinte et 0 sinon. On
admet que les variables Z1 , · · · , Zn sont indépendantes et de même loi. On note
n
1X
Zn = Zi . Calculer des intervalles de confiance pour p, basés sur l’approxi-
n i=1
mation gaussienne, de coefficients de sécurité asymptotiques 90%, 95% puis 99%.
Calculer les intervalles observés.
Outils : CM Chap. IV, §3 "Intervalle de confiance pour une probabilité dans le
cas d’un grand échantillon."
Corrigé : Les v.a. Z1 , · · · , Zn sont i.i.d. de loi de Bernoulli de paramètre p. On a
aussi
EZi = p , V ar(Zi ) = p(1 − p).
L’estimation de p par intervalle de confiance c’est donc un cas particulier de l’es-
timation de l’espérance d’un grand échantillon par intervalle de confiance. Par le
Théorème Central Limite , on a la convergence en loi suivante :
√ Z̄n − p L
np −→ N (0, 1).
p(1 − p) n→∞

La variance V ar(Zi ) = p(1 − p) est inconnue. En utilisant le fait que Z̄n est un
estimateur consistant de p, on obtient que Z̄n (1 − Z̄n ) est un estimateur consistant
de la variance , d’où on peut déduire que
√ Z̄n − p L
np −→ N (0, 1).
Z̄n (1 − Z̄n) n→∞

Cette convergence en loi signifie précisément que ∀a ≤ b,


√ Z̄n − p
P(a ≤ np ≤ b) −→ P(a ≤ Z ≤ b),
Z̄n (1 − Z̄n ) n→∞

où Z ∼ N (0, 1).
Pour n grand, et à partir de n = 30 on peut utiliser l’approximation :
!
√ Z̄n − p
P a ≤ np ≤ b ≈ P(a ≤ Z ≤ b).
Z̄n (1 − Z̄n )

Dans les tables de la loi N (0, 1) on choisit la valeur tα telle que

P(−tα ≤ Z ≤ tα ) = 1 − α.

C’est à dire, P(Z ≤ tα ) = 1 − α2 . tα est le quantile d’ordre 1 − α2 de la loi N (0, 1).


On obtient, en résolvant la double inégalité par rapport à p :
r r !
Z̄n (1 − Z̄n ) Z̄n (1 − Z̄n )
P Z̄n − tα ≤ p ≤ Z̄n + tα ≈1−α
n n
1. α = 10%, tα = 1, 645 IC10%,obs (p) = [0, 0577; 0, 09499]
2. α = 5%, tα = 1, 96, IC5%,obs (p) = [0, 0542; 0, 0985]
3. α = 1%, tα = 2, 575, IC1%,obs (p) = [0, 0472; 0, 1055]
Exercice 3.
En conduite, on sait que le temps de réaction (t.r.) est aléatoire et est lié à l’état
du conducteur. On suppose que pour un conducteur dans un état normal (non
atteint de maladie pouvant modifier son t.r., sous l’emprise d’aucun produit de
type alcool, drogue, médicaments, . . . ), le temps de réaction mesuré en secondes
est une variable aléatoire X d’espérance µ et de variance σ 2 > 0. On considère un
test de conduite où on met le conducteur en situation de danger imprévisible et
on observe son temps de réaction. On fait passer le test à n = 307 conducteurs
choisis aléatoirement et dans un état normal et le temps de réaction moyen pour
l’échantillon choisi est x̄n = 1.05 s.
1. On suppose tout d’abord que X est une v.a. de loi gaussienne de variance
σ 2 = 0.2 : X ∼ N (µ, 0, 2).
(a) Donner un intervalle de confiance pour le t.r. moyen µ, de niveau de confiance
95% et calculer l’intervalle observé.
Outils CM Chap IV, §1, §§1.1 Intervalle de confiance pour l’espérance d’une
loi gaussiènne, cas ou la variance est connue.
Corrigé Soit X1 , . . . , Xn un n-échantillon de loi de X. Puisque X ∼ N (µ, 0, 2),
on a X̄n ∼ N (µ; 0,2
n
) et
√ (X̄n − µ)
n √ ∼ N (0, 1).
0, 2
Dans les tables de la loi N (0, 1) on choisit la valeur tα telle que

P(−tα ≤ Z ≤ tα ) = 1 − α.

C’est à dire, P(Z ≤ tα ) = 1 − α2 . tα est le quantile d’ordre 1 − α


2
de la loi
N (0, 1). Ici α = 0, 05 et tα = 1, 96. On obtient,
√ (X̄n − µ)
P(−1, 96 ≤ n √ ≤ 1, 96) = 0, 95
0, 2
et en résolvant la double inégalité par rapport à µ :
r r
0, 2 0, 2
IC95% (µ) = [X̄n − 1, 96 ; X̄n + 1, 96 ].
n n
Pour calculer l’intervalle de confiance observée, on utilise x̄obs = 1, 05 et
n = 307.
IC95%,obs = [0, 99998; 1, 10003].
(b) Je conduis par beau temps sur une autoroute à 130 km/h. La distance par-
courue pendant le temps de réaction est appelée distance de réaction. Don-
ner un intervalle de confiance (et l’intervalle observé) pour la distance de
réaction moyenne, de niveau de confiance 95%.
Corrigé : Notons D distance de réaction. On a

D = X × 130/3600, E(D) = µ × 130/3600.

A partir de l’intervalle de confiance pour µ on trouvera celui pour D :


r r !
0, 2 0, 2
P X̄n − 1, 96 ≤ µ ≤ X̄n + 1, 96 ;
n n

et donc
r r !
0, 2 0, 2
P 13/360 × (X̄n − 1, 96 ) ≤ E(D) ≤ 13/360 × (X̄n + 1, 96 ) .
n n

Finalement l’intervalle de confiance observée pour ED est en km : [0, 03611; 0, 03972]


et en m : [36, 11; 39, 72].
2. On ne suppose plus à présent que X suit une loi gaussienne et que σ 2 est connu.
(a) Comment peut-on estimer σ 2 ? Quelle sont les propriétés de cet estimateur ?
Corrigé : On estime σ 2 par la variance empirique :
n
1X
σ̂n2 = (Xi − X̄n )2 .
n i=1

Remarque : C’est un estimateur consistant mais biaisé de σ 2 . Pour avoir un


estimateur non-biaisé, il faut normaliser par n − 1. Mais comme dans cette
exercice par la suite on va faire tendre n → ∞ et utiliser le TCL, cela est
équivalent. Aussi on a
n n
1X 1X
σ̂n2 = (Xi − X̄n )2 = (Xi )2 − (X̄n )2 .
n i=1 n i=1

(b) On a estimé σ 2 à Ppartir de l’échantillon considéré et on trouve comme esti-


2
mation σ̂n,obs = n1 ni=1 (xi − x̄n )2 = 0.23. Peut-on calculer des intervalles de
confiance comme dans la question 1 ? Si oui, faites le.
Outils : CM Chap IV, § 2. Intervalle de confiance pour l’espérance d’une
loi quelconque. Grand échantillon. §§2.2. Cas ou la variance est inconnue.
Corrigé : Par le Théorème Central Limite , on a la convergence en loi
suivante :
√ X̄n − µ L
n −→ N (0, 1).
σ n→∞
En utilisant le fait que σ̂n2 est un estimateur consistant de σ 2 , on peut mon-
trer que
√ X̄n − µ L
n −→ N (0, 1).
σ̂n n→∞
On aura donc
r r !
σ̂n σ̂n
P X̄n − 1, 96 ≤ µ ≤ X̄n + 1, 96 ≈ 0, 95.
n n

IC95%,obs (µ) = [0, 99635; 110365].


On a aussi l’intervalle observé pour la moyenne de la distance ED
r r !
σ̂n σ̂n
P 13/360 × (X̄n − 1, 96 ) ≤ ED ≤ 13/360 × (X̄n + 1, 96 ) ≈ 0, 95.
n n

IC95%,obs (E(D)) = [35, 98; 39, 85].

(c) Peut-on affirmer que les niveaux de confiance sont exactement de 95% ?
Corrigé : Non, car il s’agit des intervalles asymptotiques : par le TCL on
a seulement
r r
σ̂n σ̂n
P(X̄n − 1, 96 ≤ µ ≤ X̄n + 1, 96 ) −→ 0, 95.
n n n→∞
ce qui donne ≈ 0, 95 et non = 0, 95 pour les deux intervalles de confiance.
Exercice 4 Suite de l’exercice 2 du TD 3.
On suppose que le nombre X de clients téléphonant à un central téléphonique
chaque jour est une variable aléatoire de loi de Poisson de paramètre λ, avec λ > 0.
Pendant n = 100 jours, on a compté le nombre xi de clients ayant appelé le jour
i. Sur ces 100 jours, le nombre moyen d’appels par jour obtenu est de 2,89. On
considère que chaque xi est la réalisation d’une variable aléatoire Xi de loi de
Poisson de paramètre λ, les Xi étant supposées indépendantes et identiquement
distribuées.
1. Déterminer un intervalle de confiance pour λ de niveau de confiance approxi-
matif 1 − α.
Outil : CM Chap IV §2, §§2.2 Intervalle de confiance pour l’espérance d’une
loi quelconque. Grand échantillon. Variance inconnue.
Corrigé : On note Xi nombre de clients téléphonant à le centrale le jour i. On
a X1 , . . . , Xn i.i.d. de loi P(λ). n = 100 On a EXi = λ, V ar(Xi ) = λ. Par le
TCL
√ (X̄n − λ) L
n −→ N (0, 1).
λ n→∞
Comme X̄n est un estimateur consistant de λ, on a aussi
√ (X̄n − λ) L
n −→ N (0, 1).
X̄n n→∞

On cherche dans les tables de N (0, 1) la valeur tα telle que

P(−tα ≤ Z ≤ tα ) = 1 − α

ou Z ∼ N (0, 1). On a

√ (X̄n − λ) L
P(−tα ≤ n ≤ tα ) −→ P(−tα ≤ Z ≤ tα )
X̄n n→∞

et donc pour n grand


√ (X̄n − λ)
P(−tα ≤ n ≤ tα ) ≈ 1 − α.
X̄n

D’ou r r
X̄n X̄n
P(X̄n − tα ≤ λ ≤ X̄n + tα ) ≈ 1 − α.
n n
2. Donner les intervalles de confiance observés pour λ calculés aux niveaux de
confiance approximatifs 90%, 95% et 99%. Commenter.
Pour calculer l’IC observé on trouve :
(a) α = 10%, tα = 1, 645 IC10%,obs (λ) = [2, 61035; 3, 16465]
(b) α = 5%, tα = 1, 96, IC5%,obs (λ) = [2, 5568; 3, 2232]
(c) α = 1%, tα = 2, 575, IC1%,obs (λ) = [2, 45225; 3, 32775]
3. Comment peut-on obtenir des intervalles de confiance de longueurs plus petites
en gardant les mêmes niveaux de confiance ?
Augmenter le n.

Exercice 5 Pour déterminer la concentration en glucose d’un échantillon sanguin, on


effectue des dosages à l’aide d’une technique expérimentale donnée. On considère
que le résultat de chaque dosage est une variable aléatoire de loi gaussienne. On
effectue 10 dosages indépendants, qui donnent les résultats suivants (en g/l) :

0.96, 1.04, 1.08, 0.92, 1.04, 1.18, 0.99, 0.99, 1.25, 1.08

1. Calculer une estimation de la concentration en glucose de cet échantillon san-


guin.
Corrigé Soit Xi résultat du dosage i. Xi ∼ N (m, σ 2 ), X1 , . . . , Xn i.i.d. et
n = 10. On estime m parX̄n et x̄obs = 1, 053.
2. Calculer un intervalle de confiance de cette concentration de niveau de confiance
95%.
Outil CM Chap IV § 1, §§1.2 : Intervalle de confiance pour l’espérance de la
loi gaussienne, n quelconque, variance inconnue.
Corrigé On estime la variance inconnue σ 2 par l’estimateur sans biais
n
1 X
Sn2 = (Xi − X̄n )2 .
n − 1 i=1

On considère la statistique
√ X̄n − m
n .
Sn
Cette statistique ne suit pas la loi gaussienne. Sa loi est appelée la loi de Student
à n − 1 degré de libertés. On note

√ X̄n − m
n ∼ St(n − 1).
Sn
On cherche dans les tables de St(n − 1) la valeur de tα telle que

P(−tα ≤ T ≤ tα ) = 1 − α

où T ∼ St(n − 1).

On remplace T par n X̄nS−m
n
et on en déduit

S S
P(X̄n − tα √ ≤ m ≤ X̄n − tα √ ) = 1 − α
n n
Comme on a utilisé une loi exacte (loi de Student à n − 1 degré de liberté,
c’est une égalité
√ X̄n exacte, et pas une égalité approximative, puisque la loi de la
−m
statistique n Sn c’est la loi St(n − 1).
Pour α = 0, 05 et n = 10 on trouve tα = 2, 262. On calcule 10 2
P
i=1 xi = 11, 1791.
Enfin en utilisant
n n
1X 1X 2
(Xi − X̄n )2 = X − (X̄n )2 ,
n i=1 n i=1 i

et n n
1 X n 1X
(Xi − X̄n )2 = (Xi − X̄n )2
n − 1 i=1 n − 1 n i=1
on calcule p
sobs = 1, 12 − 1, 0532 = 0, 095.

Vous aimerez peut-être aussi