TD Proba-Stat Tronc commun Polytech Clermont
TD de Probabilité et Statistique
Correction feuille 4 : Test d’hypothèses
Exercice 1 :
Population : individus d’une population de référence
échantillon : n =42 patients
var. intérêt : Xi =glycémie du ième patient∼ N (µ, σ 2 ), µ inconnue
étape 1 : Définition des hypothèses
H0 : ”µ = 1”
H1 : ”µ 6= 1”
α = 0.05
Il faut réaliser un test de comparaison d’une moyenne à une valeur théorique
dans le cas où σ 2 est connue.
étape 2 : Statistique de test
2
X̄ ∼ (1, σn ), Z = X̄−1√σ ∼ N(0; 1) sous H0
n
étape 3 : Zone de rejet
On cherche q > 0 tel que
q
PH0 (|X̄ − 1| > q) = 0.05 ⇔ PH0 (|Z| > ) = 0.05
√σ
n
q
⇔ 2PH0 (Z > ) = 0.05
√σ
n
q
⇔ 2 − 2PH0 (Z < ) = 0.05
√σ
n
q
⇔ PH0 (Z < ) = 0.975
√σ
n
q
⇔ = 1.96
√σ
n
⇔ q = 0.03
R = {|X̄ − 1| > 0.03}
étape 4 : Conclusion
x̄ = 1.06, |x̄ − 1| = 0.06 > 0.03 ∈ R
On rejette H0 . Cet échantillon n’est pas représentatif de la population de
référence.
2
Exercice 2 :
population : individus vivant en milieu rural ou en milieu urbain
échantillons : NU = 200, NR = 300
var d’intérêts :
— XU i : rythme cardiaque du ième individu vivant en milieu urbain
∼ N(mU , σ 2 ) i.i.d.
— XRi : rythme cardiaque du ième individu vivant en milieu rural ∼
N(mR , σ 2 ) i.i.d.
mU , mR , σ 2 sont inconnues
(1)
H0 : ”mU = mR ”
H1 : ”mU > mR ”
(2) estimateur de mU − mR : X¯U − X¯R
E(X¯U − X¯R ) = E(X¯U ) − E(X¯R ) = mU − mR
X¯U − X¯R est un estimateur sans biais.
(3) R = {|T | > c} où T ∼ TnU +n−R−2 = T498 , c > 0 tel que
PH0 (|T | > c) = 0.05 ⇔ PH0 (T < −c) + PH0 (T > c) = 0.05
⇔ PH0 (T < c) = 0.975
⇔ c = 1.9647
R = {|T | > 1.9647}
(4)
1 X X
Sn2U ,nR = ( ((XU i − X¯U )2 + ((XRi − X¯R )2 )
498
1 X X
SU2 = (XU i − X¯U )2 ⇔ (XU i − X¯U )2 = (nU − 1)s2U
nU − 1
1
Sn2U ,nR = (199 ∗ 147 + 299 ∗ 126) = 134.39
498
81 − 76
t = q = 4.72 > 1.9647 ∈ R
1 1
134.39 ∗ ( 200 + 300 )
On rejette H0 . Le rythme cardiaque en milieu urbain est différent de
celui en milieu rural.
Exercice 3 :
population : disques d’un fabriquant
variable d’intérêt : Xi = 1 si le ième CD présente un défaut, Xi = 0 sinon.
(1) Loi de Xi :
— Xi (Ω) = {0; 1}
3
— Si l’on pose p = P(Xi = 1) =proportion de CD défectueux, Xi ∼
B(p), i.i.d., p inconnue.
E(Xi ) = p, V ar(Xi ) = p(1 − p)
P
nbre de CD défectueux Xi
(2) P̂ = n = n , E(P̂ ) = p. P̂ est sans biais.
(3) — Enoncé simplifié : Le fabriquant affirme que 99% de ses CD sont
sans défaut.
H0 : ”p = 0.01”
H1 : ”p 6= 0.01”
Sous H0 et si n ≥ 30 et np(1 − p) ≥ 10, alors
0.01 × 0.99 P̂ − 0.01
P̂ ∼ N(0.01; ), Z = q ∼ N(0; 1)
n 0.01×0.99
n
R = {|P̂ − 0.01| > c} où c tel que
c
PH0 (|P̂ − 0.01| > c) = 0.05 ⇔ PH0 (|Z| > q ) = 0.05
0.01×0.99
n
c
⇔ PH0 (Z ≤ q ) = 0.975
0.01×0.99
n
c
⇔ q = 1.96
0.01×0.99
n
r
0.01 × 0.99
⇔ c = 1.96 ×
n
Application numérique : n = 5000, x = 100
n = 5000 >q30, 5000 × 0.01 × 0.99 = 49.5 > 10
0.01×0.99
c = 1.96 × 5000 = 0.0028, R = {|p̂ − 0.01| > 0.0028}
100
p̂ = = 0.02, |p̂ − 0.01| = 0.01 > 0.0028, p̂ ∈ R. On rejette H0 .
5000
Au risque de 5%, l’affirmation du fabriquant est fausse.
— Enoncé classique : le fabriquant affirme que plus de 99 % de ces
CD sont sans défaut. Donc le fabricant a tord si on trouve plus de
1% de CD défectueux.
H0 : ”p = 0.01”
H1 : ”p > 0.01”
4
(4) Sous H0 et si n ≥ 30 et np(1 − p) ≥ 10, alors
0.01 × 0.99
P̂ ∼ N(0.01; )
n
(5) R = {P̂ − 0.01 > c} = où c tel que
c
PH0 (P̂ − 0.01 > c) = 0.05 ⇔ PH0 (Z > q ) = 0.05
0.01×0.99
n
c
⇔ PH0 (Z < q ) = 0.95
0.01×0.99
n
c
⇔ q = 1.6449
0.01×0.99
n
r
0.01 × 0.99
⇔ c = 1.6449
n
(6) N = 5000 ≤ 30, np(1 − p) = 5000 ∗ 0.01 ∗ 0.99 = 49.5 ≥ 10
c = 0.0023, R = {P̂ ∗ 0.01 > 0.023}
100
p̂ = 5000 , p̂ − 0.01 = 0.02 − 0.01 = 0.01 > 0.0023, p̂ ∈ R. On rejete H0 .
Le fabriquant a tord.
Exercice 4 :
population : les grains lors d’une étude de sédiments
échantillons : nC = 96, nD = 63
var. intérêts :
— XCi : diamètre du ième grains de l’échantillon C ∼ N(mC , σ 2 ), i.i.d.
— XDi : diamètre du ième grains de l’échantillon D ∼ N(mD , σ 2 ), i.i.d.
mC , mD , σ 2 inconnues.
Cette situation est analogue à celle de l’exercice 2. On veut effectuer une
comparaison entre deux moyennes. On va donc procéder de la même façon :
étape 1 : Définition des hypothèses
H0 : ”mC = mD ”
H1 : ”mC 6= mD ”
étape 2 : Statistique de test
X¯C − X¯D
T =q ∼ TnC +nD −2 = T156 sous H0
Sn2C ,nD ( n1C + 1
nD )
5
étape 3 : Zone de rejet
R = {|T | > c} avec c tel que
PH0 (|T | > c) = 0.05 ⇔ 2PH0 (T > c) = 0.05
⇔ 2 − 2PH0 (T < c) = 0.05
⇔ PH0 (T < c) = 0.975
⇔ c = 1.9719
R = {|T | > 1.9719}
étape 4 : Conclusion
1
s2nC ,nD = (95 ∗ 152 + 61 ∗ 122 ) = 193.3
156
63 − 54
t= q = 3.97 > 1.9719 ∈ R
1 1
193.3( 96 + 62 )
On rejette H0 . La taille moyenne des grains est différente selon l’échantillon
prélevé.5
Exercice 5 :
population : une pièce de monnaie
var. intérêt : Xi = 1 si Pile lors du ième lancé et Xi = 0 sinon. Xi ∼ B(p),
i.i.d. p inconnue.
étape 1 : Définition des hypothèses
1
H0 : ”p = ”
2
1
H1 : ”p 6= ”
2
étape 2 : Statistique de test
n = 660 > 30, 660 ∗ 0.5 ∗ 0.5 = 165 ≥ 5. Donc sous H0 ,
nbre de pile 0.5 ∗ 0.5 P̂ − 0.5
P̂ = = X̄ ∼ N(0.5; )⇔Z= q ∼ N(0; 1)
n 660 0.5∗0.5
660
6
étape 3 : Zone de rejet
R = {|P̂ − 0.5| > c} où c tel que
c
PH0 (|P̂ − 0.5| > c) = 0.05 ⇔ 2PH0 (|Z| > q ) = 0.05
0.5∗0.5
660
c
⇔ P(Z < q ) = 0.975
0.5∗0.5
660
c
⇔ q = 1.96
0.5∗0.5
660
r
0.5 ∗ 0.5
⇔ c = 1.96 × = 0.038
660
R = {|P̂ − 0.5| > 0.038}
étape 4 : Conclusion
p̂ = 312
600 = 0.47, |p̂ − 0.5| = |0.47 − 0.5| = 0.03 < 0.038, p̂ ∈
/R
On ne peut pas rejeter H0 . Rien ne prouve que la pièce n’est pas équilibée.
Exercice 6 :
population : patients atteints par une maladie
échantillons : nA = n, nB = n
var. intérêts :
— Xi : réponse de la variable continue pour le patient i du groupe A,
Xi ∼ N(µ1 , σ 2 ) i.i.d.
— Yi : réponse de la variable continue pour le patient i du groupe B,
Xi ∼ N(µ2 , σ 2 ) i.i.d.
µ1 , µ2 inconnues.
2 2
(1) Sous H0 , X̄ ∼ N(µ1 , σn ), Ȳ ∼ N(µ2 , σn ). Comme les Xi et les Yi sont
indépendantes, X̄ et Ȳ sont indépendantes. Donc X̄ − Ȳ ∼ N( ; ).
E(X̄ − Ȳ ) = E(X̄) − E(Ȳ ) = µ1 − µ2 = 0 puisque µ1 = µ2
2
V ar(X̄−Ȳ ) = V ar(X̄)+V ar(Ȳ ) = 2σn puisque X̄ et Ȳ sont indépendantes.
2σ 2 X̄ − Ȳ
X̄ − Ȳ ∼ N(0; ), Z = q ∼ N(0; 1)
n 2σ 2
n
7
(2) On cherche K0 tel que
K0
PH0 (X̄ − Ȳ > K0 ) = 0.05 ⇔ PH0 (Z > q ) = 0.05
2σ 2
n
K0
⇔ PH0 (Z < q ) = 0.95
2σ 2
n
K
⇔ q 0 = 1.6449
2σ 2
n
r
2σ 2
⇔ K0 = 1.6449
n
(3) µ1 − µ2 = ∆. X̄ et Ȳ sont indépendantes. Donc X̄ − Ȳ ∼ N( ; ).
E(X̄ − Ȳ ) = E(X̄) − E(Ȳ ) = µ1 − µ2 = ∆
2
V ar(X̄−Ȳ ) = V ar(X̄)+V ar(Ȳ ) = 2σn puisque X̄ et Ȳ sont indépendantes.
2σ 2 X̄ − Ȳ − ∆
X̄ − Ȳ ∼ N(∆; ), Z = q ∼ N(0; 1)
n 2σ 2
n
(4) On cherche ∆ > 0 tel que
K0 − ∆
P(X̄ − Ȳ > K0 ) = 0.9 ⇔ P(Z > q ) = 0.9
2σ 2
n
K0 − ∆
=> q < 0
2σ 2
n
∆ − K0
⇔ P(Z < q ) = 0.9
2σ 2
n
∆ − K0
⇔ q = 1.2816
2σ 2
n
r
2σ 2
⇔ ∆ = 1.2816 + K0
n
r r
2σ 2 2σ 2
⇔ ∆ = 1.2816 + 1.6449
n n
r
2σ 2
⇔ ∆ = 2.9265
n
8
(5) ∆ = 4, σ 2 = 100
On cherche n tel que
r
2 ∗ 100
4 ≥ 2.9265
n
√
n ≥ 107.055
Il faudra donc prendre au moins 108 patients dans chaque groupe pour
avoir un niveau de confiance de 5% et une puissance de 90% dans le
cas où l’écart des moyennes est de 4.
Exercice 7 :
population : les techniciens
échantillons : nA = n, nB = n
var. intérêts :
— Xi : rendement du ième technicien sur la machine A, Xi ∼ N(µ1 ; σ 2 )
i.i.d.
— Yi : rendement du ième technicien sur la machine B, Yi ∼ N(µ2 ; σ 2 )
i.i.d.
µ1 , µ2 inconnues.
(1) E(X̄) = E( n1 ni=1 Xi ) = n1 ni=1 E(Xi ) = µ1 . X̄ est un estimateur
P P
sans biais de µ1 .
De la même façon, E(Ȳ ) = µ2 . Ȳ est un estimateur sans biais de µ2 .
2
(2) Comme les Xi sont indépendantes, V ar(X̄) = n12 ni=1 V ar(Xi ) = σn .
P
2
De la même façon, V ar(X̄) = σn
(3) X̄ (resp.Ȳ ) est la somme de v.a. gaussiennes indépendantes. Donc
σ2
X̄ ∼ N(µ1 ; )
n
σ2
Ȳ ∼ N(µ2 ; )
n
(4) Intervalle de confiance IC1 :
σ σ
x̄ − c √ ; x̄ + c √
n n
où P(−c ≤ Z ≤ c) = 0.95, Z ∼ N(0; 1)
P(−c ≤ Z ≤ c) = 0.95 ⇔ 2P(Z < c) − 1 = 0.95
⇔ P(Z < c) = 0.975
⇔ c = 1.96
σ σ
IC1 = X̄ − 1.96 √ ; X̄ + 1.96 √
n n
9
De la même fao̧n, on obtient :
σ σ
IC2 = Ȳ − 1.96 √ ; Ȳ + 1.96 √
n n
(5) — X̄ < Ȳ , |X̄ − Ȳ | = Ȳ − X̄
σ σ
IC1 ∩ IC2 = ⇔ X̄ + 1.96 √ < Ȳ − 1.96 √
n n
σ
⇔ Ȳ − X̄ > 3.92 √
n
σ
⇔ |X̄ − Ȳ | > 3.92 √
n
— Ȳ < X̄, |X̄ − Ȳ | = X̄ − Ȳ
σ σ
IC1 ∩ IC2 = ⇔ Ȳ + 1.96 √ < X̄ − 1.96 √
n n
σ
⇔ X̄ − Ȳ > 3.92 √
n
σ
⇔ |X̄ − Ȳ | > 3.92 √
n
σ
IC1 ∩ IC2 = ⇔ |X̄ − Ȳ | > δ avec δ = 3.92 √
n
2
(6) Sous H0 , X̄ − Ȳ ∼ N(0; 2σn ) puisque X̄ et Ȳ sont indépendantes.
(7)
σ 3.92
PH0 (|X̄ − Ȳ | > 3.92 √ ) = PH0 (|Z| > √ )
n 2
3.92
= 2PH0 (Z > √ )
2
3.92
= 2 − 2PH0 (Z < √ )
2
= 2 − 2 ∗ 0.997197 = 0.0056
(8) La probabilité de se tromper lorsque l’on rejette H0 est très faible.
Pour un intervalle de confiance de 95%, on obtient un niveau de test
de 0.56%. On aura tendance à trop souvent accepter à tord H0 .