0% ont trouvé ce document utile (0 vote)
279 vues9 pages

Test d'hypothèses en Probabilités et Statistiques

Transféré par

hamza dahbi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
279 vues9 pages

Test d'hypothèses en Probabilités et Statistiques

Transféré par

hamza dahbi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TD Proba-Stat Tronc commun Polytech Clermont

TD de Probabilité et Statistique

Correction feuille 4 : Test d’hypothèses

Exercice 1 :
Population : individus d’une population de référence
échantillon : n =42 patients
var. intérêt : Xi =glycémie du ième patient∼ N (µ, σ 2 ), µ inconnue
étape 1 : Définition des hypothèses
H0 : ”µ = 1”
H1 : ”µ 6= 1”

α = 0.05
Il faut réaliser un test de comparaison d’une moyenne à une valeur théorique
dans le cas où σ 2 est connue.
étape 2 : Statistique de test
2
X̄ ∼ (1, σn ), Z = X̄−1√σ ∼ N(0; 1) sous H0
n
étape 3 : Zone de rejet
On cherche q > 0 tel que
q
PH0 (|X̄ − 1| > q) = 0.05 ⇔ PH0 (|Z| > ) = 0.05
√σ
n
q
⇔ 2PH0 (Z > ) = 0.05
√σ
n
q
⇔ 2 − 2PH0 (Z < ) = 0.05
√σ
n
q
⇔ PH0 (Z < ) = 0.975
√σ
n
q
⇔ = 1.96
√σ
n
⇔ q = 0.03

R = {|X̄ − 1| > 0.03}


étape 4 : Conclusion
x̄ = 1.06, |x̄ − 1| = 0.06 > 0.03 ∈ R
On rejette H0 . Cet échantillon n’est pas représentatif de la population de
référence.
2

Exercice 2 :
population : individus vivant en milieu rural ou en milieu urbain
échantillons : NU = 200, NR = 300
var d’intérêts :
— XU i : rythme cardiaque du ième individu vivant en milieu urbain
∼ N(mU , σ 2 ) i.i.d.
— XRi : rythme cardiaque du ième individu vivant en milieu rural ∼
N(mR , σ 2 ) i.i.d.
mU , mR , σ 2 sont inconnues
(1)
H0 : ”mU = mR ”
H1 : ”mU > mR ”

(2) estimateur de mU − mR : X¯U − X¯R


E(X¯U − X¯R ) = E(X¯U ) − E(X¯R ) = mU − mR
X¯U − X¯R est un estimateur sans biais.
(3) R = {|T | > c} où T ∼ TnU +n−R−2 = T498 , c > 0 tel que
PH0 (|T | > c) = 0.05 ⇔ PH0 (T < −c) + PH0 (T > c) = 0.05
⇔ PH0 (T < c) = 0.975
⇔ c = 1.9647
R = {|T | > 1.9647}
(4)
1 X X
Sn2U ,nR = ( ((XU i − X¯U )2 + ((XRi − X¯R )2 )
498
1 X X
SU2 = (XU i − X¯U )2 ⇔ (XU i − X¯U )2 = (nU − 1)s2U
nU − 1
1
Sn2U ,nR = (199 ∗ 147 + 299 ∗ 126) = 134.39
498
81 − 76
t = q = 4.72 > 1.9647 ∈ R
1 1
134.39 ∗ ( 200 + 300 )

On rejette H0 . Le rythme cardiaque en milieu urbain est différent de


celui en milieu rural.

Exercice 3 :
population : disques d’un fabriquant
variable d’intérêt : Xi = 1 si le ième CD présente un défaut, Xi = 0 sinon.
(1) Loi de Xi :
— Xi (Ω) = {0; 1}
3

— Si l’on pose p = P(Xi = 1) =proportion de CD défectueux, Xi ∼


B(p), i.i.d., p inconnue.

E(Xi ) = p, V ar(Xi ) = p(1 − p)


P
nbre de CD défectueux Xi
(2) P̂ = n = n , E(P̂ ) = p. P̂ est sans biais.
(3) — Enoncé simplifié : Le fabriquant affirme que 99% de ses CD sont
sans défaut.

H0 : ”p = 0.01”
H1 : ”p 6= 0.01”

Sous H0 et si n ≥ 30 et np(1 − p) ≥ 10, alors


0.01 × 0.99 P̂ − 0.01
P̂ ∼ N(0.01; ), Z = q ∼ N(0; 1)
n 0.01×0.99
n

R = {|P̂ − 0.01| > c} où c tel que


c
PH0 (|P̂ − 0.01| > c) = 0.05 ⇔ PH0 (|Z| > q ) = 0.05
0.01×0.99
n
c
⇔ PH0 (Z ≤ q ) = 0.975
0.01×0.99
n
c
⇔ q = 1.96
0.01×0.99
n
r
0.01 × 0.99
⇔ c = 1.96 ×
n

Application numérique : n = 5000, x = 100


n = 5000 >q30, 5000 × 0.01 × 0.99 = 49.5 > 10
0.01×0.99
c = 1.96 × 5000 = 0.0028, R = {|p̂ − 0.01| > 0.0028}
100
p̂ = = 0.02, |p̂ − 0.01| = 0.01 > 0.0028, p̂ ∈ R. On rejette H0 .
5000
Au risque de 5%, l’affirmation du fabriquant est fausse.
— Enoncé classique : le fabriquant affirme que plus de 99 % de ces
CD sont sans défaut. Donc le fabricant a tord si on trouve plus de
1% de CD défectueux.

H0 : ”p = 0.01”
H1 : ”p > 0.01”
4

(4) Sous H0 et si n ≥ 30 et np(1 − p) ≥ 10, alors

0.01 × 0.99
P̂ ∼ N(0.01; )
n

(5) R = {P̂ − 0.01 > c} = où c tel que


c
PH0 (P̂ − 0.01 > c) = 0.05 ⇔ PH0 (Z > q ) = 0.05
0.01×0.99
n
c
⇔ PH0 (Z < q ) = 0.95
0.01×0.99
n
c
⇔ q = 1.6449
0.01×0.99
n
r
0.01 × 0.99
⇔ c = 1.6449
n

(6) N = 5000 ≤ 30, np(1 − p) = 5000 ∗ 0.01 ∗ 0.99 = 49.5 ≥ 10


c = 0.0023, R = {P̂ ∗ 0.01 > 0.023}
100
p̂ = 5000 , p̂ − 0.01 = 0.02 − 0.01 = 0.01 > 0.0023, p̂ ∈ R. On rejete H0 .
Le fabriquant a tord.

Exercice 4 :
population : les grains lors d’une étude de sédiments
échantillons : nC = 96, nD = 63
var. intérêts :
— XCi : diamètre du ième grains de l’échantillon C ∼ N(mC , σ 2 ), i.i.d.
— XDi : diamètre du ième grains de l’échantillon D ∼ N(mD , σ 2 ), i.i.d.
mC , mD , σ 2 inconnues.
Cette situation est analogue à celle de l’exercice 2. On veut effectuer une
comparaison entre deux moyennes. On va donc procéder de la même façon :
étape 1 : Définition des hypothèses

H0 : ”mC = mD ”
H1 : ”mC 6= mD ”

étape 2 : Statistique de test

X¯C − X¯D
T =q ∼ TnC +nD −2 = T156 sous H0
Sn2C ,nD ( n1C + 1
nD )
5

étape 3 : Zone de rejet


R = {|T | > c} avec c tel que

PH0 (|T | > c) = 0.05 ⇔ 2PH0 (T > c) = 0.05


⇔ 2 − 2PH0 (T < c) = 0.05
⇔ PH0 (T < c) = 0.975
⇔ c = 1.9719

R = {|T | > 1.9719}

étape 4 : Conclusion

1
s2nC ,nD = (95 ∗ 152 + 61 ∗ 122 ) = 193.3
156

63 − 54
t= q = 3.97 > 1.9719 ∈ R
1 1
193.3( 96 + 62 )

On rejette H0 . La taille moyenne des grains est différente selon l’échantillon


prélevé.5

Exercice 5 :
population : une pièce de monnaie
var. intérêt : Xi = 1 si Pile lors du ième lancé et Xi = 0 sinon. Xi ∼ B(p),
i.i.d. p inconnue.
étape 1 : Définition des hypothèses

1
H0 : ”p = ”
2
1
H1 : ”p 6= ”
2

étape 2 : Statistique de test


n = 660 > 30, 660 ∗ 0.5 ∗ 0.5 = 165 ≥ 5. Donc sous H0 ,

nbre de pile 0.5 ∗ 0.5 P̂ − 0.5


P̂ = = X̄ ∼ N(0.5; )⇔Z= q ∼ N(0; 1)
n 660 0.5∗0.5
660
6

étape 3 : Zone de rejet


R = {|P̂ − 0.5| > c} où c tel que

c
PH0 (|P̂ − 0.5| > c) = 0.05 ⇔ 2PH0 (|Z| > q ) = 0.05
0.5∗0.5
660
c
⇔ P(Z < q ) = 0.975
0.5∗0.5
660
c
⇔ q = 1.96
0.5∗0.5
660
r
0.5 ∗ 0.5
⇔ c = 1.96 × = 0.038
660

R = {|P̂ − 0.5| > 0.038}

étape 4 : Conclusion
p̂ = 312
600 = 0.47, |p̂ − 0.5| = |0.47 − 0.5| = 0.03 < 0.038, p̂ ∈
/R
On ne peut pas rejeter H0 . Rien ne prouve que la pièce n’est pas équilibée.

Exercice 6 :
population : patients atteints par une maladie
échantillons : nA = n, nB = n
var. intérêts :
— Xi : réponse de la variable continue pour le patient i du groupe A,
Xi ∼ N(µ1 , σ 2 ) i.i.d.
— Yi : réponse de la variable continue pour le patient i du groupe B,
Xi ∼ N(µ2 , σ 2 ) i.i.d.
µ1 , µ2 inconnues.
2 2
(1) Sous H0 , X̄ ∼ N(µ1 , σn ), Ȳ ∼ N(µ2 , σn ). Comme les Xi et les Yi sont
indépendantes, X̄ et Ȳ sont indépendantes. Donc X̄ − Ȳ ∼ N( ; ).
E(X̄ − Ȳ ) = E(X̄) − E(Ȳ ) = µ1 − µ2 = 0 puisque µ1 = µ2
2
V ar(X̄−Ȳ ) = V ar(X̄)+V ar(Ȳ ) = 2σn puisque X̄ et Ȳ sont indépendantes.

2σ 2 X̄ − Ȳ
X̄ − Ȳ ∼ N(0; ), Z = q ∼ N(0; 1)
n 2σ 2
n
7

(2) On cherche K0 tel que

K0
PH0 (X̄ − Ȳ > K0 ) = 0.05 ⇔ PH0 (Z > q ) = 0.05
2σ 2
n
K0
⇔ PH0 (Z < q ) = 0.95
2σ 2
n
K
⇔ q 0 = 1.6449
2σ 2
n
r
2σ 2
⇔ K0 = 1.6449
n

(3) µ1 − µ2 = ∆. X̄ et Ȳ sont indépendantes. Donc X̄ − Ȳ ∼ N( ; ).


E(X̄ − Ȳ ) = E(X̄) − E(Ȳ ) = µ1 − µ2 = ∆
2
V ar(X̄−Ȳ ) = V ar(X̄)+V ar(Ȳ ) = 2σn puisque X̄ et Ȳ sont indépendantes.

2σ 2 X̄ − Ȳ − ∆
X̄ − Ȳ ∼ N(∆; ), Z = q ∼ N(0; 1)
n 2σ 2
n

(4) On cherche ∆ > 0 tel que

K0 − ∆
P(X̄ − Ȳ > K0 ) = 0.9 ⇔ P(Z > q ) = 0.9
2σ 2
n
K0 − ∆
=> q < 0
2σ 2
n
∆ − K0
⇔ P(Z < q ) = 0.9
2σ 2
n
∆ − K0
⇔ q = 1.2816
2σ 2
n
r
2σ 2
⇔ ∆ = 1.2816 + K0
n
r r
2σ 2 2σ 2
⇔ ∆ = 1.2816 + 1.6449
n n
r
2σ 2
⇔ ∆ = 2.9265
n
8

(5) ∆ = 4, σ 2 = 100
On cherche n tel que
r
2 ∗ 100
4 ≥ 2.9265
n

n ≥ 107.055

Il faudra donc prendre au moins 108 patients dans chaque groupe pour
avoir un niveau de confiance de 5% et une puissance de 90% dans le
cas où l’écart des moyennes est de 4.

Exercice 7 :
population : les techniciens
échantillons : nA = n, nB = n
var. intérêts :
— Xi : rendement du ième technicien sur la machine A, Xi ∼ N(µ1 ; σ 2 )
i.i.d.
— Yi : rendement du ième technicien sur la machine B, Yi ∼ N(µ2 ; σ 2 )
i.i.d.
µ1 , µ2 inconnues.
(1) E(X̄) = E( n1 ni=1 Xi ) = n1 ni=1 E(Xi ) = µ1 . X̄ est un estimateur
P P
sans biais de µ1 .
De la même façon, E(Ȳ ) = µ2 . Ȳ est un estimateur sans biais de µ2 .
2
(2) Comme les Xi sont indépendantes, V ar(X̄) = n12 ni=1 V ar(Xi ) = σn .
P
2
De la même façon, V ar(X̄) = σn
(3) X̄ (resp.Ȳ ) est la somme de v.a. gaussiennes indépendantes. Donc
σ2
X̄ ∼ N(µ1 ; )
n
σ2
Ȳ ∼ N(µ2 ; )
n
(4) Intervalle de confiance IC1 :
 
σ σ
x̄ − c √ ; x̄ + c √
n n
où P(−c ≤ Z ≤ c) = 0.95, Z ∼ N(0; 1)
P(−c ≤ Z ≤ c) = 0.95 ⇔ 2P(Z < c) − 1 = 0.95
⇔ P(Z < c) = 0.975
⇔ c = 1.96

 
σ σ
IC1 = X̄ − 1.96 √ ; X̄ + 1.96 √
n n
9

De la même fao̧n, on obtient :


 
σ σ
IC2 = Ȳ − 1.96 √ ; Ȳ + 1.96 √
n n
(5) — X̄ < Ȳ , |X̄ − Ȳ | = Ȳ − X̄

σ σ
IC1 ∩ IC2 = ⇔ X̄ + 1.96 √ < Ȳ − 1.96 √
n n
σ
⇔ Ȳ − X̄ > 3.92 √
n
σ
⇔ |X̄ − Ȳ | > 3.92 √
n

— Ȳ < X̄, |X̄ − Ȳ | = X̄ − Ȳ

σ σ
IC1 ∩ IC2 = ⇔ Ȳ + 1.96 √ < X̄ − 1.96 √
n n
σ
⇔ X̄ − Ȳ > 3.92 √
n
σ
⇔ |X̄ − Ȳ | > 3.92 √
n

σ
IC1 ∩ IC2 = ⇔ |X̄ − Ȳ | > δ avec δ = 3.92 √
n
2
(6) Sous H0 , X̄ − Ȳ ∼ N(0; 2σn ) puisque X̄ et Ȳ sont indépendantes.
(7)
σ 3.92
PH0 (|X̄ − Ȳ | > 3.92 √ ) = PH0 (|Z| > √ )
n 2
3.92
= 2PH0 (Z > √ )
2
3.92
= 2 − 2PH0 (Z < √ )
2
= 2 − 2 ∗ 0.997197 = 0.0056
(8) La probabilité de se tromper lorsque l’on rejette H0 est très faible.
Pour un intervalle de confiance de 95%, on obtient un niveau de test
de 0.56%. On aura tendance à trop souvent accepter à tord H0 .

Vous aimerez peut-être aussi