UNIVERSITÉ MOHAMED V - AGDAL
Échantillonnage et estimation Par N. RIANE
Série 2 : Corrigé
Exercice 0.1. La moyenne empirique Pn
i=1 Xi
Soient X1 , X2 , . . . une suite de v.a. i.i.d., on considère la moyenne empirique X̄ = .
n
1. Soit µ l'espérance de la v.a. Xi .
n
1 X nµ
E(X̄) = E( Xi ) = =µ
n n
i=1
donc
B(X̄) = E(X̄) − µ = 0
2. Soit σ 2 la variance de la v.a. Xi . En utilisant l'indépendance des v.a. Xi :
n
1 X xσ 2 σ2
V(X̄) = V( Xi ) = =
n2 n2 n
i=1
L'erreur quadratique moyenne est donnée par
2 σ2
R(X̄) = B(X̄) + V(X̄) =
n
σ2
3. L'estimateur X̄ est sans biais, de plus, lim V(X̄) = lim = 0. c'est un estimateur
n→+∞ n→+∞ n
convergent.
Exercice 0.2. La variance corrigée Pn
i=1 (Xi − X̄)2
Soient X1 , X2 , . . . une suite de v.a. i.i.d., on dénit la variance empirique s2 (X) = .
n
1. On note E(Xi ) = µ et V(Xi ) = σ 2 .
n n
1 X 1 X
2 2
E(s (X)) = E( (Xi − X̄) ) = E( (Xi 2 − 2Xi X̄ + X̄ 2 ))
n n
i=1 i=1
n
!
1 X 2 2
= E(Xi ) − 2E(Xi X̄) + nE(X̄ ))
n
i=1
n
!
1 X 2 2 2
= E(Xi ) − 2E(nX̄ ) + nE(X̄ ))
n
i=1
n
1X
= E(Xi 2 ) − E(X̄ 2 )
n
i=1
= E(X ) − V(X̄ 2 ) + (E(X̄))2
2
2
2 2
σ 2
= σ +µ − +µ
n
n−1 2
= σ
n
1
et le biais vaut
1
B(s2 (X)) = E(s2 (X)) − σ 2 = − σ 2
n
2. D'après la loi des grands nombre et des propriétés de la convergence en probabilité
Pn Pn 2 Pn 2
2 i=1 (Xi − X̄)2 i=1 Xi 2 i=1 Xi
s (X) = = − X̄ = − X̄ · X̄
n n n
−→ E(X 2 ) − µ2 = σ 2
P
Pn
− X̄)2
i=1 (Xi
On dénit la variance corrigée l'estimateur S 2 (X) = .
n−1
3.
n 2
S 2 (X) = s (X)
n−1
donc
n n n−1 2
E(S 2 (X)) = E(s2 (X)) = σ = σ2
n−1 n−1 n
n
4. Il sut de vérier que limn→+∞ = 1 et de conclure.
n−1
Exercice 0.3. Comparaison des estimateurs
Soient U1 , . . . , Un une suite de v.a. i.i.d. de loi continue uniforme sur [0, b] et soient les estimateurs de
b suivants
U1 + 2U2
b̂1 = 2U1 , b̂2 = 2 , b̂3 = (U1 )2 + (U2 )2 , b̂4 = 2Ū
3
b b2
Rappelons que E(U ) = et V(U ) = .
2 12
1.
E(b̂1 ) = 2E(U1 ) = b
U1 + 2U2
E(b̂2 ) = 2E( )=b
3
2b2
E(b̂3 ) = E((U1 )2 + (U2 )2 ) =
Pn 3
U i
E(b̂4 ) = 2E( i=1 ) = b
n
2.
b2
V(b̂1 ) = 4V(U1 ) =
3
U1 + 2U2 V(U1 ) + 4V(U2 ) 5b2
V(b̂2 ) = 4V( )=4 )=
Pn 3 Pn 9
2
27
U i V(U i ) b
V(b̂4 ) = 4V( i=1 ) = 4 i=1 2 =
n n 3n
b̂4 est le plus ecace pour n ⩾ 2.
2
Exercice 0.4. Méthode des moments
Soient X1 , X2 , . . . une suite de v.a. indépendantes de loi normale N (µ, σ 2 ).
Par la méthode des moments :
Pn
i=1 Xi
E(X) = µ , X̄ =
n
donc
Pn
i=1 Xi
µ̂ =
n
de plus
Pn 2
i=1 Xi
2
E(X ) = σ + µ2 2
, X¯2 =
n
donc
Pn 2
2 2 i=1 Xi
σ̂ + µ̂ =
n
d'où
Pn 2
2 i=1 Xi
σ̂ = − µ̂2
n
Pn 2 Pn 2 2
i=1 Xi i=1 Xi
= −
n n
Exercice 0.5. Méthode du maximum de vraisemblance
Soient X1 , X2 , . . . une suite de v.a. indépendantes suivant une loi normale N (µ, σ 2 ).
Pour une suite de réalisations a1 , a2 , . . ., on utilise l'indépendance pour dénir la fonction de vraisem-
blance :
L(µ, σ 2 ) = P (X1 = a1 , X2 = a2 , . . . , Xn = an ) = Πni=1 P(Xi = ai )
(ai − µ)2
n 1
= Πi=1 √ exp −
2πσ 2 2σ 2
En introduisant le log
n
(ai − µ)2
2
X 1
log(L(µ, σ )) = log √ exp −
2πσ 2 2σ 2
i=1
n
(ai − µ)2
X 1
= log √ + log exp −
2πσ 2 2σ 2
i=1
n
(ai − µ)2
X 1
= log √ + −
2πσ 2 2σ 2
i=1
n
(ai − µ)2
X
1
= n log √ −
2πσ 2 2σ 2
i=1
n
n X (ai − µ)2
= − log 2πσ 2 −
2 2σ 2
i=1
3
En appliquant la condition de premier ordre
n
X (ai − µ)
∂
log(L(µ, σ 2 )) = =0
∂µ σ2
i=1
n
X (ai − µ)2 X (ai − µ)2 n
∂ 2 n 2π n
log(L(µ, σ )) = − + = − + =0
∂σ 2 2 2πσ 2 2σ 4 2σ 2 2σ 4
i=1 i=1
On en déduit
n
X
(ai − µ) = 0
i=1
n
n X (ai − µ)2
− + =0
2 2σ 2
i=1
ou encore
n
X
nµ = ai
i=1
n
X (ai − µ)2 n
=
2σ 2 2
i=1
pour avoir nalement
Pn
i=1 ai
µ̂ =
n
n
X (ai − µ̂)2
σ̂ 2 =
n
i=1
Exercice 0.6. Estimation par intervalle de conance
Théorème 0.1. (Cochrane)
Soient X1 , . . . , Xn une suite de v.a. i.i.d. de loi normale N (µ, σ 2 ). Alors
Pn
(n − 1)S 2 i=1 (Xi − X̄)2
=
σ2 σ2
Pn
2 − X̄)2
i=1 (Xi
suit une loi de chi-deux à n−1 degré de liberté χ (n − 1), où S 2 (X) = est la variance
n−1
corrigée.
1. Donner une estimation par intervalle de conance de µ dans les deux situations suivantes et
conclure sur la possibilité de commercialisation du polymère :
(a) La distribution est une loi normale
σ σ 5 5
[X̄ − Z1− α2 √ , X̄ + Z1− α2 √ ] = [82.5 − 1.96 × , 82.5 + 1.96 × ] = [77.6, 87.4]
n n 2 2
4
(b) La distribution est une loi de Student de paramètre 4 − 1 = 3. On calcul S = 6.86 et on
trouve
S S 6.86 6.86
[X̄ − t3,1− α2 √ , X̄ + t3,1− α2 √ ] = [82.5 − 3.1824 × , 82.5 + 3.1824 × ] = [71.6, 93.4]
n n 2 2
2. La distribution est une loi de khi-deux de paramètre 4−1 = 3 d'après le théorème de Cochrane :
(n − 1)S 2
2 2
P χ3, α ⩽ ⩽ χ3,1− α = 1 − α
2 σ2 2
d'où
" #
(n − 1)S 2 (n − 1)S 2
3 × 47.06 3 × 47.06
, = , = [15.10, 653.61]
χ23,1− α χ23, α 9, 348 0, 216
2 2
Exercice 0.7. Intervalle de conance asymptotique
4
La proportion empirique des graines défectueuses est X̄ = = 0.1. Il sut de remarquer que
40
X̄ − p X̄ − p p(1 − p)
q = q
X̄(1−X̄) p(1−p) X̄(1 − X̄)
n n
et que X̄(1 − X̄) −→ p(1 − p) d'après la loi des grands nombres. On déduit l'intervalle de conance
P
asymptotique de p en appliquant la loi central limite,
" r r # " r r #
X̄(1 − X̄) X̄(1 − X̄) 0.1 × 0.9 0.1 × 0.9
X̄ − Z1− α2 , X̄ + Z1− α2 = 0.1 − 2.58 , 0.1 + 2.58
n n 40 40
= [−0.02, 0.22]