0% ont trouvé ce document utile (0 vote)
49 vues6 pages

Correction QCM Statistique L2 MASS 2014

Transféré par

Salif Ouedraogo
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
49 vues6 pages

Correction QCM Statistique L2 MASS 2014

Transféré par

Salif Ouedraogo
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Université de Nice Sophia-Antipolis Année Universitaire 2014/2015

L2 MASS Statistique

Correction détaillée du QCM 3

1. Rappel des résultats du cours


Définition 1. Soit θ un paramètre. On appelle estimateur de θ toute variable aléatoire θ̂n de la
forme
θ̂n = f (X1 , . . . , Xn )
où f est une fonction qui ne dépend pas de θ.
Définition 2. Soit θ ∈ Θ un paramètre et Lθ une loi de probabilité qui dépend de θ. On note X
une v.a. de loi Lθ et pour tout x ∈ R, p(θ, x) la quantité définie de la manière suivante :
— si Lθ est une loi discrète, alors p(θ, x) = Pθ (X = x) ;
— si Lθ est une loi à densité, alors p(θ, ·) est la densité de la variable X.
Soit X1 , . . . , Xn un échantillon. On appelle vraisemblance de l’échantillon X1 , . . . , Xn la fonction
définie par 
 Θ → R+
n

LX1 ,...,Xn : Y

 θ →
7 p(θ, Xi )
i=1
De plus, on appelle estimateur du maximum de vraisemblance de θ, la variable aléatoire θ̂n (quand
elle existe) qui maximise la vraisemblance.
Proposition 3.
— Soit X une v.a. positive. Si E [X] = 0 alors X = 0 presque sûrement.
— Plus généralement, soit X une v.a. Si Var(X) = 0 alors il existe une constante a telle que
X = a p.s.
Fait. On rappel ici (de manière informelle) un fait que l’on avait déjà noté dans la correction du
QCM 2.
Un intervalle de confiance de niveau α ≥ 0 est également un intervalle de confiance de niveau β
pour tout β ≥ α. En particulier, c’est un intervalle de confiance de niveau 2α.

2. Correction
La correction est divisée en trois sections qui correspondent aux deux exercices et au problème.
Les notations définies sur le sujet ne sont pas rappelées ici. Les résultats qui correspondent aux
bonnes réponses à cocher sont soulignés.
2.1. Exercice 1.
Correction 1. On utilise la formule du calcul de l’espérance d’une variable à densité. Ce qui donne
1−θ 0 1+θ 1
Z Z
Eθ [X1 ] = xdx + xdx.
2 −1 2 0
R0 R1
Or, −1 xdx = − 0 xdx = −1/2, donc
θ−1 1+θ
Eθ [X1 ] = + = θ/2.
4 4
1
Par définition on a également,
0 1
1−θ
Z Z
1+θ
Eθ X12 2
x2 dx.
 
= x dx +
2 −1 2 0
R0 R1
Or, −1 x2 dx = 0 x2 dx = 1/3, donc
  1−θ 1+θ
Eθ X12 = + = 1/3.
6 6
Attention, une des réponses proposées était Eθ X12 = 0. Cocher cette réponse constitue une erreur
 

grave. En effet, cela impliquerait que X1 = 0 p.s. (voir Proposition 3).


Correction 2. Avec l’égalité Eθ [X1 ] = θ/2, on est dans le cadre de la méthode des moments avec
f = id et g : x 7→ x/2. Or, la fonction g est inversible sur R et g −1 (x) = 2x. Ainsi, l’estimateur
donné par la méthode des moments est
n
1X
θ̂n = 2 × Xi = 2X̄n .
n
i=1

On ne peut rien déduire du moment d’ordre 2 (Eθ X12 = 1/3) car il ne dépend pas de θ.
 

Correction 3. On est dans le cas de loi à densité. Si on suit la définition 2, on a p(θ, x) = fθ (x)
pour tout θ ∈] − 1, 1[ et x ∈ R. En paraphrasant, on a le résultat suivant
1−θ


 si x ∈ [−1, 0[,
 2


p(θ, x) = 1 + θ
si x ∈]0, 1],
 2



0 sinon.
Qn
Ainsi, dans le produit LX1 ,...,Xn (θ) = i=1 p(θ, Xi ) il y a exactement S−1 (resp. S1 ) termes égaux
à (1 − θ)/2 (resp. (1 + θ)/2). Donc,
 n
1 − θ S−1 1 + θ S1 Y
  
LX1 ,...,Xn (θ) = 1[−1,0[∪]0,1] (Xi ).
2 2
i=1

De plus, on peut remarquer que



∀i, Xi ∈ [−1, 0[∪]0, 1] ⇔ S−1 + S1 = n
et donc
1 − θ S−1 1 + θ S1
   
LX1 ,...,Xn (θ) = 1{n} (S−1 + S1 ).
2 2
A noter qu’une des propositions correpondait à la log-vraisemblance. Il ne fallait pas la cocher ici.
Correction 4. On cherche en quelle valeur θ0 la fonction trouvée à la question précédente est
maximale. La partie de type indicatrice dans l’expression de la vraisemblance ne dépend pas du
paramètre θ, elle n’influe donc pas dans la recherche du maximum (contrairement à la question 13).
Ainsi, on peut supposer que les indicatrices valent 1 (en particulier, S−1 + S1 = n) et se limiter à
chercher un maximum de la fonction
1 − θ S−1 1 + θ S1
   
θ 7→ .
2 2
Pour ce faire, on va étudier le logarithme de cette fonction, i.e.
   
1−θ 1+θ
`X1 ,...,Xn (θ) = S−1 log + S1 log = S−1 log(1 − θ) + S1 log(1 + θ) + C,
2 2
2
où C = −(S−1 + S1 ) log(2) est une constante qui ne dépend pas de θ. La dérivée de ` par rapport
à θ est égale à
d`X1 ,...,Xn S1 S−1 (1 − θ)S1 − (1 + θ)S−1 S1 − S−1 − θ(S−1 + S1 )
(θ) = − = = .
dθ 1+θ 1−θ (1 + θ)(1 − θ) 1 − θ2
Comme θ ∈]0, 1[⇒ (1 − θ2 ) > 0, on a
d`X1 ,...,Xn S1 − S−1 S1 − S−1
(θ) ≥ 0 ⇔ θ ≤ = .
dθ S−1 + S1 n
S1 −S−1 S1 −S−1
Donc, θen = S−1 +S1 = n est l’estimateur du maximum de vraisemblance de θ. Les autres ré-
ponses proposées sont donc automatiquement fausses.
2.2. Exercice 2.
Correction 5. On utilise la formule du calcul de l’espérance d’une variable discrète. Ce qui donne
Eλ [X1 ] = (−1) × λ + 0 × (1 − 2λ) + 1 × λ= 0.
Par définition on a également,
Eλ X12 = (−1)2 × λ + 02 × (1 − 2λ) + 12 × λ= 2λ.
 

Attention, une des réponses proposées était Eλ X12 = 0. Cocher cette réponse constitue une erreur
 

grave. En effet, cela impliquerait que X1 = 0 p.s. (voir Proposition 3).


Correction 6. On nepeut
2
 rien déduire du moment d’ordre 1 (Eλ [X1 ] = 0) car il ne dépend pas2
de λ. Avec l’égalité Eλ X1 = 2λ, on est dans le cadre de la méthode des moments avec f : x 7→ x
et g : x 7→ 2x. Or, la fonction g est inversible sur R et g −1 (x) = x/2. Ainsi, l’estimateur donné par
la méthode des moments est
n
1 1X 2
λ̂n = × Xi .
2 n
i=1

Correction 7. On est dans le cas de loi discrète. Si on suit la définition 2, on a


λ si x = −1,



 1 − 2λ si x = 0,

p(λ, x) =

 λ si x = 1,

0 sinon.

Qn
Ainsi, dans le produit LX1 ,...,Xn (λ) = i=1 p(λ, Xi ) il y a exactement V−1 (resp. V0 et V1 ) termes
égaux à λ (resp. 1 − 2λ et λ). Donc,
n
Y
LX1 ,...,Xn (λ) = λV−1 (1 − 2λ)V0 λV1 1{−1,0,1} (Xi ).
i=1

De plus, on peut remarquer que



∀i, Xi = −1, 0 ou 1 ⇔ V−1 + V0 + V1 = n
et donc
LX1 ,...,Xn (λ) = λV−1 (1 − 2λ)V0 λV1 1{n} (V−1 + V0 + V1 ).
A noter qu’une des propositions correpondait à la log-vraisemblance. Il ne fallait pas la cocher ici.
3
Correction 8. On cherche en quelle valeur λ0 la fonction trouvée à la question précédente est
maximale. La partie de type indicatrice dans l’expression de la vraisemblance ne dépend pas du
paramètre λ, elle n’influe donc pas dans la recherche du maximum (contrairement à la question 13).
Ainsi, on peut supposer que les indicatrices valent 1 (en particulier, V−1 + V0 + V1 = n) et se limiter
à chercher un maximum de la fonction
λ 7→ λV−1 (1 − 2λ)V0 λV1 .
Pour ce faire, on va étudier le logarithme de cette fonction, i.e.
`X1 ,...,Xn (λ) = V−1 log (λ) + V0 log(1 − 2λ) + V1 log (λ) .
La dérivée de ` par rapport à λ est égale à
d`X1 ,...,Xn V−1 V0 V1 (V−1 + V1 )(1 − 2λ) − 2V0 λ V−1 + V1 − 2λ(V−1 + V0 + V1 )
(λ) = −2 + = = .
dλ λ 1 − 2λ λ λ(1 − 2λ) λ(1 − 2λ)
Comme λ ∈]0, 1/2[⇒ λ(1 − 2λ) > 0, on a
d`X1 ,...,Xn V−1 + V1 V−1 + V1
(λ) ≥ 0 ⇔ λ ≤ = .
dλ 2(V−1 + V1 + V0 ) 2n
V−1 +V1 V−1 +V1
Donc, λ
en =
2(V−1 +V1 +V0 ) = 2n est l’estimateur du maximum de vraisemblance de λ. Les autres
réponses proposées sont donc automatiquement fausses.
2.3. Problème.
Correction 9. On utilise la formule du calcul de l’espérance d’une variable à densité. Ce qui donne
1 ν 1 ν2 ν
Z
Eν [X1 ] = xdx = × = .
ν 0 ν 2 2
Par définition on a également,
ν
1 ν3 ν2
Z
1
Eν X12 x2 dx =
 
= × = .
ν 0 ν 3 3
Attention, une des réponses proposées était Eν X12 = 0. Cocher cette réponse constitue une erreur
 

grave. En effet, cela impliquerait que X1 = 0 p.s. (voir Proposition 3).


Correction 10. Avec l’égalité Eν [X1 ] = ν/2, on est dans le cadre de la méthode des moments avec
f = id et g : x 7→ x/2. Or, la fonction g est inversible sur R et g −1 (x) = 2x. Ainsi, l’estimateur
donné par la méthode des moments est
n
1X
ν̂n(1) = 2 × Xi = 2X̄n .
n
i=1

Avec l’égalité Eν X1 = ν 2 /3, on est dans le cadre de la méthode des moments avec f : x →
2 7 x2
 

et g : x 7→ x2 /3. Or, la fonction


√ g est inversible sur R∗+ (qui est exactement l’ensemble où vit le
−1
paramètre ν) et g (x) = 3x. Ainsi, l’estimateur donné par la méthode des moments est
v
u n
(2)
u 1X 2
ν̂n = 3 ×
t Xi .
n
i=1
h i
(1)   (1)
Correction 11. Tout d’abord, Eν ν̂n = Eν 2X̄n = 2Eν [X1 ] = ν, donc ν̂n est un estimateur
sans biais de ν.
4
h i hq P i
(2) 3 n 2 . On a
Ensuite, Eν ν̂n = Eν n X
i=1 i
v  v 2
u n " n # u n
u3 X 3 X 3 X
X2i − Eν t
u
Varν t X2i  = Eν X2i  > 0,
n n n
i=1 i=1 i=1

car Var(Y) = 0 ⇔ Y = constante presque sûrement. Cette inégalité peut être également vue
h comme
i
 3 Pn 2
  2
 2 (2)
l’inégalité de Cauchy-Schwartz. Or, Eν n i=1 Xi = 3Eν X1 = ν . Au final, on a Eν ν̂n < ν,
(2)
donc ν̂n est un estimateur biaisé de ν.
Ainsi, parmis les (deux) estimateurs trouvés à la question 10, il y a au moins un estimateur sans
biais. En revanche, ils ne sont pas tous sans biais.
Correction 12. On est dans le cas de loi à densité. Si on suit la définition 2, on a p(ν, x) = fν (x)
pour tout ν > 0 et x ∈ R. Donc,
n
1 Y
LX1 ,...,Xn (ν) = n 1[0,ν] (Xi ).
ν
i=1

Correction 13. On cherche en quelle valeur ν0 la fonction trouvée à la question précédente est
maximale. La partie de type indicatrice dans l’expression de la vraisemblance dépend du paramètre
ν. On doit en tenir compte dans la recherche du maximum. Pour tout i = 1, ..., n, on a 1[0,ν] (Xi ) = 1
ssi Xi ∈ [0, ν]. La borne inférieure, ici 0, ne dépend pas du paramètre ν, donc on peut supposer que
toutes les observations sont positives (≥ 0) sans perdre en généralité dans la recherche du maximum
de vraisemblance. En revanche, concernant la borne supérieure, ici ν, il faut voir que

 si ν < i=1,...,n
 max Xi alors LX1 ,...,Xn (ν) = 0,
(1) 1
 si ν ≥ max Xi alors LX1 ,...,Xn (ν) = n > 0.

i=1,...,n ν
La disjonction de cas présentée par l’équation (1) peut être également résumée de la manière sui-
vante :
1
LX1 ,...,Xn (ν) = n 1[maxi=1,...,n Xi ,+∞[ (ν).
ν
Ainsi, pour maximiser la vraisemblance, on peut se limiter aux réels ν ≥ maxi=1,...,n Xi . Il est aisé de
voir que sur [maxi=1,...,n Xi , +∞[, la fonction vraisemblance LX1 ,...,Xn est décroissante. Elle atteint
donc son maximum en ν0 = maxi=1,...,n Xi . Ainsi, νen = maxi=1,...,n Xi est l’estimateur du maximum
de vraisemblance de ν. Les autres réponses proposées sont donc automatiquement fausses.
Correction 14. Prenons t = − log(α) dans la relation (?). Cela donne
  
νen 
∀α ∈]0, 1[, Pν n 1 − > − log(α) ≤ α.
ν
Or,
 νen  νen log(α)
n 1− > − log(α) ⇔ <1+ ,
ν ν n
log(α)
et pour tout α > e−n , on a log(α) > −n et 1 + n > 0, et donc, si α > e−n alors
νen log(α) ν 1 νen
<1+ ⇔ > log(α)
⇔ν> .
ν n νen 1+ n 1 + log(α)
n
5
Ainsi, !
−n νen
∀α ∈]e , 1[, Pν ν> log(α)
≤ α,
1+ n
et comme ν est positif par hypothèse, on a
" "!
−n νen
∀α ∈]e , 1[, Pν ν ∈ 0, log(α)
≥ 1 − α.
1+ n
 
νen
Ainsi, 0, est un intervalle de confiance de niveau α pour ν. Comme on l’a vu au QCM 2
log(α)
1+ n
 
νen
par exemple, on en déduit aussi que 0, log(α) est un intervalle de confiance de niveau 2α pour ν.
1+ n
Les autres propositions étaient erronées.
Correction 15. On se rappelle que X̄n = n1 ni=1 Xi et que les Xi sont indépendantes et identi-
P

quement distribuées. Donc, pour étudier le comportement asymptotique de X̄n , on peut utiliser le
Théorème de la limite centrale qui nous dit que
√ X̄n − (ν/2) n→+∞
n √ −−−−−→ N (0, 1),
ν/2 3
car E [X1 ] = ν/2 et Var(X1 ) = ν 2 /12. Comme ν̂n est un estimateur consistant de ν, on a ν/ν̂n → 1
et le Lemme de Slutsky nous dit que
√ X̄n − (ν/2) √ X̄n − (ν/2) n→+∞
ν/ν̂n n √ = n √ −−−−−→ N (0, 1).
ν/2 3 ν̂n /2 3
Correction 16. Soit α ∈]0, 1[, on a
√ X̄n − (ν/2)
   
uα tα
Pν uα ≤ n √ ≤ tα = Pν √ ν̂n ≤ X̄n − (ν/2) ≤ √ ν̂n
ν̂n /2 3 2 3n 2 3n
 
tα uα
= Pν 2X̄n − √ ν̂n ≤ ν ≤ 2X̄n − √ ν̂n .
3n 3n
 √ X̄n −(ν/2)  n→∞
Or, Pν uα ≤ n ν̂ /√3 −−−→ P (uα ≤ N (0, 1) ≤ tα ) = 1 − α par la question précédente et
 n 
t u
(??). Donc, 2X̄n − √3n ν̂n , 2X̄n − √3n ν̂n est un I.C. asymptotique de niveau α pour ν. Comme
α α

 
t u
on l’a vu au QCM 2 par exemple, on en déduit aussi que 2X̄n − √3n ν̂n , 2X̄n − √3n ν̂n est un I.C.
α α

asymptotique de niveau 2α pour ν.


Toutes les propositions étaient en fait erronées.
En particulier, il y avait une proposition d’intervalle de confiance qui dépendait de ν. Cette
proposition était erronée par définition. En effet, un I.C. ne peut pas dépendre du paramètre que
l’on souhaite estimer.

Vous aimerez peut-être aussi