0% ont trouvé ce document utile (0 vote)
518 vues5 pages

Corrige Examen

Ce document présente un exercice sur l'échantillonnage et l'estimation. L'exercice porte sur l'estimation du paramètre θ d'une loi binomiale à partir d'un échantillon. Le résumé détaille les étapes pour déterminer l'estimateur du maximum de vraisemblance de θ et sa convergence.

Transféré par

Najwa Elmfeddali
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
518 vues5 pages

Corrige Examen

Ce document présente un exercice sur l'échantillonnage et l'estimation. L'exercice porte sur l'estimation du paramètre θ d'une loi binomiale à partir d'un échantillon. Le résumé détaille les étapes pour déterminer l'estimateur du maximum de vraisemblance de θ et sa convergence.

Transféré par

Najwa Elmfeddali
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Examen d’Echantillonnage et Estimation

Semestre 3/ Session normale/ A.U : 2022-2023


Groupes de 5 à 8/ N. GUEHAIR & S. HABIBY
Exercice 1 : (12p)
On considère une variable aléatoire discrète X définie sur {0,1,2,3, ...,20} admettant pour
fonction de masse :
20!
f(𝑥 ; θ) = Pr (X = 𝑥) = (1 − θ)𝑥 θ20−𝑥
𝑥!(20−𝑥)!
(∀𝑥 ∈ {0,1,2,3, ...,20})
On admet que E(X) = 20 (1 − θ) et V(X) = 20 (1 − θ) θ
θ ∈]0,1[ un paramètre inconnu qu’on cherche à estimer à partir d’un n-échantillon (𝑋1,...,𝑋𝑛 )
i.i.d. de même loi que X, admettant pour réalisation (𝑥1 , 𝑥2 … , 𝑥𝑛 ).
1- Déterminer la log-vraisemblance 𝑙𝑛 (𝑥; θ) associée à une réalisation (𝑥1 ,…,𝑥𝑛 ) de
l’échantillon.
2- Montrer que l’estimateur du maximum de vraisemblance θ̂ du paramètre θ est défini
̅
X
par: θ̂ = 1 −20
On considère un échantillon de taille n = 55 pour lequel on observe les valeurs suivantes :
Valeur de X 0 1 2 3 4 5 6 7
Nombre
5 12 13 12 7 4 0 2
d'observations
3- Proposer une estimation ponctuelle du paramètre θ.
4- En utilisant la loi faible des grands nombres, montrer que l’EMV θ̂ est un estimateur
convergent du paramètre θ.
5- En utilisant la hessienne, trouver la quantité d’information de Fisher associée à
l’échantillon (𝑥1 , 𝑥2 … … 𝑥𝑛 ) et en déduire l’efficacité de l’EMV θ̂ .
6- Montrer que la moyenne empirique ̅ X vérifie :
̅
√n(X − 20(1 − θ)) ≅ N(0, 20 θ(1 − θ))
7- En déduire la distribution asymptotique de l’EMV θ̂ .
Exercice 2 : (8p)
La FIFA a mené une enquête auprès des supporters pour évaluer les matchs joués récemment
au Qatar 2022. Chaque match est noté sur une échelle allant de 0 (sans intérêt) à 100
(mémorable). Les notes des supporters pour un échantillon aléatoire de 10 matchs sont
indiquées ci-dessous.
57 ; 61 ; 86 ; 74 ; 72 ; 73 ; 20 ; 57 ; 80 ; 79
1-Donner une estimation ponctuelle de la note moyenne et de l’écart type attribués par les
supporters pour la population des matchs.
En supposant que la note suit une loi gauss au niveau de la population des matchs.
2- Donner un intervalle de confiance de 1% pour la moyenne de la population des matchs.
3- Déterminer l’intervalle de confiance de 1% pour l’écart type de la population des matchs.
4- La FIFA suppose que la note moyenne dans la population des matchs est égale à 61. Au
risque de 5 %, construire le test permettant de vérifier cette valeur supposée.

Page 1/2
Correction de l’examen/Semestre 3/ Session normale/ A.U : 2022-2023
Exo 1 : 12 points
1) la log-vraisemblance 𝑙𝑛 (𝑥; θ) associée à une réalisation (𝑥1 ,…,𝑥𝑛 ) de l’échantillon
L(𝑥 ; θ) ( ou L((𝑥1,…,𝑥𝑛 ; θ)) = ∏𝑛𝑖=1 𝑓(𝑥𝑖 ; 𝜃)
𝑛
20!
=∏ (1 − θ)𝑥𝑖 θ(20−𝑥𝑖 )
𝑥𝑖 ! (20 − 𝑥𝑖 )!
𝑖=1
(20 !)𝑛 ∑𝑛 𝑥 ∑𝑛
=∏𝑛 (1 − θ) 𝑖=1 𝑖 𝑖=1(20−𝑥𝑖 )
θ
𝑖=1 𝑥𝑖 !(20−𝑥𝑖 ) !
(20 !)𝑛 𝑛 𝑛
Log (L(𝑥 ; θ)) (ou 𝑙𝑛 (𝑥 ; θ)) = ln[∏𝑛 (1 − θ)∑𝑖=1 𝑥𝑖 θ∑𝑖=1(20−𝑥𝑖) ]
𝑖=1 𝑥𝑖 !(20−𝑥𝑖 ) !
(20 !)𝑛 𝑛 𝑛
= ln (∏𝑛 ) + 𝒍𝒏((1 − θ)∑𝑖=1 𝑥𝑖 ) + ln (θ∑𝑖=1(20−𝑥𝑖) )
𝑖=1 𝑖 !(20−𝑥𝑖 ) !
𝑥
𝒏 𝒏
𝒍𝒏 (𝒙 ; 𝛉) = n ln(𝟐𝟎 !) − ∑𝒊=𝟏 𝐥𝐧 ( 𝒙𝒊 !)- ∑𝒊=𝟏 𝐥𝐧 ( 𝟐𝟎 − 𝒙𝒊 ) ! + ∑𝒏𝒊=𝟏 𝒙𝒊 𝐥𝐧 (𝟏 − 𝛉) + ∑𝒏𝒊=𝟏(𝟐𝟎 − 𝒙𝒊 ) 𝐥𝐧 ( 𝛉)
(2 p)
2) Montrer que l’estimateur du maximum de vraisemblance θ̂ du paramètre θ est défini
̂ =1− ̅
par: O
X
20
̂ = 𝐴𝑟𝑔𝑚𝑎𝑥 𝜃 𝐿 (𝑥1 , 𝑥2 … … 𝑥𝑛 , 𝜃)
O
On a la log vraisemblance des données( 𝑥1 , 𝑥2 … … 𝑥n ) est :
𝑛 𝑛
𝑙𝑛 (𝑥 ; θ) = n ln(20 !) − ∑𝑖=1 ln ( 𝑥𝑖 !)- ∑𝑖=1 ln ( 20 − 𝑥𝑖 ) ! + ∑𝑛𝑖=1 𝑥𝑖 ln (1 − θ) + ∑𝑛𝑖=1(20 − 𝑥𝑖 ) ln ( θ)
▪ On détermine la valeur θ̂ qui annule la dérivée du log de vraisemblance( 𝑙𝑛 (𝑥 ; θ)
𝒅 [𝑙𝑛 (𝑥 ; θ)] 𝒅 [𝐥𝐧 (𝑳θ ( 𝒙𝟏 ,𝒙𝟐 ,……𝒙𝒏 ;θ)]
𝒅𝜽
= 𝟎 (𝒐𝒖 𝒅𝜽
= 𝟎)
1 1
= − ∑𝑛𝑖=1 𝑥𝑖 (1−θ̂) + ∑𝑛𝑖=1(20 − 𝑥𝑖 ) (θ̂) = 𝟎
̂ ∑𝒏 𝒙𝒊 +∑𝒏 (𝟐𝟎−𝒙𝒊 )(𝟏−θ
−θ ̂)
𝒊=𝟏
= 𝒊=𝟏
̂
(𝟏−θ)θ̂ =0
𝑛
= −θ̂ ∑𝑖=1 𝑥𝑖 + (20𝑛 − ∑𝑛𝑖=1 𝑥𝑖 )(1 − θ̂) = 0
𝑛
= −θ̂ ∑𝑖=1 𝑥𝑖 + (20𝑛 − 20𝑛θ̂ − ∑𝑛𝑖=1 𝑥𝑖 + θ̂ ∑𝑛𝑖=1 𝑥𝑖 ) = 0
𝒏 𝒏 ̅ 𝒏
̂=∑𝒊=𝟏 𝒙𝒊 −𝟐𝟎𝒏 = 𝟐𝟎𝒏−∑𝒊=𝟏 𝒙𝒊 = 𝟏 − 𝑿 ( 𝒂𝒗𝒆𝒄 𝑿
𝛉 ̅ = ∑𝒊=𝟏 𝒙𝒊 )
−𝟐𝟎𝒏 𝟐𝟎𝒏 𝟐𝟎 𝒏
▪ Dérivé seconde doit être négative (à vérifier)
1 1
𝒅 [𝒍𝒏 (𝒙 ; 𝛉)] 𝒅 [− ∑𝑛
𝑖=1 𝑥𝑖 (
𝑛
̂ )+∑𝑖=1(20−𝑥𝑖 )(θ
̂ )] 1 1 1
= 1−θ
=− ∑𝑛 𝑥 − 𝜃̂2 ∑𝑛𝑖=1(20 − 𝑥𝑖 ) = −[ ∑𝑛 𝑥 +
𝒅𝛉𝟐 𝒅θ̂ 𝟐 ̂)2 𝑖=1 𝑖
(1−θ ̂)2 𝑖=1 𝑖
(1−θ
1 𝑛

̂ 2 𝑖=1(20 −
𝜃
𝑥𝑖 )] < 0 ( puisque (𝑥𝑖 𝑠𝑜𝑛𝑡 𝑝𝑜𝑠𝑖𝑡𝑖𝑓𝑠 𝑒𝑡 θ ∈]0,1[)

3- Proposer une estimation ponctuelle du paramètre θ.


A partir les données de l’échantillon de taille n = 55, on a :
L’estimation ponctuelle du paramètre θ
𝑛
𝑥̅ ∑ 𝑛𝑥 (0×5+1×12+2×13+3×12+4×7+5×4×6×0+7×2)
𝑂̂(𝑥) = 1 − 20 avec 𝑥̅ = 𝑖=1𝑛 𝑖 𝑖 = 55
= 2,2909
2,2909
𝑂̂(𝑥) = 1 − 20 = 0,8854
4- En utilisant la loi faible des grands nombres, montrer que l’EMV θ̂ est un estimateur
convergent du paramètre θ
D’après la loi faible des grands nombres, quand la taille de l’échantillon est importante ( n → ∞), on a
θ̂ → θ ( θ̂ l’estimateur tend en probabilité vers la vraie valeur du paramètre θ)
̅
𝑿 𝑿̅ ̅̅̅̅
𝑬(𝑿)
Il faut que θ̂ soit sans biais ∶ E(θ̂) = 𝐸 (𝟏 − ) = 𝑬(𝟏) − 𝑬 ( ) = 𝟏 −
𝟐𝟎 𝟐𝟎 𝟐𝟎

Page 2/2
𝒏
∑𝒏
𝒊=𝟏 𝒙𝒊
∑𝒊=𝟏 𝑬(𝒙𝒊 )
̅̅̅̅ = 𝑬 (
Avec 𝑬(𝑿) )=
𝒏 𝒏
Sachant que (𝑋1 ,...,𝑋𝑛 ) i.i.d. de même loi que X admettant pour réalisation (𝑥1 , 𝑥2 … , 𝑥𝑛 ).
Donc E (𝑋1 ) = ⋯ … . 𝐸(𝑋i ) = 𝐸(𝑋)=20 (1 − θ
Donc E(X ̅)= E(X i ) = 20(1 − θ)
̅̅̅
E(X) 20(1− θ)
E (θ̂) = 1 − =1− = θ (donc θ̂ est sans biais)
20 20
Convergence :
̅
X ̅
X ̅
X ̅
X 1
Il faut également que lim V(θ̂) = lim V (1 − ) = lim V(1) + V( )= lim 0 + V( )= lim V( )= lim ̅)
V(X
n→∞ n→∞ 20 n→∞ 20 n→∞ 20 n→∞ 20 n→∞ 202
∑n x 1 n
Avec V(X ̅) = V ( i=1 i) = 2 ∑ V(xi )
n n i=1
Avec X i sont indépendantes de même loi que X , donc V(X1 ) = ⋯ … . V(X i ) = V(X) = 20 (1 − θ) θ
̅) = 1 V(X) = 20 (1−θ) θ
V(X 𝑛 n
1 1 20 (1−θ) θ
̂ ̅
Donc lim V (θ) = lim 202 V(X)]=lim 202 n
]=0
n→∞ n→∞ n→∞
Donc l’estimateur θ̂ converge, d’après la loi faible des grands nombres, en probabilité vers la vraie
valeur du paramètre inconnu θ lorsque la taille de l’échantillon est très grande.
5- En utilisant la hessienne, trouver la quantité d’information de Fisher associée à
l’échantillon (𝑥1 , 𝑥2 … … 𝑥𝑛 ) et en déduire l’efficacité de l’EMV θ̂
En utilisant la hessienne
𝑑 [ln (𝐿θ ( 𝑋1 ,……𝑋𝑛 ;θ)
I(θ, n)=E (- 𝑑θ2
)
1 1 1 𝑛 1
I(θ, n) =E ((1−θ)2 ∑𝑛𝑖=1 𝑥𝑖 + ∑𝑛𝑖=1(20 − 𝑥𝑖 ) =(1−θ)2 ∑𝑖=1 𝐸(𝑥𝑖 ) + 2 ∑𝑛𝑖=1 𝐸(20 − 𝑥𝑖 )
θ2 θ
Etant donné que (𝑋1 ,...,𝑋𝑛 ) i.i.d. de même loi que X admettant pour réalisation (𝑥1 , 𝑥2 … , 𝑥𝑛 ).
Donc E(𝑋1 ) = ⋯ … . 𝐸(𝑋i ) = 𝐸(𝑋)=20 (1 − θ)
𝑛 1 𝑛20 (1−θ) 20𝑛−𝑛20+20nθ 20𝑛 20𝑛θ 20𝑛 20𝑛
I(θ, n) =(1−θ)2 𝐸(𝑋) + (20𝑛 − 𝑛𝐸(𝑋) = + =(1−θ) + =(1−θ) +
θ2 (1−θ)2 θ2 θ2 θ
20𝑛θ+20n−20𝑛θ 20𝑛
= (1−θ)θ
= (1−θ)θ
̂
L’efficacité de l’EMV 𝛉
1 1 (1−θ) θ ̂ : on conclut donc l’efficacité de l’EMV 𝛉
̂.
On constate que I(θ,n) = 20𝑛 = 20𝑛
= 𝑉(𝜃)
(1−θ)θ
̅ vérifie :
6- Montrer que la moyenne empirique X
̅
√n(X − 20(1 − θ)) ≅ N(0, 20 θ(1 − θ))
̅
On veut déterminer ici la loi de la variable aléatoire X
On sait que E (X̅) = 𝐸(𝑋i ) = 20(1 − θ) et V (X ̅) = 20 (1−θ) θ
𝒏
Si n tend vers l’infini (n>30) on a :
̅−𝑬(𝐗
𝐗 ̅) ̅−𝟐𝟎(𝟏− 𝛉)
𝐗
̅)
= ≅ 𝑵(𝟎, 𝟏)
√𝑽(𝐗 √
𝟐𝟎 (𝟏−𝛉) 𝛉
𝒏

Donc √n( ̅
X − 20(1 − θ)) ≅ 𝑁(0, 20 (1 − θ) θ) ( ou ≅ 𝑁(0, √ 20 (1 − θ) θ) )
7- La distribution asymptotique de l’EMV θ̂
𝑋̅
̅
Puisque l’EMV θ̂=1 − 20 donc L’EMV a la même loi que X
(1−θ) θ
On sait que E(θ̂) = θ et V(θ̂)= 20𝑛
̂ est asymptotiquement normale
Quand n → ∞, la distribution de l’EMV 𝛉
̂ −𝑬(𝛉̂ )
𝛉 ̂ −𝛉
𝛉
Donc = ≅ 𝑵(𝟎, 𝟏)
√𝑽(𝛉̂ ) √
(𝟏−𝛉) 𝛉
𝟐𝟎𝒏

Page 3/2
Exo 2 : (8 points)
1- Une estimation ponctuelle de la note moyenne (µ) et de l’écart type (𝜎) attribués par les
supporters pour la population des matchs
Soit X la note attribuée aux matchs et X =LQ (µ, 𝜎), des paramètres inconnus à estimer à partir les
observations d’un échantillon aléatoire (𝑥1 ,…,𝑥𝑛 ) et 𝑋i sont supposées i.i.d. de même loi que X et n <
30.
Il faut utiliser des estimateurs ponctuels sans biais et convergent
∑𝑛
𝑖=1 𝑥𝑖 (57+61+86+74+72+20+57+80+79)
x̅ = = = 65,9 (c’est un estimateur ponctuel sans biais et
𝑛 10
convergent)
𝑛
∑𝑖=1(𝑥𝑖 −x̅)2 (57−65,9)2 +⋯+(79−65,9)2
𝑠𝑒2 = 𝑛
= 10
=321,69 (C’est un estimateur ponctuel biaisé et
asymptotiquement convergent)
𝑛 10
𝑠2= 𝑠𝑒2 = 321,69 = 357,4333
𝑛−1 10−1
Donc 𝑠 = √357,4333=18,9059 et 𝑠𝑒 = 17,9357
2- Donner un intervalle de confiance de 1% pour la moyenne de la population des matchs
(2 p)
On suppose que X = N (µ, 𝜎) ; σ est inconnu et n< 30
𝑆𝑒 𝑆𝑒
Donc : IC1-α = [𝑋̅−𝑡α;𝑛−1 ; ̅𝑋 + 𝑡α;𝑛−1 ]
√𝑛−1 √𝑛−1
Avec α =1% et 𝑡1%;9 = 2,821 ( 𝑣𝑜𝑖𝑟 𝑙𝑎 𝑡𝑎𝑏𝑙𝑒 𝑑𝑢 𝑠𝑡𝑢𝑑𝑒𝑛𝑡) et 𝑠𝑒 = 17,9357
17,9357 17,9357
IC99% = [65,9 − 2,821 ; 65,9 + 2,821 ] = [49,0344 ;82,7655]
√9 √9

OU
𝑆 𝑆
IC1-α = [𝑋̅−𝑡1-α;𝑛−1 𝑛 ; ̅𝑋 + 𝑡1-α;𝑛 𝑛]
2 √ 2 √

Avec α =1% et 𝑡0,995;10 = ( 𝑣𝑜𝑖𝑟 𝑙𝑎 𝑡𝑎𝑏𝑙𝑒 𝑑𝑢 𝑠𝑡𝑢𝑑𝑒𝑛𝑡) et 𝑠𝑒 = 17,9357

Il y a 99% de chances que la moyenne de la population des matchs soit entre 49,0344 et 82,7655
3- Déterminer l’intervalle de confiance de 1% pour l’écart type de la population des matchs
On a X=N (𝜇, 𝜎) et 𝜇 est inconnu
𝑛−1 𝑛−1
Donc IC1-α = [𝑠√𝑏 ; 𝑠√𝑎 ]
∝ ∝
,𝑛−1 1− ,𝑛−1
2 2

Avec α =1% et 𝑏∝ ,𝑛−1


𝑒𝑡 𝑎1− ∝,𝑛−1 sont des bornes à déterminer dans la table de la loi Khi-deux
2 2
𝑏∝ ,𝑛−1
= 𝑏0,005 ,9 = 23,59 et 𝑎1− ∝,𝑛−1 = 𝑎0,995,9 = 1,73 et S = 18,9059
2 2
9 9
Donc : IC99% = [18,9059 √23,59 ; 18,9059 √1,73] =[11,6776 ; 43,1216]
Il y a 99% de chances que l’écart type de la population des matchs soit entre 11,6776 et 43,1216.
4- La FIFA suppose que la note moyenne dans la population des matchs est égale à 61. Au
risque de 5 %, construire le test permettant de vérifier cette valeur supposée
❑ Les hypothèses :
H0 : µ = 61
H1 : µ ≠ 61

Page 4/2
❑ La variable de décision est 𝑋̅ l’estimateur ponctuel sans biais et convergent de µ
La distribution de X est normale, l’écart-type est inconnu et n< 30
𝑋̅−µ
Sous H0 : 𝑇 = 𝑠 suit la loi Student de n-1 degré de liberté
√𝑛
 La région critique au seuil de 5% :
La région critique est la solution de l’équation : p {rejeter H0 alors que H0 est vraie} = 0,05

On veut donc déterminer ℎ1 et ℎ2 , bornes de la région critique, telles que :


p(𝑋̅<ℎ1 et 𝑋̅ > ℎ2 ) = 0,05 ↔ p( ℎ1 < 𝑋̅<ℎ2 ) = 0,95
ℎ1 −61 ̅−µ0
𝑋 ℎ2 −61
p( 18,9059 < 𝑠 < 18,9059 ) = 0,95 (sous H0 )
√10 √𝑛 √10
p ( -t< 𝑇 <t) =0,95
t = 1,833 ( à lire dans la table de Student de 9 degré de liberté et α =5%)
𝑠 𝑠
La zone de non rejet sous H0 : P (µ0 -t 𝑛 <𝑋̅< µ0 + 𝑡 𝑛) =0,95
√ √
18,9059 18,9059
I95%={ x : 61 − 1,833 < 𝑋̅ < 61 + 1,833 ]
√10 √10
I95%={ x : 50,0412 < 𝑋̅ < 71,9587 ]
 La décision :
𝑥̅ (=61) ∈ [50,0412, 71,9587] : on ne rejette pas H0 (cette valeur 𝑥̅ n’appartient pas à la région critique
mais plutôt à la zone de région), on peut conclure la fiabilité de l’estimation du FIFA.

Page 5/2

Vous aimerez peut-être aussi