UNIVERSITE PARIS XII VAL DE MARNE
FACULTE DE SCIENCES ECONOMIQUES ET DE GESTION
Licence de Sciences Economiques et de Gestion
Licence d’Econométrie
Corrigé de l’examen d’Econométrie I
P. Blanchard
1ière session: janvier 2005
durée 3 heures
1 Question n◦1 (4 points)
b 6= δ. Or
1. Il faut montrer que E(δ)
µ ¶ µ X ¶
b 1 1 1
E(δ) = E y + =E yi +
N N N
µ X ¶
1 1
=E (δ + ui ) + avec H1
N N
· ¸
Nδ 1 X 1
=E + ui +
N N N
X µ ¶
1 1
= E(δ) + E(ui ) + E
N N
comme δ et N sont certains, et avec H2: E(ui ) = 0 ∀i
1 1
=δ+0+ =δ+ 6= δ car N > 0
N N
Donc, δb est un estimateur biaisé de δ. Le biais est égal à E(δ)−δ
b =
1
N
.
1
h i2
b = E δb − E(δ)
2. Sachant que V (δ) b
h i2 µ ¶2
b b 1 1
E δ − E(δ) = E y + − (δ + )
N N
µ X ¶
1 1 1 2
=E (δ + ui ) + − (δ + )
N N N
µ X ¶2
1 1 1
=E δ+ ui + −δ−
N N N
µ X ¶2
1 1 ³X ´2
=E ui = 2 E ui
N N
³X ´2 X XX
or ui = u2i + ui uj
i i6=j
à !
1 X XX
= 2E u2i + ui uj
N i i6=j
à !
1 X ¡ ¢ X X
= 2 E u2i + E (ui uj )
N i i6=j
1 ³X 2 ´
= 2 σ + 0 à cause de H5a et H5b
N
Nσ 2 b =σ
2
=> V (δ)
N2 N
3. Il faut montrer que
h i h i2
b = lim V (δ)
lim EQM (δ) b + lim biais(δ)
b
N→∞ N→∞ N→∞
· 2¸ · ¸2
σ 1
= lim + lim
N→∞ N N→∞ N
· 2¸ · ¸
σ 1
= lim + lim
N→∞ N N→∞ N 2
2
or σ 2 est une constante, donc σN et N12 tendent vers 0 quand N tend
vers l’infini. Donc lim EQM (δ) b = 0, l’estimateur δb est donc con-
N→∞
vergent en moyenne quadratique. Quand la taille de l’échantillon
augmente, j’ai de plus en plus de chances que δb soit proche de la
vraie valeur δ, car l’estimateur est asymtotiquement sans biais et
sa variance tend vers 0 quand N tend vers l’infini.
2
2 Question n◦2 (3 points)
On sait que
µh ³ ´ i ·³ ´t ¸¶
u0 ) = E x0 β − βb + u0 × β − βb x0 + u0
V (b t t
µ ³ ´³ ´t ³ ´ ³ ´t ¶
t b b t b t b t
= E x0 β − β β − β x0 + x0 β − β u0 + u0 β − β x0 + u0 u0
µ ³ ´³ ´t ¶ ³ ´
= E xt0 β − βb β − βb x0 + E xt0 β − βb ut0
(1,k)(k,1)(1,1)
³ ´t ¡ ¢
b
+ E u0 β − β x0 + E u0 ut0
(1,1)(1,k)(k,1)
³ ´ ³ ´t
or les termes E xt0 β − βb ut0 et E u0 β − βb x0 sont nuls. En
1,k 1,1 1,1 k,1
k,1 1,k
effet,
• On notera que
³ ´
xt0 b
β − β ut0 est de dimension (1,1)
(1,k) (1,1)
(k,1)
³ ´t
b
Idem pour u0 β − β x0 qui est sa transposée. Par suite si on
arrive à montrer que l’un est nul, l’autre le sera aussi.
• On ne peut pas directement prendre l’espérance car u0 et βb sont
b et
aléatoires et E(XY ) n’est égale à E(X)E(Y ) que si X(cad β)
Y (cad ut0 ) sont indépendants. Or on n’en sait rien.
³ ³ ´ ´
• Montrons que E xt0 β − βb ut0 = 0. On sait que β−βb = −(Xt X)−1 Xt u.
h ³ ´ i
Remplaçons β − βb par son expression dans E xt0 β − βb ut0 . On
a:
¡ £ ¤ ¢
= −E xt0 (Xt X)−1 Xt u ut0
£ ¤
= −E xt0 (Xt X)−1 Xt uut0
" #
= −xt0 (Xt X)−1 Xt E u ut0 à cause de H3
(1,k)(k,k)(k,n) (N,1)(1,1)
On voit que les dimensions sont compatibles et que le résultat est
bien de dimension (1,1).
3
• Que vaut E [uut0 ] ?. On voit que E [uut0 ] = E [u0 u] car u0 est un
scalaire.
u1 u0 u1
u2 u0 u2
E u0 × .. = E ..
. .
uN u0 uN
E(u0 u1 ) 0
E(u0 u2 ) 0
E [u0 u] = .. = ..
. .
E(u0 uN ) 0
compte tenu de H5b Cov(ui , uj ) = 0 ∀i 6= j car c’est aussi vrai
pour j = 0 et ∀i.
• Il nous reste donc
µ ³ ´³ ´t ¶ ¡ ¢
V (b b b
u0 ) = E x0 β − β β − β x0 + E u0 ut0
t
·³ ´³ ´t ¸
t b
= x0 E β − β β − β b x0 + σ 2 avec H5-a
·³ ´³ ´t ¸
or E β − βb β − βb b
= σ 2 (Xt X)−1 = V (β)
= xt0 σ 2 (Xt X)−1 x0 + σ 2
" #
u0 ) = σ 2
V (b 1 + xt0 (Xt X)−1 x0 . CQFD
(1,1 (1,1) (1,k)(k,k)(k,1)
3 Question n◦3 (7 points)
1. Comment s’interprètent économiquement βb3 et βb5 . -0.751 est l’estimation
de l’élasticité de la demande de cigarettes par rapport au prix. Soit,
si le prix des cigarettes augmente de 1%, j’estime que la consom-
mation de cigarettes diminuera de 0.751%. -0.0501 est l’estimation
de la semi-élasticité de la demande de cigarettes par rapport au
niveau d’éducation. Soit, si le niveau d’éducation augmente de 1
année, j’estime que la consommation de cigarettes diminuera de
0.0501×100 = 5, 01%.
2. Que pensez-vous du faible R2 obtenu ? Le R2 est de 0.0526. La
qualité de l’ajustement est mauvaise. Notre modèle explique 5.26%
de la variance du logaritme du nombre de cigarettes fumées par
jour. Néanmoins, on ne peut pas dire que notre modèle est mau-
vais. Ce faible R2 peut certes venir d’une mauvaise spécification du
4
modèle (oubli de variables importantes) mais aussi cela peut être
dû à des perturbations importantes ce qui peut expliquer la mau-
vaise qualité de l’ajustement (impact des campagnes anti-tabac...).
3. Testez au seuil de 5% l’hypothèse que le prix n’a pas d’effet sur
le nombre de cigarettes fumées. Comme β3 est l’élasticité de la
demande de cigarettes par rapport au prix, cela revient à tester,
au seuil de 5%,HO : β3 = 0. En effet,
∂ ln cigsi = β3 ∂ ln prixcigi
∂cigsi ∂prixcigi
= β3
cigsi prixcigi
Comme cigsi et prixcigi sont positifs, ∂cigsi ne sera nul que si
β3 = 0, quand prixcigi varie, cad quand ∂prixcigi 6= 0.
• HO : β3 = 0 vs HA : β3 6= 0
βb3 −β3
• bβb
σ
à TN−k
3
• Seuil de 5%
βb3 −0 0.751−0
• tc = bβb
σ
= 0.450
= 1.67
3
• t5%,807−5 ≈ t5%,∞ = 1.96 (je cherche à 2.5% dans la table
unilatérale)
• RA = [−1.96; 1.96] et RR = ]−∞; −1.96[ ∪ ]1.96; ∞[
• Il s’agit de tester l’hypothèse qu’une augmentation de 1% du
prix (concept d’élasticité) se traduise par une constance (aug-
mentation de 0%) de la consommation de cigarettes. Comme
le tc appartient à la RA, donc au seuil de 5%, je ne rejette pas
l’hypothèse que l”élasticité de la consommation de cigarettes
par rapport au prix soit nulle.
4. Testez au seuil de 1% l’hypothèse que β2 ≤ 1. Conclusion.
• HO : β2 ≤ 1 vs HA : β2 > 1
βb2 −β2
• bβb
σ
à TN−k
2
• Seuil de 1%
βb2 −1 0.880−1
• tc = bβb
σ
= 0.22
= −0.545
2
• t1%,∞ = 2.326 dans la table unilatérale (dans la table bi-
latérale, je cherche à 2%)
5
• RA = [−∞; 2.326] et RR = ]2.326; ∞[
• or le tc appartient à la RA, donc au seuil de 1%, je ne re-
jette pas l’hypothèse qu’une augmentation de 1% du revenu
se traduise par une augmentation de 1% ou de moins de 1% de
la consommation de cigarettes. Dit autrement, comme β2 est
une elasticité, je ne rejette pas l’hypothèse que l”élasticité-
revenu de la consommation de cigarettes soit inférieure ou
égale à 1.
5. Prévision:
\
ln cigsi = 1.5 + 0.88 × ln(10) − 0.751 × ln(5) − 0.0501 × 3
+ 0.004 × 23 = 2.26
NB: On le revenu est 10 car exprimé en milliers d’euros (10000 =
10 milliers d’euros). De plus,
p
b 1 + xt0 (Xt X)−1 x0
bub0 = σ
σ
√
bub0 = 0.1 × 1 + 0.5 = 0.122
σ
donc
bub0 ; yb0 + tN−k,λ × σ
y0 − tN−k,λ × σ
[b bub0 ]
[2.26 − 1.96 × 0.122; 2.26 + 1.96 × 0.122]
[2.02; 2.5]
Donc, l’intervalle est assez étroit, ma prévision semble précise.
6. Test d’homoscédasticité des perturbations. C’est un test de Breusch-
Pagan
• H0 : σi2 = σ 2 ∀i vs HA : σi2 = u b2i = δ1 + δ2 ln(revenui ) +
δ3 ln(prixcigi ) + δ4 educi + δ5 agei .
Or,
BPc = N × Ra2 = 807 × 0.04 = 32.28
• Or χ25%,5−1 = χ25%,4 = 9.488, donc BPc > χ25%,2 , donc au seuil
de 5%, je rejette l’hypothèse nulle, donc au seuil de 5%, je
rejette l’hypothèse que les perturbations soient homoscédas-
tiques. Les mco sont sans biais et mais non BLU. De plus,
et c’est le problème le plus sérieux, les écarts-type estimés
des coefficients estimés sont biaisés, donc les tests, les IDC et
les IDC de prévision sont peut-être faux. L’inférence statis-
tique déjà faite avec les m.c.o. peut être remise en cause. Il
6
faut estimer le modèle en utilisant une méthode qui permet
d’estimer correctement les écarts-type estimés des coefficients
estimés, c’est à dire il faut employer la méthode de White, les
mcp ou les MCQG.
7. Les MCQG
• La méthode des MCQG est biaisée mais convergente, or nous
avons 807 observations, donc la convergence de l’estimateur
des mcqg est vraisemblable si nous n’avons pas fait d’erreur
sur la forme de l’hétéroscédasticité.
• Les coefficients sont assez proches, c’est normal car les mco
sont sans biais et les mcqg sont asymptotiquement sans biais
(si on n’a pas fait d’erreur sur la forme de l’hétéroscédasticité).
• La différence principale vient du fait qu’avec les mcqg le co-
efficient de la variable prix est significatif alors qu’il ne l’était
pas avec les MCO.
• Il vaut mieux faire confiance aux estimations par les mcqg à
cause du résultat du test et du fait ques les coefficients estimés
par les mco et les mcqg sont proches et que, de plus, N est
grand.
4 Question n◦4 (6 points)
1. Donnez, au seuil de confiance de 99%, l’intervalle de confiance de
β3 . h i
IDC à 99% est βb3 + t1%,N−4 σbβc3 ; βb3 + t1%,N−4 σ
bβc3
soit comme t1%,21 = 2.831 à l’aide de la table unilatérale (à 0.005,
soit 0.5%). L’IDC à 99% est
= [−0.0320 − 2.831 × 0.01; −0.0320 + 2.831 × 0.01]
= [−0.06; −0.003]
L’intervalle de confiance est assez étroit, mais il ne contient que
des valeurs négatives, donc notre estimation de β3 est relativement
précise.
2. H0 : β2 = 0 vs HA : β2 6= 0. On va utiliser la colonne Prob, soit le
niveau de significativité marginale. Pour β2 , le nsm est de 0.0127.
Le niveau de significativité marginale est le niveau de significativité
du test à partir duquel on ne peut pas rejetter l’hypothèse nulle.
7
Fixons un seuil de significativité du test a priori, disons 5%. Je
compare le nsm au seuil fixé:
- si le nsm ≥ 5%, alors au seuil de 5%, je ne rejette pas l’hypothèse
nulle,
- si le nsm < 5%, alors au seuil de 5%, je rejette l’hypothèse nulle.
Comme mon seuil a priori est de 5%, nsm = 0.0127 < 5%, je
rejette H0. (NB: si j’avais choisi 1%, je n’aurais pas rejetter H0).
Rappel: nsm = 0.0127 s’interprète comme: si je souhaite ac-
cepter H0, je dois donner au moins 98.73% (1-0.0127) de chance
à l’hypothèse nulle d’être acceptée. Or si je fais mon test à 5%,
cela signifie que je souhaite donner 95% de chances à H0 d’être
acceptée. Or je constate que je devrais la favoriser plus (à 98.73
au moins). Donc on la rejettera au seuil de 5%.
Conclusion: Au seuil de 5%, je rejette l’hypothèse qu’un euro de
dépenses supplémentaires fait par le candidat A n’ait pas d’effet
sur le % de voix recueillies par le candidat A.
3. Testez au seuil de 5%
• H0 : β3 ≥ 1 vs HA : β3 < 1
βb3 −β3
• bβb
σ
à TN−k
3
• Seuil de 5%
βb3 −1 −0.032−0
• tc = bβb
σ
= 0.01
= −3.2
3
• t5%,21 = 1.721 table unilatérale à 5%(dans la table bilatérale,
je cherche à 10%)
• RA = [−1.721; ∞] et RR = ]−∞; −1.721[
• or le tc appartient à la RR, donc au seuil de 5%, je rejette
l’hypothèse qu’une augmentation des dépenses du candidat B
de 1 millier d’euros augmente le % des voix recueillies par le
candidat A de 1 point ou plus.
4. Sans utiliser l’information sur F-Statistic et Prob(F-statistic), testez
au seuil de 5% la significativité globale du modèle. On fait un test
de Fisher.
• H0 : β2 = β3 = β4 = 0 vs HA : H0 est fausse
R2 /(k−1) 0.569/3
• Fc = (1−R2 )/(N−k)
= (1−0.569)/21
= 9.241
• le F5% (3, 21) = 3.07
8
• cela implique que le F c > F5%
• Donc au seuil de 5%, je rejette H0, cad je rejette l’hypothèse
que mon modèle ne soit pas globalement significatif. Les
dépenses des candidats et le % de voix recueillies à l’élection
passée ont globalement un impact sur le pourcentage de voix
recueillies par le candidat A.
5. Testez au seuil de 5%
• H0 : β2 + β3 = 0 vs HA : β2 + β3 6= 0.
βb2 +βb3 −(β3 +β3 )
• bβb +βb
σ
à TN−k
2 3
• Seuil de 5%
βb2 +βb3 −0
• tc = bβb +βb
σ
2 3
bβb2 +βb3
• Or le problème vient du calcul de σ
\ \ \ \
V (βb2 + βb3 ) = V (βb2 ) + V (βb3 ) + 2Cov(βb2 , βb3 )
= 0.0002 + 0.0001 + 2 × (−0.00003)
= 0.000240
0.0349−0.032−0
• tc = √
0.00024
= 0.1872
• t5%,21 = 2.08 (table unilatérale à 2.5%)
• RA = [−2.08; 2.08] et RR = ]−∞; −2.08[ ∪ ]2.08; ∞[
• or le tc appartient à la RA, donc au seuil de 5%, je ne rejette
pas l’hypothèse que β2 + β3 = 0, c’est à dire que une augmen-
tation des dépenses du candidat A et B d’un même montant
laisse inchangé le % des voix recueillies par le candidat A. Les
dépenses des candidats se neutralisent.
6. Testez au seuil de 5% l’hypothèse que les perturbations soient au-
tocorrélées à l’ordre 1. On fait un test de Durbin-Watson.
• On teste l’hypothèse de non autocorrélation des perturba-
tions. Comme le DW = 1.96 est compris entre 0 et 2, (auto-
corrélation nulle/positive, car ρb ' 1 − DW
2
= 1 − 1.96
2
= 0.02),
on teste H0 : ρ = 0 vs HA : 0 < ρ < 1
• On lit dans la table pour k = 3 et T = 25, dl = 1.12 et
du = 1.66 au seuil de 5% (notez que k = nb de régresseurs
moins la constante).
9
• On forme la réglette suivante
|–––| |–––| |––––|
0___1.12 1.66 2
ρ>0 doute ρ=0
• Le DW appartient à la zone (du , 2), donc au seuil de 5%; je
ne rejette pas l’hypothèse que les perturbations ne soient pas
(positivement) autocorrelées. Il ne faut pas mettre en oeuvre
les MCQG (Prais-Winsten ou Cochrane-Orcutt). Les MCO
sont sans biais et BLU.
• Ceci est confirmé par le calcul de ρb ' 1− DW
2
= 1− 1.96
2
= 0.02.
Les résidus semblent faiblement positivement autocorrélés.
Ceci confirme le résultat du test.
10