Econométrie - L3 - Formules
Modèle de régression linéaire SIMPLE / MULTIPLE
X Spécification du modèle : — propriétés à distance finie + propriétés asympto-
tiques
Yt = α + β1 X1t + β2 X2t + ... + βk Xkt + εt — matrice de variance covariance, V(β̂) ≡ Σβ̂ =
σε2 (X0 X)−1
y = |{z}
X β + |{z}
ε
|{z} |{z} — distribution, β̂ ∼ N (E(β̂), V(β̂))
(T,1) (T,k+1) (k+1,1) (T,1)
X Estimation par MCO : intuition, définition X Qualité d’ajustement et Analyse de la variance : R2 ,
R̄2 (définition, interprétation)
T
X
β = ArgMin
β̂ e2t ≡ ArgMin e0 e V(Ŷ ) V(e)
β t=1 β R2 = =1−
V(Y ) V(Y )
X Hypothèses MCO
T −1
R̄2 = 1 − (1 − R2 )
X Estimateurs MCO, β̂ : T −k−1
— définition X Estimateur sans biais, σ̂ε2 , de la variance des termes
β̂ = (X0 X)−1 X0 y d’erreur, σ̂ε2 .
Intervalle de confiance & Tests statistiques
X Intervalle de confiance sur βi X Etapes à suivre :
— Test d’hypothèses
IC(βi , 1 − p) = [β̂i ± t(T − k − 1)p/2 × sβ̂i ] — Niveau de risque
— Statistique de test
X Niveau de risque versus niveau de confiance — Décision & Conclusion
X Erreur de type I, Erreur de type II, Puissance du test
X Tests sur un coefficient
Test H0 H1 Décision
Rejet de H0 si
Two-tailed test β = β ∗ β 6= β ∗ |tstat | > |tp/2 (df )|
One-tailed test (upper) β = β ∗ β > β ∗ tstat > t1−p (df )
One-tailed test (lower) β = β ∗ β < β ∗ tstat < tp (df )
β ∗ est la valeur de β sous H0 , tp (df ) est le quantile d’ordre p d’une distribution de Student avec df degrés de liberté.
X Tests sur plusieurs coefficients — Cas B :
Test d’hypothèses
— Cas A : H0 : R β = r
(c,k+1)(k+1,1) (c,1)
Test d’hypothèses
avec
H0 : Restrictions linéaires c le nombre de restrictions
k + 1 le nombre de paramètres à estimer (constante
Statistique de test comprise)
(e0c ec − e0nc enc )/c
Fstat = ∼ F (c, T − k − 1) Statistique de test
e0nc enc /(T − k − 1)
avec (Rβ̂ − r)0 [σ̂ε2 R(X 0 X)−1 R0 ]−1 (Rβ̂ − r)
Fstat = ∼ F (c, T −k−1)
— e0c ec la somme des carrés des résidus du modèle c
contraint
— e0nc enc la somme des carrés des résidus du modèle Décision & Conclusion
non-contraint
— T est le nombre d’observations
— k est le nombre de variables explicatives dans le
modèle non-contraint
— c est le nombre de restrictions
Décision & Conclusion
1
— Cas spécifique : Test de significativité globale
Test d’hypothèses R2 /k
Fstat = ∼ F (k, T − k − 1)
Statistique de test (1 − R2 )/(T − k − 1)
Décision & Conclusion
Prévisions et Intervalles de confiance
X En supposant que la relation engendrant la variable ex- avec X (T +h) le vecteur contenant les valeurs des va-
pliquée reste identique et que les valeurs des variables riables explicatives à la date T + h et dont le premier
explicatives sont connues en T + h, on a : élément est 1 : X (T +h) = (1 X1,T +h X2,T +h ... Xk,T +h )
ŶT +h = α̂ + β̂1 X1,T +h + β̂2 X2,T +h + ... + β̂k Xk,T +h X Intervalle de confiance pour YT +h autour de la
prévision ŶT +h
X L’erreur de prévision :
IC(YT +h , 1 − p) = [ŶT +h ± t(T − k − 1)p/2 seT +h ]
eT +h = YT +h − ŶT +h = εT +h + X (T +h) (β − β̂)
Variables indicatrices / dummy
Tests de diagnostic
X Test de mauvaise spécification (hétéroscédasticité et autocorrélation dans les termes d’erreur)
— Sources de l’autocorrélation et de l’hétéroscédasticité
— Quelles sont les conséquences de la présence des erreurs autocorrélées et/ou hétéroscédastiques ?
— Comment détecter l’autocorrélation et l’hétéroscédasticité ?
1. Autocorrélation Statistique de test
— Test de Durbin-Watson
Test d’hypothèses max(σ̂ε21 , σ̂ε22 )
GQstat =
Statistique de test min(σ̂ε21 , σ̂ε22 )
Décision & Conclusion
avec σ̂ε2i la variance résiduelle de la période i
— Test de Breusch-Godfrey (optionnel)
Décision & Conclusion
2. Hétéroscédasticité
— Test de Goldfeld-Quandt — Test de Breusch-Pagan (optionnel)
Test d’hypothèses — Test de White (optionnel)
— Comment corriger de l’autocorrélation et de l’hétéroscédasticité ?
X Tests de stabilité structurelle (intuition)
— Test de Chow de la période
Test d’hypothèses — SSR1 la somme des carrés des résidus sur la
Statistique de test première période
— SSR2 la somme des carrés des résidus sur la
(SSR − (SSR1 + SSR2 ))/(k + 1) deuxième période
Fstat =
(SSR1 + SSR2 )/(T − 2(k + 1)) — T le nombre d’observations sur l’ensemble de la
avec période
— SSR la somme des carrés des résidus sur l’ensemble
Décision & Conclusion