Cours Econometrie
Cours Econometrie
II La régression simple 6
i
TABLE DES MATIÈRES ii
Objectifs du cours :
I Définition
L’économétrie est le principal outil d’analyse quantitative utilisé par les économistes et
gestionnaires dans divers domaines d’application, comme la macroéconomie, la finance ou
le marketing. Les méthodes de l’économétrie permettent de vérifier l’existence de certaines
relations entre des phénomènes économiques, et de mesurer concrètement ces relations,
sur la base d’observations de faits réels.
Dans son acception la plus restreinte, l’économétrie est un ensemble de techniques
utilisant la statistique mathématique qui vérifient la validité empirique des relations sup-
posées entre les phénomènes économiques et mesurent les paramètres de ces relations. Au
sens large, l’économétrie est l’art de construire et d’estimer des modèles empiriques adé-
quats par rapport aux caractéristiques de la réalité, et intelligibles au regard de la théorie
économique.
II Relations économiques
La réflexion que l’on peut mener sur une réalité économique quelconque conduit tou-
jours à établir des relations entre les phénomènes économiques concernés. Une réflexion
approfondie dans un domaine de science économique ou science de gestion est à la base
de toute analyse économétrique. En d’autres termes, la réalisation de travaux économé-
1
CHAPITRE I. UTILITÉ ET DÉFINITION DE L’ÉCONOMÉTRIE 2
— Example :
Le cas de la fonction de consommation du type Ci = α + βRi . Quand le revenu
varie, quel est l’impact sur la consommation ?
V Les données
Les données sont au centre de la réflexion économétrique. En effet, ce sont elles qui
vont permettre de mesurer le phénomène étudié et ses déterminants. C’est la réalité que
le modèle économétrique cherche à représenter.
|rx,y |
— Statistique du test (t de Student) : t = q 2
1−rx,y
n−2
— Règle de décision :
1− α
— Si La plus-value > α (t∗ < tn−22 ) on accepte H0 (Absence de relation).
1− α
— Si La plus-value < α on rejette H0 (t∗ > tn−22 ) (présence de la relation).
La régression simple
I Introduction
L’économétrie signifie au sens littéral « mesure de l’économie ». Elle est alors une
technique quantitative qui s’intéresse à la mesure des relations entre des phénomènes
économiques dans le but de valider ou d’infirmer les modèles théoriques. Elle permet en
effet de quantifier avec plus ou moins de précision des relations importantes comme par
exemple les élasticités prix revenu.
Pour analyser un problème économique, les économètres procèdent par la méthodologie
suivante :
Exemple : la théorie keynésienne de la consommation
6
CHAPITRE II. LA RÉGRESSION SIMPLE 7
Le modèle mathématique le plus simple qui représente la relation linéaire entre consom-
mation (C) et revenu (R) est défini par :
C = β0 + β1 R avec 0 < β1 < 1
où β0 : l’ordonnée à l’origine qui représente la consommation incompressible ou auto-
nome.
β1 : le coefficient de la pente qui mesure la Pmc.
En économie, Ce modèle est appelé fonction de consommation. On dit que la consom-
mation est une variable dépendante ou expliquée ou endogène et le revenue est une variable
indépendante ou explicative ou exogène.
Ci = β0 + β1 Ri + εi
où εi est une variable aléatoire possédant des propriétés probabilistes bien définies. Ce
terme d’erreur est censé inclure l’ensemble des variables non spécifiées explicitement dans
le modèle et qui pourront agir de façon significative sur le niveau de la consommation.
Pour estimer les paramètres du modèle économétrique, nous utilisons plusieurs mé-
thodes comme par exemple la méthode des Moindres Carrés Ordinaires (MCO) et la
méthode du Maximum de Vraisemblance (MV).
Les estimateurs βb0 et βb1 dépendent des observations yi . Par conséquent, ils dépendent
des εi . Donc, il faut faire des hypothèses sur la distribution des εi :
H1 : E(εi ) = 0 pour tout i = 1, .., n.
L’espérance mathématique de l’erreur est nulle c-à-d on suppose qu’en moyenne le
modèle est bien spécifié ; en moyenne les variables omises du modèle ne présentent aucun
effet.
H2 : V (εi ) = E(ε2i ) = σε2 est une constante pour tout i = 1, .., n.
La variance de l’erreur est constante ; chaque erreur a la même variance . Cette hypo-
thèse entraı̂ne l’homogénéité au niveau de l’échantillon considéré.
CHAPITRE II. LA RÉGRESSION SIMPLE 10
Nous voulons trouver les estimateurs βb0 et βb1 de la droite d’ajustement ybi = βb0 + βb1 xi
qui s’écarte le moins possible du nuage de points (yi , xi ). Pour ce faire, on doit adopter
une procédure d’estimation qui fournit des estimateurs sans biais et à variances minimales.
La méthode des MCO consiste ainsi à estimer les paramètres du modèle en minimisant le
risque de l’erreur. Plus formellement, cette méthode des MCO cherche les estimateurs βb0 et
βb1 qui minimisent les écarts au carré entre chaque observation et la droite d’ajustement.
Notons que pour chaque individus i l’écart entre l’observation yi et la droite d’ajustement
(b
yi = βb0 + βb1 xi ) est une estimation de l’erreur, appelée résidu et notée εbi .
P
de l’équation (1), nous déduisons que εb = 0 ⇒ εb = 0
En divisant (1) par n, nous obtenons : y = βb0 − βb1 x ⇔ βb0 = y − βb1 x
nous remarquons dès lors que la droite d’ajustement passe par le point moyen de
l’échantillon (x, y).
En remplaçant la dérnière expression de βb0 dans (2), nous obtenons :
P P
(yi − (y − βb1 x) − βb1 xi )xi = ((yi − y) − βb1 (xi − x))xi = 0
P P P P
⇒ βb1 = P (yi −y)xi = y x −N yx
P i 2i = P (yi −y)xi −x P(xi −x)
(xi −x)xi xi −N yx (xi −x)xi −x (xi −x)
P
puisque (xi − x) = 0
P
Pi −y)(xi −x)
(y mxy cov(x,y)
donc, βb1 = (xi −x)2
= mxx
= v(x)
Nous vérifions dans cette section que les estimateurs βb0 et βb1 sont des estimateurs sans
biais et convergents des paramètres β0 et β1 .
P 2
ωi V (εi ) = σε2 ωi2 puisque les εi sont indépendants
P P
alors, V (βb1 ) = V ( ωi εi ) =
d’après H3.
P 2 P (xi −x) 2 P
(x −x)2 1
Or, ωi = = P i =
(xi −x)2 ( (xi −x)2 )2 (xi −x)2
P P
1
ωi cov(εi , εi ) = n1 σε2 ωi
P P
= n
P
P(xi −x) 2 P (xi −x)2 = 0 (en fait
P P P
et puisque ωi = (xi −x)
= (xi −x)
(xi − x) = 0)
alors cov(ε, βb1 ) = 0.
donc, V (βb0 ) = V (ε) + x2 V (βb1 )
2
1 2
= σ
N ε
+ x2 σε2 P(xi1−x)2 = σε2 1
N
+ P x
(xi −x)2
= σβ20
1
(xi − x)2 tend également vers l’infini et
P
En effet, lorsque n tend vers l’infini n
tend
vers 0 . Dès lors V (βb0 ) tend vers 0.
Puisque βb0 est sans biais alors c’est un estimateur convergent.
Afin d’apprécier l’éfficacité des estimateurs βb0 et βb1 , il faut estimer tout d’abord leurs
variances respectives. Cependant, comme nous venons de voir dans la section précédente,
ces variances dépendent d’un paramètre inconnu à savoir la variance des erreurs σε2 . Un
estimateur sans biais de σε2 est fourni par :
εb2i
P
SCR
bε2 =
σ n−2
= n−2
Les variances empiriques des estimateurs βb0 et βb1 sont obtenues tout simplement en
remplaçant la variance des erreurs σε2 par son estimateur sans biais σ
bε2 .
Nous aurons alors :
2
2 2 1 P x
V (β0 ) = σ
b b bβb = σ
bε n + (xi −x)2
0
bε2 P(xi1−x)2 .
bβ2b = σ
Vb (βb1 ) = σ
1
CHAPITRE II. LA RÉGRESSION SIMPLE 14
(yi − y)2 .
P
En fait, la variabilité totale du modèle est représentée par : SCT =
yi − yb)2
P
Par aileurs, la variabilité expliquée est : SCE = (b
alors SCR = (yi − y)2 + βb12 (xi − x)2 − 2βb12 (xi − x)2
P P P
et l’on a 0 ≤ R2 ≤ 1.
Donc, plus le pourcentage de la variance totale qui est expliquée par la régression est
grand, plus R2 est proche de l’unité et donc la qualité d’ajustement est meilleure :
- si par exemple R2 = 0, 9 alors 90% de la variabilité de la variable endogène sont
expliquées par le modèle. Cependant, il demeure que 10% de la variabilité totale qui sont
attribuées à d’autres facteurs que nous n’avons pas introduit dans le modèle.
- dans le cas extrême R2 = 1, le modèle représente un pouvoir explicatif absolu. En
fait, il s’agit dans ce cas d’un modèle déterministe.
- dans le cas où R2 tend vers 0, cela est dû à :
- une relation qui n’est pas forcément linéaire entre la variable endogène
et la variable exogène.
- il existe d’autres facteurs qui expliquent l’évolution de la variable
endogène outre la variable explicative du modèle. Pour y remidier, il faut inclure d’autres
variables explicatives en s’inspirant de la théorie économique.
Remarque : Dans le cadre du modèle simple, ce coefficient de détermination est égale
au carré du coefficient de corrélation linéaire entre la variable y et x. En effet :
βb2 (x −x)2 2
P
b P
(yi −y)(xi −x)
R2 = SCE i
= 1P(yi −y)
SCT 2 = β1 P (yi −y)2
Dans cette section, nous allons introduire une nouvelle hypothèse sur la distribution
des termes d’erreurs εi à savoir la normalité des erreurs :
H5 : εi ⇝ N (0, σε )
En fait, cette hypothèse n’est pas indisponsable pour obtenir des estimateurs conver-
gents mais elle nous permet de construire des tests statistiques concernant la validité du
modèle estimé.
Puisque les estimateurs βb0 et βb1 sont en fonction des termes d’erreurs εi tels que :
P
βb0 = β0 + (β1 − βb1 )x + ε et βb1 = β1 + Pεi (xi −x)
(xi −x)2
En pratique σβ2b et σβ2b sont inconnues. Donc, on doit les remplacer par leurs estimateurs
0 1
respectives bβ2b
σ et bβ2b .
σ Il en résulte que :
0 1
b − β
β b − β
β
0 0 0 0
σb σb
βb0 − β0 β0 β0
σ
= σ = v ⇝ T (n − 2)
β0 b2
bb u
σ
bβb
0 u
σb u (n−2) βb0
β0
σ2
u
β
t
0
b
n−2
b − β
β b − β
β
1 1 1 1
σb σb
βb1 − β1 β1 β1
et σ
= σ = v ⇝ T (n − 2)
β1 b2
bb u
σ
bβb
1 u
σb u (n−2) βb1
β1
σ2
u
β
t
1
b
n−2
D’une façon générale, les tests d’hypothèses bilatéraux simples où nous observons une
seule contrainte à tester sous H0 , sont réalisés de la manière suivante :
H :β =β
0 i
(II.1)
H : β ̸= β
1 i
βbi − β
si β ∈
/ IC(βi ) ou tc = σ
bβb
> t( α2 ) alors nous rejetons H0 .
i
Rq. 1 : Dans le cas particulier β = 0 , le test est appelé test de significativité statistique
individuelle. Il permet de tester la significativité d’une variable exogène dans l’explication
de la variable endogène du modèle.
Rq. 2 : si le test d’hypothèse est unilatéral à droite :
H :β =β
0 i
(II.2)
H :β >β
1 i
βbi − β
on rejette H0 si tc = σ
bβb
> t(α)
i
H :β =β
0 i βbi − β
et si le test est unilatéral à gauche : alors on rejette H0 si tc = σ
bβb
<
H :β <β i
1 i
−t(α)
avec t(α) est une valeur critique de la loi de Student telle que :
CHAPITRE II. LA RÉGRESSION SIMPLE 18
or E((β0 − βb0 )) = E((β1 − βb1 )) = 0 car les deux estimateurs βb0 et βb1 sont sans biais.
et E(εT +1 ) = 0 d’aprés H1.
Donc E(eT +1 ) = 0 : La prévision sans biais est donc obtenue par l’application directe
du modèle estimé.
D’autre part :
V (eT +1 ) = V (β0 + β1 xT +1 + εT +1 − βb0 − βb1 xT +1 )
= V (εT +1 − βb0 − βb1 xT +1 )
= V (εT +1 ) + V (βb0 ) + x2T +1 V (βb1 ) − 2cov(εT +1 , βb0 ) − 2xT +1 cov(εT +1 , βb1 ) + 2xT +1 cov(βb0 , βb1 )
or nous avons :
P P
cov(εT +1 , βb1 ) = cov(εT +1 , β1 + ωi εi ) = ωi cov(εT +1 , εi )
sachant que cov(εT +1 , εt ) = 0 d’après H3
et cov(εT +1 , βb0 ) = cov(εT +1 , β0 + β1 x + ε − βb1 x) = cov(εT +1 , ε − βb1 x)
= cov(εT +1 , ε) − xcov(εT +1 , βb1 ) = 0
d’après le résultat précédent nous avons cov(εT +1 , βb1 ) = 0
et d’après l’hypothèse H3 nous avons cov(εT +1 , ε) = 0.
Donc, V (eT +1 ) = V (εT +1 ) + V (βb0 ) + x2T +1 V (βb1 ) + 2xT +1 cov(βb0 , βb1 )
2
= σε2 + σε2 T1 + P(xxt −x)2 + x2T +1 σε2 P(xt1−x)2 − 2xT +1 xσε2 P(xt1−x)2
1 x 2 x2 2xT +1 x
2
= σε 1 + T + P(xt −x)2 + P(xt −x)2 − P(xt −x)2
T +1
2
2 1 (P
xT +1 −x)
= σε 1 + T + (xt −x)2
2
2 1 (xT +1 −x)
et Vb (eT +1 ) = σ
bε 1 + T + P(xt −x)2
Dès lors, l’intervalle de confiance (ou intervalle de prédiction ou de prévision) qui borne
cette prévision ponctuelle est construit comme suit :
CHAPITRE II. LA RÉGRESSION SIMPLE 20
Nous en déduisons
" ainsi s que :
2
#
p 1 (P
xT +1 −x)
bε2 1 +
IC(yT +1 ) = yT +1 ± t( α2 ) σ T
+ (xi −x)2
Soit par exemple α = 5%, alors nous avons 95% de chance d’avoir une prévision qui
appartienne à cet intervalle de confiance.
Table des matières
II La régression simple 6
I Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
II Le modèle et les hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1 Equation de la régression . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 Les hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
III Estimation des paramètres . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.1 Formulation des estimateurs . . . . . . . . . . . . . . . . . . . . . . 10
3.2 Propriétés des estimateurs . . . . . . . . . . . . . . . . . . . . . . . 11
3.3 Estimation de la variance des erreurs σε2 . . . . . . . . . . . . . . . 13
21
TABLE DES MATIÈRES 22
Bibliographie :
24
Liste des tableaux
25