0% ont trouvé ce document utile (0 vote)
252 vues28 pages

Cours Econometrie

Transféré par

mrabtisafee
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
252 vues28 pages

Cours Econometrie

Transféré par

mrabtisafee
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

COURS D’ECONOMETRIE

Essahbi ESSAADI, ESC TUNIS

March 14, 2024


Table des matières

I Utilité et définition de l’économétrie 1

II La régression simple 6

i
TABLE DES MATIÈRES ii

Objectifs du cours :

Ce cours a pour objectif de permettre à l’étudiant d’acquérir la maı̂trise d’un outil


de quantification des phénomènes économiques réels qu’il a étudiés tout au long de son
parcours du premier cycle. Afin de permettre à l’étudiant de comprendre les formules
économétriques utilisées, ce cours fait appel à l’outil de l’analyse statistique et de dé-
veloppement mathématique. Toutefois, nous essayons dans ce cours de nous concentrer
également sur l’aspect pratique à travers la proposition d’un ensemble de problèmes per-
mettant aux étudiants de confronter les modèles économiques aux données réelles. Ces
exercices permettent également de vérifier empiriquement la validité des relations pou-
vant exister entre les phénomènes économiques fournis par la théorie économique. Dès
lors nous cherchons à préparer l’étudiant à se servir de cet outil lors de la préparation de
son mémoire de fin d’études. Ce cours contient trois chapitres. Dans le premier chapitre
nous commençons par présenter la définition de l’économétrie ainsi que sa méthodologie.
Nous essayons également de présenter les différentes étapes de modélisation et d’estima-
tion MCO d’une régression simple. Nous terminons par montrer à l’étudiant l’utilité de
ce modèle dans le sens où il permet de nous fournir des prévisions que nous utilisons dans
la prise de décision. Dans le deuxième chapitre, nous généralisons la modélisation présen-
tée dans le chapitre précédent à travers une formalisation matricielle afin que l’étudiant
puisse faire le lien entre les deux chapitres. Cela lui permettra de déduire dans le cas
d’une régression multiple tous les tests de spécifications déjà vu dans le chapitre précé-
dent. Dans le troisième chapitre, nous commençons par évoquer à l’étudiant les problèmes
pratiques qui découlent de la confrontation du modèle avec les données réelles. Nous nous
focalisons sur deux principaux problèmes à savoir le problème de l’hétéroscédasticité et le
problème d’autocorrélation des erreurs. Nous présentons les principaux tests spécifiques à
ces problèmes ainsi que la méthode d’estimation généralisée dans les deux cas.
Chapitre I

Utilité et définition de l’économétrie

I Définition
L’économétrie est le principal outil d’analyse quantitative utilisé par les économistes et
gestionnaires dans divers domaines d’application, comme la macroéconomie, la finance ou
le marketing. Les méthodes de l’économétrie permettent de vérifier l’existence de certaines
relations entre des phénomènes économiques, et de mesurer concrètement ces relations,
sur la base d’observations de faits réels.
Dans son acception la plus restreinte, l’économétrie est un ensemble de techniques
utilisant la statistique mathématique qui vérifient la validité empirique des relations sup-
posées entre les phénomènes économiques et mesurent les paramètres de ces relations. Au
sens large, l’économétrie est l’art de construire et d’estimer des modèles empiriques adé-
quats par rapport aux caractéristiques de la réalité, et intelligibles au regard de la théorie
économique.

II Relations économiques
La réflexion que l’on peut mener sur une réalité économique quelconque conduit tou-
jours à établir des relations entre les phénomènes économiques concernés. Une réflexion
approfondie dans un domaine de science économique ou science de gestion est à la base
de toute analyse économétrique. En d’autres termes, la réalisation de travaux économé-

1
CHAPITRE I. UTILITÉ ET DÉFINITION DE L’ÉCONOMÉTRIE 2

triques suppose la connaissance préalable des disciplines économiques en jeu, puisqu’elles


suggèrent le type de relation à vérifier sur les données réelles observées.
— La consommation est fonction du revenu
— L’investissement privé dépend du taux d’intérêt

III Le rôle de l’économétrie


— Tester les théories économiques : bien que découlant de raisonnements rigoureux,
les théories reposent également sur des hypothèses plus ou moins vraisemblables et
donc discutables. D’où la coexistence de différentes théories parfois contradictoires.
L’économétrie doit donc permettre de trancher.
— Evaluer les paramètres d’intérêt dans les relations économiques : l’idée est aussi
d’avoir une fonction d’évaluation des paramètres.

— Example :
Le cas de la fonction de consommation du type Ci = α + βRi . Quand le revenu
varie, quel est l’impact sur la consommation ?

IV L’économétrie comme outil d’investigation


L’économétrie n’est pas seulement un système de validation, mais également un outil
d’analyse. Nous pouvons citer quelques domaines où l’économétrie apporte une aide à la
modélisation, à la réflexion théorique ou à l’action économique par :
— la mise en évidence de relations entre des variables économiques qui n’étaient pas
a priori évidentes ou pressenties.
— l’induction statistique ou l’inférence statistique consiste à inférer, à partir des carac-
téristiques d’un échantillon, les caractéristiques d’une population. Elle permet de
déterminer des intervalles de confiance pour des paramètres du modèle ou de tester
si un paramètre est significativement inférieur, supérieur ou simplement différent
d’une valeur fixée.
CHAPITRE I. UTILITÉ ET DÉFINITION DE L’ÉCONOMÉTRIE 3

— la simulation qui mesure l’impact de la modification de la valeur d’une variable sur


une autre.
— la prévision, par l’utilisation de modèles économétriques, qui est utilisée par les
pouvoirs publics ou l’entreprise afin d’anticiper et éventuellement de réagir à l’en-
vironnement économique.

V Les données
Les données sont au centre de la réflexion économétrique. En effet, ce sont elles qui
vont permettre de mesurer le phénomène étudié et ses déterminants. C’est la réalité que
le modèle économétrique cherche à représenter.

5.1 La nature des observations

— Les séries temporelles ou chronologiques correspondent à des observations répétées


de variables à intervalles temporels réguliers.
— Les coupes instantanées ou transversales correspondent à l’observation à un mo-
ment donné de différents individus.
— Enfin, les données de panel intègrent les deux dimensions individuelles et tempo-
relles et permettent le suivi des variables caractérisant des individus au cours du
temps. Les données sont double indicées en i pour les individus et en t pour les
dates.

VI La notion de modèle économétrique


Prenons le cas de deux variables : C la consommation et R le revenu. Et supposons
que l’on observe ces 2 informations pour N individus, notés génériquement i.

6.1 Les différents types de relations entre variables

— Relation fonctionnelle déterministe : La représentation graphique associée dans le


cas où la relation est linéaire
CHAPITRE I. UTILITÉ ET DÉFINITION DE L’ÉCONOMÉTRIE 4

— Relation fonctionnelle d’indépendance : La deuxième est l’absence de toute rela-


tion entre les deux variables. On parle alors d’indépendance.
— La corrélation linéaire : Le troisième type de relation se situe entre les deux. On
fait l’hypothèse d’une relation fonctionnelle, mais celle-ci n’est pas parfaitement
vérifiée pour chaque observation parce que la réalité économique est trop complexe
à appréhender.
Cette technique est utilisée lorsque les deux variables étudiées sont quantitative. Dans
la suite on suppose qu’on a les séries de valeurs suivantes : x(x1 , . . . , xn ) et y(y1 , . . . , yn )
pour chacune des deux variables. Alors, pour connaı̂tre le coefficient de corrélation liant
CHAPITRE I. UTILITÉ ET DÉFINITION DE L’ÉCONOMÉTRIE 5

ces deux variables, on applique la formule suivante :


n
X
(xi − x) · (yi − y)
cov(x, y)
rx,y = = s n i=1 s n
σx σy X X
2
(xi − x̄) · (yi − ȳ)2
i=1 i=1

— Si rx,y est proche de 1 ⇒ forte corrélation linéaire positive.


— Si rx,y est proche de 0 ⇒ absence de corrélation linéaire.
— Si rx,y est proche de -1 ⇒ forte corrélation linéaire négative.
Remark Il convient de noter qu’une corrélation linéaire nulle ne signifie pas l’absence
de corrélation non linéaire entre les deux variables. Autrement dit, l’absence de corrélation
linéaire n’implique pas l’indépendance
Test d’hypothèses pour un niveau de risque α
— Les hypothèses :

 H : r = 0 (absence de relation)
0 x,y
 H : r ̸= 0 (présence de la relation)
1 x,y

|rx,y |
— Statistique du test (t de Student) : t = q 2
1−rx,y
n−2
— Règle de décision :
1− α
— Si La plus-value > α (t∗ < tn−22 ) on accepte H0 (Absence de relation).
1− α
— Si La plus-value < α on rejette H0 (t∗ > tn−22 ) (présence de la relation).

Remarque : La plus-value c’est la probabilité que l’on rejette H0 à tort.


Chapitre II

La régression simple

I Introduction
L’économétrie signifie au sens littéral « mesure de l’économie ». Elle est alors une
technique quantitative qui s’intéresse à la mesure des relations entre des phénomènes
économiques dans le but de valider ou d’infirmer les modèles théoriques. Elle permet en
effet de quantifier avec plus ou moins de précision des relations importantes comme par
exemple les élasticités prix revenu.
Pour analyser un problème économique, les économètres procèdent par la méthodologie
suivante :
Exemple : la théorie keynésienne de la consommation

Etape 1 : présentation de la théorie et des hypothèses

Dans la théorie keynésienne, nous trouvons :


Une proposition fondamentale : La consommation et le revenu sont liés.
L’hypothèse : le taux de variation de la consommation correspondant à une unité (par
exemple un dinar) de variation de revenu, est supérieur à zéro mais inférieur à l’unité.
En d’autres termes selon Keynes l’hypothèse à tester est 0 < Pmc < 1 avec Pmc est la
propension marginale à consommer.

6
CHAPITRE II. LA RÉGRESSION SIMPLE 7

Etape 2 : spécification du modèle mathématique de la consommation

Le modèle mathématique le plus simple qui représente la relation linéaire entre consom-
mation (C) et revenu (R) est défini par :
C = β0 + β1 R avec 0 < β1 < 1
où β0 : l’ordonnée à l’origine qui représente la consommation incompressible ou auto-
nome.
β1 : le coefficient de la pente qui mesure la Pmc.
En économie, Ce modèle est appelé fonction de consommation. On dit que la consom-
mation est une variable dépendante ou expliquée ou endogène et le revenue est une variable
indépendante ou explicative ou exogène.

L’objet de l’économétrie consiste en fait à estimer les paramètres inconnus β0 et β1 du


modèle (1), ce qui nécessite :
- la spécification d’un modèle économétrique
- la disponibilité d’une source statistique relative à la consommation et au revenu
- l’application des outils statistiques comme la théorie des estimations et la théorie
des tests d’hypothèses

Etape 3 : Spécification du modèle économétrique de consommation

La relation entre C et R dans la fonction de consommation est dite exacte ou déter-


ministe. Ce modèle est d’intérêt limité pour l’économètre parce que les relations entre les
variables économiques ne sont pas généralement exactes. En effet, si nous représentons des
données relatives à la dépense de consommation et au revenu d’un échantillon de ménages
tunisiens, nous nous attendons à obtenir un nuage de points plutôt qu’une relation exacte
(la droite parfaite de l’équation ci-dessus). En effet, la consommation dépend d’autres fac-
teurs tels que la taille de la famille, la catégorie socio-professionnelle du chef de ménage...
Alors, pour tenir compte des relations imprécises entre les variables, l’approche économé-
trique présente la fonction de consommation sous une forme stochastique (aléatoire) en
ajoutant au modèle mathématique (déterministe) un terme d’erreur ou perturbation noté
εi :
CHAPITRE II. LA RÉGRESSION SIMPLE 8

Ci = β0 + β1 Ri + εi
où εi est une variable aléatoire possédant des propriétés probabilistes bien définies. Ce
terme d’erreur est censé inclure l’ensemble des variables non spécifiées explicitement dans
le modèle et qui pourront agir de façon significative sur le niveau de la consommation.

Etape 4 : Obtention des données

Nous distinguons dans ce cours deux types de données :


- Les séries chronologiques ou temporelles : il s’agit de variables observées dans le
temps à intervalles réguliers. Exemple : la consommation annuelle en Tunisie depuis 1995
jusqu’au 2003. Notons que les séries chronologiques qui exploitent la dimension temporelle,
sont utilisées davantage en Macroéconomie.
- Les séries en coupes instantanées : il s’agit de recueillir les données statistiques
pour un groupe d’individus au même instant. Exemple : la consommation des ménages en
Tunisie pour l’année 2003. L’analyse à partir d’une coupe instantanée permet d’expliquer
la variabilité inter-individuelle.

Etape 5 : Estimation des paramètres du modèle économétrique

Pour estimer les paramètres du modèle économétrique, nous utilisons plusieurs mé-
thodes comme par exemple la méthode des Moindres Carrés Ordinaires (MCO) et la
méthode du Maximum de Vraisemblance (MV).

Etape 6 : Test des hypothèses

La théorie de la consommation keynésienne suppose que la Pmc soit inférieure à l’unité.


Il faut se demander donc si l’estimation de la Pmc à partir d’un échantillon (exemple :
β1 = 0.74) est suffisamment inférieure à l’unité pour se convaincre qu’il ne s’agit pas d’un
heureux hasard. On a alors recours à la théorie des tests d’hypothèses.
CHAPITRE II. LA RÉGRESSION SIMPLE 9

Etape 7 : Prévision ou prédiction

Si le modèle choisi ne rejette pas la théorie ou l’hypothèse sous-jacente, les pouvoirs


publics ou les entreprises peuvent l’utiliser pour prévoir des valeurs futures de la variable
dépendante sur la base de la valeur future de la variable explicative. Donc l’utilisation
de modèles économétriques permet d’anticiper et de réagir à l’environnement économique
pour des fins de contrôle ou de politiques économiques.

II Le modèle et les hypothèses

2.1 Equation de la régression

Soit le modèle de régression simple dont l’équation linéaire est de la forme :


y i = β 0 + β 1 xi + εi avec i = 1, .., n
où yi : variable endogène.
xi : variable exogène.
β0 et β1 : les paramètres inconnus du modèle.
εi : le terme d’erreur non observable ( εi de la ième équation est relatif à l’individu i
).
n : le nombre d’individus observés (taille de l’échantillon)

2.2 Les hypothèses

Les estimateurs βb0 et βb1 dépendent des observations yi . Par conséquent, ils dépendent
des εi . Donc, il faut faire des hypothèses sur la distribution des εi :
H1 : E(εi ) = 0 pour tout i = 1, .., n.
L’espérance mathématique de l’erreur est nulle c-à-d on suppose qu’en moyenne le
modèle est bien spécifié ; en moyenne les variables omises du modèle ne présentent aucun
effet.
H2 : V (εi ) = E(ε2i ) = σε2 est une constante pour tout i = 1, .., n.
La variance de l’erreur est constante ; chaque erreur a la même variance . Cette hypo-
thèse entraı̂ne l’homogénéité au niveau de l’échantillon considéré.
CHAPITRE II. LA RÉGRESSION SIMPLE 10

H3 : cov(εi , εj ) = E(εi εj ) = 0 pour tout i ̸= j.


Les erreurs sont non corrélées ou indépendantes c-à-d l’erreur de l’individu i n’a pas
d’influence sur l’erreur des autres individus.
H4 : cov(xi , εi ) = 0 pour tout i = 1, .., n.
Les observations xi sont observées sans erreurs. La variable xi est alors une variable
statistique certaine (n’est pas aléatoire). Elle est donc indépendante du terme d’erreur
εi . Autrement dit, il n’existe aucune inférence entre les variables omises du modèle et la
variable explicative.

III Estimation des paramètres

3.1 Formulation des estimateurs

Nous voulons trouver les estimateurs βb0 et βb1 de la droite d’ajustement ybi = βb0 + βb1 xi
qui s’écarte le moins possible du nuage de points (yi , xi ). Pour ce faire, on doit adopter
une procédure d’estimation qui fournit des estimateurs sans biais et à variances minimales.
La méthode des MCO consiste ainsi à estimer les paramètres du modèle en minimisant le
risque de l’erreur. Plus formellement, cette méthode des MCO cherche les estimateurs βb0 et
βb1 qui minimisent les écarts au carré entre chaque observation et la droite d’ajustement.
Notons que pour chaque individus i l’écart entre l’observation yi et la droite d’ajustement
(b
yi = βb0 + βb1 xi ) est une estimation de l’erreur, appelée résidu et notée εbi .

La résolution analytique relative à cette méthode est la suivante :


(βb0 , βb1 ) = min ni=1 εb2i = min ni=1 (yi − βb0 − βb1 xi )2
P P
βb0 ,βb1 βb0 ,βb1

avec n : la taille de l’échantillon.


P 2
εbi : la somme des carrés des résidus.

Les conditions nécessaires de premier ordre sont :


Pn
∂ b2i
i=1 ε
P
= −2 (yi − βb0 − βb1 xi ) = 0
P∂ β0
b
n
∂ b2i
i=1 ε
P
∂ βb1
= −2 (yi − βb0 − βb1 xi )xi = 0
CHAPITRE II. LA RÉGRESSION SIMPLE 11

d’où les équations normales :


P
(yi − βb0 − βb1 xi ) = 0 (1)
P
(yi − βb0 − βb1 xi )xi = 0 (2)

P
de l’équation (1), nous déduisons que εb = 0 ⇒ εb = 0
En divisant (1) par n, nous obtenons : y = βb0 − βb1 x ⇔ βb0 = y − βb1 x
nous remarquons dès lors que la droite d’ajustement passe par le point moyen de
l’échantillon (x, y).
En remplaçant la dérnière expression de βb0 dans (2), nous obtenons :
P P
(yi − (y − βb1 x) − βb1 xi )xi = ((yi − y) − βb1 (xi − x))xi = 0

P P P P
⇒ βb1 = P (yi −y)xi = y x −N yx
P i 2i = P (yi −y)xi −x P(xi −x)
(xi −x)xi xi −N yx (xi −x)xi −x (xi −x)
P
puisque (xi − x) = 0
P
Pi −y)(xi −x)
(y mxy cov(x,y)
donc, βb1 = (xi −x)2
= mxx
= v(x)

3.2 Propriétés des estimateurs

Nous vérifions dans cette section que les estimateurs βb0 et βb1 sont des estimateurs sans
biais et convergents des paramètres β0 et β1 .

Etude du biais de l’estimateur βb1 D’un côté, nous avons yi = β0 + β1 xi + εi ⇒ y =


β0 + β1 x + ε
donc, yi − y = β1 (xi − x) + (εi − ε) (3)
P
D’un autre côté, nous avons βb1 = Pi −y)(xi −x)
(y
(4)
(xi −x)2

alors si nous substituons (3) dans (4), nous aurons :


2
P P P
(β1 (xi −x)+(ε i −ε))(xi −x) (xi −x)
P + (εi2−ε)(xi −x)
βb1 = P
(xi −x)2
= β1 (xi −x)
P P
i −x) εP (xi −x)
= β1 + Pε(xi (xi −x)
2 + (xi −x)2
P
or (xi − x) = 0.
P
Donc, βb1 = β1 + Pεi (xi −x) (5)
(xi −x)2
P
(xi −x)
Dès lors, E(βb1 ) = β1 + P(x i −x)
2 E(ϵi )
CHAPITRE II. LA RÉGRESSION SIMPLE 12

et puisque d’aprés H1 E(ϵi ) = 0, alors E(βb1 ) = β1 .


βb1 est ainsi un estimateur sans biais.

Convergence de l’estimateur βb1 D’après la relation (5), nous avons :


P P
V (βb1 ) = V (β1 + Pεi (xi −x) ) = V ( Pε(xi (x i −x)
2 )
(xi −x)2 i −x)

Nous posons ωi = P(xi −x) 2


(xi −x)

P 2
ωi V (εi ) = σε2 ωi2 puisque les εi sont indépendants
P P
alors, V (βb1 ) = V ( ωi εi ) =
d’après H3.
P 2 P  (xi −x) 2 P
(x −x)2 1
Or, ωi = = P i =
(xi −x)2 ( (xi −x)2 )2 (xi −x)2
P P

donc, V (βb1 ) = σβ21 = σε2 P(xi1−x)2 .


(xi − x)2 tend également vers l’infini. Dès lors
P
En effet, lorsque n tend vers l’infini,
V (βb1 ) tend vers 0.
Puisque βb1 est sans biais, alors c’est un estimateur convergent.

Etude du biais de l’estimateur βb0

On sait que βb0 = y − βb1 x et que y = β0 + β1 x + ε, alors


βb0 = β0 + β1 x + ε − βb1 x = β0 + (β1 − βb1 )x + ε (6)
Donc, E(βb0 ) = E(β0 + (β1 − βb1 )x + ε) = β0 + xE(β1 − βb1 ) + E(ε)
Cependant, nous venons de montrer dans la section précédente que E(βb1 ) = β1 et nous
savons que d’après H1 E(εi ) = 0 ⇒ E(ε) = 0,
alors E(βb0 ) = β0 . Ainsi βb0 est un estimateur sans biais.

Convergence de l’estimateur βb0

D’après la relation (6), nous avons :


V (βb0 ) = V (β0 + (β1 − βb1 )x + ε) = V (ε − βb1 x) = V (ε) + x2 V (βb1 ) − 2cov(ε, βb1 )
P P
or d’après (5) cov(ε, βb1 ) = cov(ε, β1 + ωi εi ) = cov(ε, ωi εi )
CHAPITRE II. LA RÉGRESSION SIMPLE 13

1
ωi cov(εi , εi ) = n1 σε2 ωi
P P
= n
P
P(xi −x) 2 P (xi −x)2 = 0 (en fait
P P P
et puisque ωi = (xi −x)
= (xi −x)
(xi − x) = 0)
alors cov(ε, βb1 ) = 0.
donc, V (βb0 ) = V (ε) + x2 V (βb1 )
 2

1 2
= σ
N ε
+ x2 σε2 P(xi1−x)2 = σε2 1
N
+ P x
(xi −x)2
= σβ20

1
(xi − x)2 tend également vers l’infini et
P
En effet, lorsque n tend vers l’infini n
tend
vers 0 . Dès lors V (βb0 ) tend vers 0.
Puisque βb0 est sans biais alors c’est un estimateur convergent.

Nous vérifions également que :


cov(βb0 , βb1 ) = cov(y − βb1 x, βb1 ) = cov(y, βb1 ) − xV (βb1 )
or cov(y, βb1 ) = cov(β0 + β1 x + ε, βb1 ) = cov(ε, βb1 ) = 0 (démontré ci-dessus)
alors cov(βb0 , βb1 ) = −xσε2 P(xi1−x)2 .

3.3 Estimation de la variance des erreurs σε2

Afin d’apprécier l’éfficacité des estimateurs βb0 et βb1 , il faut estimer tout d’abord leurs
variances respectives. Cependant, comme nous venons de voir dans la section précédente,
ces variances dépendent d’un paramètre inconnu à savoir la variance des erreurs σε2 . Un
estimateur sans biais de σε2 est fourni par :
εb2i
P
SCR
bε2 =
σ n−2
= n−2

avec SCR est la somme des carrés des résidus.

Les variances empiriques des estimateurs βb0 et βb1 sont obtenues tout simplement en
remplaçant la variance des erreurs σε2 par son estimateur sans biais σ
bε2 .
Nous aurons alors :
 2

2 2 1 P x
V (β0 ) = σ
b b bβb = σ
bε n + (xi −x)2
0

bε2 P(xi1−x)2 .
bβ2b = σ
Vb (βb1 ) = σ
1
CHAPITRE II. LA RÉGRESSION SIMPLE 14

3.4 Equation d’analyse de la variance et coefficient de détermination


P 
(yi −y)2
Dans cette section, nous allons vérifier que la variance totale des yi , soit n
,
est la somme de deux variances à savoir la variance des ybi (la partie de la variance totale
qui est expliquée par le modèle) et la variance des résidus εbi (la partie résiduelle de la
variance totale qui n’est pas expliquée par le modèle). Ceci nous permettera par la suite
de définir le coefficient de détermination qui permet de mesurer la qualité d’ajustement
du modèle.

(yi − y)2 .
P
En fait, la variabilité totale du modèle est représentée par : SCT =

yi − yb)2
P
Par aileurs, la variabilité expliquée est : SCE = (b

or d’après l’équation de la droite d’ajustement :


ybi = βb0 + βb1 xi ⇒ yb = βb0 + βb1 x = y
yi − yb)2 = (b yi − y)2 = (βb0 + βb1 xi − βb0 − βb1 x)2
P P P
Donc, SCE = (b
= (βb1 (xi − x))2 = βb12 (xi − x)2
P P

D’autre part, la variabilité résiduelle est déterminée comme suit :

Soit εbi = yi − ybi


or ybi = βb0 + βb1 xi
et βb0 = y − βb1 x ⇒ ybi = y − βb1 x + βb1 xi
alors εbi = yi − y + βb1 x − βb1 xi = yi − y − βb1 (xi − x).
Donc, εb2i = (yi − y)2 + βb12 (xi − x)2 − 2βb1 (xi − x)(yi − y)
Si nous passons à la somme, nous aurons :
P 2 P
εbi = (yi − y)2 + βb12 (xi − x)2 − 2βb1 (xi − x)(yi − y)
P P
SCR =
P
or (xi − x)(yi − y) = βb1 (xi − x)2 d’après βb1 = (yPi −y)(xi −x)
P P
(xi −x)2

alors SCR = (yi − y)2 + βb12 (xi − x)2 − 2βb12 (xi − x)2
P P P

= (yi − y)2 − βb12 (xi − x)2


P P

SCR = SCT − SCE


ou encore SCT = SCE +SCR d’où l’équation fondamentale d’analyse de la variance
ou l’ANOVA.
CHAPITRE II. LA RÉGRESSION SIMPLE 15

Cette équation permet de juger de la qualité d’ajustement du modèle. En effet, plus


la variabilité expliquée est proche de la variabilité totale, plus l’ajustement du nuage de
points par la droite de régression est meilleur.
On définit alors le coefficient de détermination comme :
SCE SCR
R2 = SCT
=1− SCT

et l’on a 0 ≤ R2 ≤ 1.
Donc, plus le pourcentage de la variance totale qui est expliquée par la régression est
grand, plus R2 est proche de l’unité et donc la qualité d’ajustement est meilleure :
- si par exemple R2 = 0, 9 alors 90% de la variabilité de la variable endogène sont
expliquées par le modèle. Cependant, il demeure que 10% de la variabilité totale qui sont
attribuées à d’autres facteurs que nous n’avons pas introduit dans le modèle.
- dans le cas extrême R2 = 1, le modèle représente un pouvoir explicatif absolu. En
fait, il s’agit dans ce cas d’un modèle déterministe.
- dans le cas où R2 tend vers 0, cela est dû à :
- une relation qui n’est pas forcément linéaire entre la variable endogène
et la variable exogène.
- il existe d’autres facteurs qui expliquent l’évolution de la variable
endogène outre la variable explicative du modèle. Pour y remidier, il faut inclure d’autres
variables explicatives en s’inspirant de la théorie économique.
Remarque : Dans le cadre du modèle simple, ce coefficient de détermination est égale
au carré du coefficient de corrélation linéaire entre la variable y et x. En effet :
βb2 (x −x)2 2
P
b P
(yi −y)(xi −x)
R2 = SCE i
= 1P(yi −y)
SCT 2 = β1 P (yi −y)2

puisque (xi − x)(yi − y) = βb1 (xi − x)2


P P

et remplaçons βb1 par son expression (4) dans R2 , alors :


2 2 cov(x,y)2
P P
(yi −y)(x
P i −x)2 P (yi −y)(x i −x)
R2 = (yi −y) (xi −x)2
= v(y)v(x)
= ρ2 (x, y).
CHAPITRE II. LA RÉGRESSION SIMPLE 16

IV Les tests de spécification

4.1 Hypotèse de normalité et intervalle de confiance

Dans cette section, nous allons introduire une nouvelle hypothèse sur la distribution
des termes d’erreurs εi à savoir la normalité des erreurs :
H5 : εi ⇝ N (0, σε )
En fait, cette hypothèse n’est pas indisponsable pour obtenir des estimateurs conver-
gents mais elle nous permet de construire des tests statistiques concernant la validité du
modèle estimé.

Puisque les estimateurs βb0 et βb1 sont en fonction des termes d’erreurs εi tels que :
P
βb0 = β0 + (β1 − βb1 )x + ε et βb1 = β1 + Pεi (xi −x)
(xi −x)2

alors l’hypothèse de normalité implique que :


βb0 ⇝ N (β0 , σβ2b ) et βb1 ⇝ N (β1 , σβ2b )
0 1

alors si on centre et on réduit, on aura :


βb0 − β0 βb1 − β1
σβb
⇝ N (0, 1) et σβb
⇝ N (0, 1)
0 1

En pratique σβ2b et σβ2b sont inconnues. Donc, on doit les remplacer par leurs estimateurs
0 1

respectives bβ2b
σ et bβ2b .
σ Il en résulte que :
0 1
b − β
β b − β
β
0 0 0 0
σb σb
βb0 − β0 β0 β0
σ
= σ = v ⇝ T (n − 2)
β0 b2
bb u
σ
bβb
0 u
σb u (n−2) βb0
β0
σ2
u
β
t
0
b
n−2

b − β
β b − β
β
1 1 1 1
σb σb
βb1 − β1 β1 β1
et σ
= σ = v ⇝ T (n − 2)
β1 b2
bb u
σ
bβb
1 u
σb u (n−2) βb1
β1
σ2
u
β
t
1
b
n−2

d’où les intervalles de confiance des pâramètres β0 et β1 :


h i h i
IC(β0 ) = βb0 ± t( α2 ) σ
bβb0 et IC(β1 ) = βb1 ± t( α2 ) σ
bβb1
où t( α2 ) est une valeur critique de la loi de Student à n − 2 degrés de liberté et à un
βb1 − β1
risque α tel que P (−t( α2 ) < σ
bβb
< t( α2 ) ) = 1 − α
1
CHAPITRE II. LA RÉGRESSION SIMPLE 17

L’hypothèse de normalité implique également que :


(n−2)bσε2
2
σε
= SCRσε2
⇝ χ2 (n − 2)
σε2 (n−2)b
σb (n−2)b
σb
et (n−2)b
σε2
= σ b β0 = σ b β1 ⇝ χ2 (n − 2)
0 β β 1

L’intervalle de confiance du paramètre σε2 est ainsi :


IC(σε2 ) = [ SCR
χ2
; SCR
χ2
] où χ21 et χ22 sont deux valeurs critiques de la loi de χ2 à n − 2
2 1
(n−2)bσε2
degrés de liberté et à un risque α tel que P (χ21 < σε2
< χ22 ) = 1 − α.

4.2 Tests statistiques sur les paramètres

D’une façon générale, les tests d’hypothèses bilatéraux simples où nous observons une
seule contrainte à tester sous H0 , sont réalisés de la manière suivante :

 H :β =β
0 i
(II.1)
 H : β ̸= β
1 i

Pour décider de l’acceptation ou le rejet de H0 , nous procédons comme suit :


βbi − β
si β ∈ IC(βi ) ou tc = σ
bβb
≤ t( α2 ) alors nous acceptons H0 .
i

βbi − β
si β ∈
/ IC(βi ) ou tc = σ
bβb
> t( α2 ) alors nous rejetons H0 .
i

Rq. 1 : Dans le cas particulier β = 0 , le test est appelé test de significativité statistique
individuelle. Il permet de tester la significativité d’une variable exogène dans l’explication
de la variable endogène du modèle.
Rq. 2 : si le test d’hypothèse est unilatéral à droite :

 H :β =β
0 i
(II.2)
 H :β >β
1 i

βbi − β
on rejette H0 si tc = σ
bβb
> t(α)
i 
 H :β =β
0 i βbi − β
et si le test est unilatéral à gauche : alors on rejette H0 si tc = σ
bβb
<
 H :β <β i
1 i
−t(α)

avec t(α) est une valeur critique de la loi de Student telle que :
CHAPITRE II. LA RÉGRESSION SIMPLE 18

P ( βiσb−b βi < t(α) ) = 1 − α.


b
βi

4.3 Tableau d’analyse de la variance (ANOVA)

Soit le tableau d’analyse de la variance pour un modèle de régression simple :


Sources de variabilité Sommes des carrés Degrés de liberté Carrés moyens
SCE
yi − y)2
P
Régression SCE = (b 1 1
SCR
SCR = εb2i
P
Résidu n−2 n−2

SCT = (yi − y)2


P
Total n−1

Rq : le degrès de libérté représente le nombre de valeurs libres et nécessaires restant


réelement aprés l’estimation.

V Prévision dans le modèle de régression simple

Soit le modèle de régression simple estimé sur une période t = 1, ..., T :


yt = βb0 + βb1 xt + εbt

si la valeur de la variable xt est connue à la date (T + 1), la prévision ponctuelle est


ainsi donnée par :
ybTp +1 = βb0 + βb1 xT +1

Cependant, la réalisation effective de yt à la date (T + 1) sera :


yT +1 = β0 + β1 xT +1 + εT +1

L’erreur de prévision est alors égale à :


eT +1 = yT +1 − ybTp +1
Elle est égale aussi à :
eT +1 = (β0 + β1 xT +1 + εT +1 ) − (βb0 + βb1 xT +1 )
= (β0 − βb0 ) + (β1 − βb1 )xT +1 + εT +1

On remarque ainsi que :


CHAPITRE II. LA RÉGRESSION SIMPLE 19

E(eT +1 ) = E((β0 − βb0 ) + (β1 − βb1 )xT +1 + εT +1 )


= E((β0 − βb0 )) + xT +1 E((β1 − βb1 )) + E(εT +1 )

or E((β0 − βb0 )) = E((β1 − βb1 )) = 0 car les deux estimateurs βb0 et βb1 sont sans biais.
et E(εT +1 ) = 0 d’aprés H1.

Donc E(eT +1 ) = 0 : La prévision sans biais est donc obtenue par l’application directe
du modèle estimé.

D’autre part :
V (eT +1 ) = V (β0 + β1 xT +1 + εT +1 − βb0 − βb1 xT +1 )
= V (εT +1 − βb0 − βb1 xT +1 )
= V (εT +1 ) + V (βb0 ) + x2T +1 V (βb1 ) − 2cov(εT +1 , βb0 ) − 2xT +1 cov(εT +1 , βb1 ) + 2xT +1 cov(βb0 , βb1 )
or nous avons :
P P
cov(εT +1 , βb1 ) = cov(εT +1 , β1 + ωi εi ) = ωi cov(εT +1 , εi )
sachant que cov(εT +1 , εt ) = 0 d’après H3
et cov(εT +1 , βb0 ) = cov(εT +1 , β0 + β1 x + ε − βb1 x) = cov(εT +1 , ε − βb1 x)
= cov(εT +1 , ε) − xcov(εT +1 , βb1 ) = 0
d’après le résultat précédent nous avons cov(εT +1 , βb1 ) = 0
et d’après l’hypothèse H3 nous avons cov(εT +1 , ε) = 0.
Donc, V (eT +1 ) = V (εT +1 ) + V (βb0 ) + x2T +1 V (βb1 ) + 2xT +1 cov(βb0 , βb1 )
 2

= σε2 + σε2 T1 + P(xxt −x)2 + x2T +1 σε2 P(xt1−x)2 − 2xT +1 xσε2 P(xt1−x)2
 
1 x 2 x2 2xT +1 x
2
= σε 1 + T + P(xt −x)2 + P(xt −x)2 − P(xt −x)2
T +1

2
 
2 1 (P
xT +1 −x)
= σε 1 + T + (xt −x)2
2
 
2 1 (xT +1 −x)
et Vb (eT +1 ) = σ
bε 1 + T + P(xt −x)2

Rq : Cette variance peut être réduite :


- en augmentant le nombre d’observation de l’échantillon T
2
-en choisissant une valeur de xT +1 tel que xT +1 − x ne soit pas trop grand.

Dès lors, l’intervalle de confiance (ou intervalle de prédiction ou de prévision) qui borne
cette prévision ponctuelle est construit comme suit :
CHAPITRE II. LA RÉGRESSION SIMPLE 20

Sous l’hypothèse de normalité


sdeserreurs H5, nous avons :
2
!
(x −x)
eT +1 = yT +1 − yTp +1 ⇝ N 0, σε2 1 + T1 + PT(x+1i −x)2

La statistique utilisée est alors :


y p −y
v  T +1 T +1  ⇝ Student(T − k − 1)
u 2
u
u 2 1 (x
σε 1+ T + P
T +1
−x)

tb 2
(xi −x)

Nous en déduisons
" ainsi s que :
 2
#
p 1 (P
xT +1 −x)
bε2 1 +
IC(yT +1 ) = yT +1 ± t( α2 ) σ T
+ (xi −x)2

Soit par exemple α = 5%, alors nous avons 95% de chance d’avoir une prévision qui
appartienne à cet intervalle de confiance.
Table des matières

I Utilité et définition de l’économétrie 1


I Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
II Relations économiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
III Le rôle de l’économétrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
IV L’économétrie comme outil d’investigation . . . . . . . . . . . . . . . . . . 2
V Les données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
5.1 La nature des observations . . . . . . . . . . . . . . . . . . . . . . . 3
VI La notion de modèle économétrique . . . . . . . . . . . . . . . . . . . . . . 3
6.1 Les différents types de relations entre variables . . . . . . . . . . . . 3

II La régression simple 6
I Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
II Le modèle et les hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1 Equation de la régression . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 Les hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
III Estimation des paramètres . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.1 Formulation des estimateurs . . . . . . . . . . . . . . . . . . . . . . 10
3.2 Propriétés des estimateurs . . . . . . . . . . . . . . . . . . . . . . . 11
3.3 Estimation de la variance des erreurs σε2 . . . . . . . . . . . . . . . 13

3.4 Equation d’analyse de la variance et coefficient de détermination . . 14


IV Les tests de spécification . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.1 Hypotèse de normalité et intervalle de confiance . . . . . . . . . . . 16

21
TABLE DES MATIÈRES 22

4.2 Tests statistiques sur les paramètres . . . . . . . . . . . . . . . . . . 17


4.3 Tableau d’analyse de la variance (ANOVA) . . . . . . . . . . . . . . 18
V Prévision dans le modèle de régression simple . . . . . . . . . . . . . . . . 18
TABLE DES MATIÈRES 23

Bibliographie :

1. Bourbonnais, R., (2000), « Économétrie : cours et


exercices corrigés », 5ème édition, Ed. DUNOD.

2. Ghazouani S. et Goaied M. (1993), « Econométrie :


cours et exercices corrigés », Tome 1, Ed. CLE.

3. Giraud R., et Chaix N., (1989), « Econométrie »,


Ed. PUF.

4. Greene, W. H. (2003), “Econometric Analysis”, 5ème


édition, Ed. Macmillan Publishing Company.

5. Johnston, J. et Dinardo J., (1997) “Econometric


Methods”, 4ème édition, Ed. McGraw Hill.
Table des figures

24
Liste des tableaux

25

Vous aimerez peut-être aussi