Semestre 6
INTRODUCTION A L’ECONOMETRIE
Partie :1
Mr. Merraoui Moussa
Merraouieg@[Link]
+212 [Link].86
Début du cours 01/03/2020
Plan du cours
Chapitre 1 : concepts de base de l’économétrie
Chapitre 2 : Modèle de régression linéaire simple
Chapitre 3 : conséquence de la violation des hypothèses classiques du modèle de
régression linéaire et simple.
Chapitre1 : concepts de base de l’économétrie
A. Définition et rôle de l’économétrie
B. Modélisation économétrique
C. La nature des données pour l’analyse économétrique
D. Démarche de l’économétrie
A. Définition et rôle de l’économétrie
• Définition
Dans cette optique, l’économétrie peut être définie comme étant « la mesure en
économie ».
En effet l’économétrie est une discipline technique qui consiste à appliquer les
mathématiques, les statistiques aux données économiques au moyen des logiciels
informatiques spécialisés pour fournir une base empirique aux modèles construits par
l’économétrie et obtenir des résultats mesures.
• Rôle de l’économétrie
L’économétrie est un outil à la disposition de l’économiste qui lui permet d’infirmer ou
de confirmer les théories qu’il construit. Le théoricien postule des relations ;
l’application de méthodes économétriques fournit des estimations sur la valeur des
coefficients ainsi que la précision attendue.
Une question se pose alors : pourquoi estimer ces relations, et les tester statistiquement
? Plusieurs raisons incitent à cette démarche : tout d’abord cela force l’individu à
établir clairement et à estimer les interrelations sous-jacentes.
Ensuite, la confiance aveugle dans l’intuition peut mener à l’ignorance de liaisons
importantes ou à leur mauvaise utilisation. De plus, des relations marginales mais
néanmoins explicatives, qui ne sont qu’un élément d’un modèle global, doivent être
testées et validées afin de les mettre à leur véritable place.
Enfin, il est nécessaire de fournir, en même temps que l’estimation des relations, une
mesure de la confiance que l’économiste peut avoir en celles-ci, c’est-à-dire la
précision que l’on peut en attendre. Là encore, l’utilisation de méthodes purement
qualitatives exclut toute mesure quantitative de la fiabilité d’une relation.
B. Le modèle économétrique
• Définition
Dans le cadre de l’économétrie, nous pouvons considérer qu’un modèle consiste en une
présentation formalisée d’un phénomène sous forme d’équations dont les variables
sont des grandeurs économiques. L’objectif du modèle est de représenter les traits les
plus marquants d’une réalité qu’il cherche à styliser. Le modèle est donc l’outil que le
modélisateur utilise lorsqu’il cherche à comprendre et à expliquer des phénomènes.
Pour ce faire, il émet des hypothèses et explicite des relations.
Exemple d’une relation linéaire : prenons la consommation en fonction du revenu.
C = f(R) avec f’ >0 le modèle économétrique de la consommation peut être exprimé
mathématiquement par la forme suivante :
C = 𝜷𝟎 + 𝜷𝟏. R + 𝒖
• Variables du modèle économétrique
𝒀 = 𝜷𝟎 + 𝜷𝟏𝑿 (relation déterministe)
𝒀 = 𝜷𝟎 + 𝜷𝟏𝑿 + 𝒖 (relation stochastique)
𝒀 : Une variable à expliquer, dépendante, endogène, out put, non contrôlable.
𝑿 : Une variable explicative, indépendante, exogène, in put, contrôlable
𝜷𝟎 : L’ordonné à l’origine, la constante du modèle
𝜷𝟏 : La pente, le coefficient directeur
𝒖 : L’erreur de spécification, le terme aléatoire, perturbation stochastique
C. La nature des données pour l’analyse économétrique
Nous distinguons plusieurs types de données selon que le modèle est spécifié en :
– série temporelle : c’est le cas le plus fréquent en économétrie, il s’agit de variables
observées à intervalles de temps réguliers (la consommation annuelle, totale Maroc,
exprimée en dirhams sur 20 ans…) ;
– coupe instantanée : les données sont observées au même instant et concernent les
valeurs prises par la variable pour un groupe d’individus1 spécifiques (consommation
observée des agriculteurs pour une année donnée) ;
– panel : la variable représente les valeurs prises par un échantillon d’individus à
intervalles réguliers (la consommation d’un échantillon de ménages de la région
parisienne sur 20 ans) ;
– cohorte : très proches des données de panel, les données de cohorte se distinguent
de la précédente par la constance de l’échantillon, les individus sondés sont les mêmes
d’une période sur l’autre.
D. Démarche de l’économétrie
Attention :
Seule la théorie (économique, …) doit nous guider pour la spécification du modèle,
les données ne doivent servir qu’à valider ou invalider les hypothèses que l ’on
émet…
Il est donc nécessaire de bien comprendre les hypothèses sous-jacentes à chacune
des fonctions proposées.
Chapitre 2 : Modèle de régression linéaire simple -MRLS-
A. Définition du MRLS
B. Spécification du modèle de régression linéaire simple
C. Estimation du modèle de RLS par la méthode des moindres carrés ordinaires -
MCO-
D. Propriétés de la droite de régression
E. Hypothèses classiques du modèle RLS
F. Propriétés statistiques des estimations des MCO
G. Estimation de la variance du terme aléatoire
H. Dépendance des estimateurs entre eux
I. L’inférence statistique
J. Analyse de la variance et le test F-fisher sur 𝑹²
K. Prévision par le modèle de RLS
A. Définition du MRLS
• Régression : Etude de la dépendance d’une variable exogène par apport
à une ou plusieurs variables exogènes, en vue de prédire l’endogène en
fonction d’une des variable(s) exogène(s).
• Régression linéaire : Etude de la dépendance linéaire entre l’endogène
et l’exogène.
• Simple : le modèle ne contient que deux variables : une endogène et
l’autre exogène.
Récap : le modèle de régression linéaire simple est un modèle qui permet de confirmer
ou d’infirmer la dépendance linéaire entre une variable endogène et une seule
variable exogène en vue d’expliquer la façon par laquelle sont générées les valeurs
observées de Y et de prédire(prévoir) la même variable sur la base des valeurs fixes
de X.
B. Spécification du modèle de régression linéaire simple
A partir de la théorie économique, l’économètre construit le modèle économétrique
en fonction du choix des variables économiques pertinentes et de type de relation
entre l’endogène et l’exogène.
❖ Exemple introductif
• Vocabulaire
- Yi : la variable consommation est appelée « variable à expliquer » ou «
variable endogène ».
- Xi : la variable revenue est appelée « variable explicative » ou « variable
exogène » (c’est le revenu qui explique la consommation).
- 𝜷𝟎 et 𝜷1 sont les paramètres du modèle ou encore les coefficients de
régression.
• Spécification
Les modèles en coupe instantanée, les variables représentent des phénomènes
observés au même instant mais concernant plusieurs individus, par exemple la
consommation et le revenu observés sur un échantillon de 20 pays. Le modèle s’écrit
alors :
Yi = 𝜷𝟎 + 𝜷1 Xi avec i = 1, ... ,20
Où :
Yi = consommation du pays i pour une année donnée,
Xi = revenu du pays i pour une année donnée.
❖ Rôle du terme aléatoire
Le modèle tel qu’il vient d’être spécifié n’est qu’une caricature de la réalité.
En effet ne retenir que le revenu pour expliquer la consommation est à l’évidence
même insuffisant ; il existe une multitude d’autres facteurs susceptibles d’expliquer la
consommation. C’est pourquoi nous ajoutons un terme (𝒖i) qui synthétise l’ensemble
de ces informations non explicitées dans le modèle : Yi = 𝜷𝟎 + 𝜷1 Xi + 𝒖i par ce
que le modèle est spécifié en coupe instantanée), où 𝒖i représente l’erreur de
spécification du modèle, c’est-à-dire l’ensemble des phénomènes explicatifs de la
consommation non liés au revenu.
Le terme 𝒖i regroupe donc trois erreurs :
– une erreur de spécification, c’est-à-dire le fait que la seule variable explicative
n’est pas suffisante pour rendre compte de la totalité du phénomène expliqué ;
– une erreur de mesure, les données ne représentent pas exactement le phénomène
– une erreur de fluctuation d’échantillonnage, d’un échantillon à l’autre les
observations, et donc les estimations, sont légèrement différentes. la partie spécifiée pour
l'examen est terminée
C. Estimation du modèle du régression linéaire simple par la méthode des
moindres carrés ordinaires.
Dans la réalité on ne trouve jamais un nuage de point ajustable directement et
parfaitement par une droite linéaire. Ceci s’explique par les erreurs de mesure sur les
variables, la nature de l’évolution des variables, l’erreur de l’échantillon, le hasard et
l’omission des variables.
Toutefois, on peut ajuster ce nuage de point par une droite par projection de
l’ensemble des points Mi (Xi ; Yi) sur l’axe des ordonnées, de telle sorte à ce que
l’ensemble des écarts entre les points observés Mi et les points projetés Pi de
coordonnés (𝑋𝑖 ; Ŷ) soit le plus faible possible.
Soient le modèle initial : Yi = 𝜷𝟎 + 𝜷1 Xi + 𝒖i Modèle dans la population
̂0 + 𝜷
Le modèle estimé que l’on cherche est : Yi = 𝜷 ̂ 1Xi + 𝐮
̂i Modèle dans l’échantillon
Les écarts d’estimation 𝐮 ̂ i = Yi – Ŷi
̂ i sont tels que : 𝐮
Le critère des moindres carrés consiste à minimiser : ∑𝐧 ̂ 𝐢2
𝐢=1 𝐮
Relation linéaire
positive vers le haut.
On constate alors,
une augmentation
(une diminution ou
constante) stimulée
des valeurs des deux
variables
La relation linéaire au niveau du graphique ci-dessous sera négative et donc lorsque
les valeurs de l’une augmentent, les valeurs de l’autre diminuent.
NB : la meilleure droite c’est la droite qui minimise ∑𝒏 ̂ 𝒊2
𝒊=1 𝒖
• Estimation des coefficients 𝜷𝟎 et 𝜷1
Rappel mathématique : une fonction f(x) définie sur I= ⦋ a ; b ⦌ admet un minimum sur
I si :
f’(x)=0 condition nécessaire
f’(x)>0 condition nécessaire
Donc pour minimiser ∑𝒏𝒊=1 𝒖
̂ 𝒊2 on va appliquer les règles mathématiques de l’existence
d’un minimum.
̂ 𝒊2 = Min ⦋∑𝒏𝒊=1(𝑌𝑖 −Ŷi)2 ⦌ = Min∑𝒏𝒊=1(𝑌𝑖 − 𝛽̂ 0 + 𝛽̂ 1X)2
Posons 𝛅 = Min∑𝒏𝒊=1 𝒖
Maintenant on applique les conditions d’existence d’un minimum à la fonction 𝛅 telle
que :
Les inconnus de la fonction sont 𝛽̂ 0 et 𝛽̂ 1
𝝏𝒚 𝝏⦋( 𝐘𝐢−𝜷 ̂ 𝟏𝐗)𝟐 ⦌
̂𝟎 + 𝜷
=𝟎 ⇔ ̂ + 𝜷̂1Xi) =0
= −𝟐 ∑𝒏𝒊=𝟏(𝒀𝒊 − 𝜷 0
̂𝟎
𝝏𝜷 ̂𝟎
𝝏𝜷
𝝏𝒚 𝝏⦋( 𝐘𝐢−𝜷 ̂ 𝟏𝐗)𝟐 ⦌
̂𝟎 + 𝜷
=𝟎 ⇔ = −𝟐 ∑𝒏𝒊=𝟏 𝐗𝐢( 𝒀𝒊 − 𝜷 ̂ 1Xi) =0
̂0 + 𝜷
̂𝟏
𝝏𝜷 ̂𝟏
𝝏𝜷
Sommant par rapport à 𝑖, il vient :
∑𝑛𝑖=1 𝑋𝑖. 𝑌𝑖 − 𝛽̂ ∑𝑛
𝑖=1 𝑋𝑖
0 − ̂
𝛽 1 ∑ 𝒏
𝒊=𝟏 𝑿𝒊 𝟐
=𝟎
∑𝑛𝑖=1 𝑌𝑖 − 𝑛𝛽̂ −𝛽̂ 1∑𝒏𝒊=𝟏 𝑋𝑖 = 𝟎
0
Qu’on appelle les équations normales et qui impliquent que :
∑𝒏 ̅ ̅
𝒊=𝟏(𝑿𝒊−𝑿)(𝒀𝒊−𝒀) ∑𝒏 ̅̅
𝒊=𝟏 𝑿𝒊.𝒀𝒊−𝒏𝑿𝒀 𝒄𝒐𝒗(𝑿;𝒀)
̂ 1=
𝜷 = =
∑𝒏 ̅ 𝟐 ∑𝒏 𝑿𝟐 −𝒏𝑿 ̅̅̅̅
𝟐
𝒊=𝟏(𝑿𝒊−𝑿) 𝒊=𝟏 𝑽𝒂𝒓(𝑿)
̂0 = 𝒀
β ̂ 1𝑿̅
̅−𝛽
=
Nous pouvons faire deux remarques :
L’écriture du modèle n’est pas neutre ;
La spécification : Yi= 𝜷𝟎 + 𝜷𝟏 Xi +𝒖𝒊 n’est pas équivalente à :
Xi = 𝜷′𝟎 +𝜷′𝟏 𝒀𝒊 +𝒖′𝒊 . Dans le premier modèle, Xi est la cause de Yi, alors que
dans la deuxième spécification, c’est Yi qui est la cause de Xi.
̂ 1 = ρ2
Nous remarquons que : 𝛽̂ 1×𝛽′
(ρ = coefficient de corrélation entre X et Y ) ;
– Le coefficient β1 représente la pente de la droite ou encore une
propension marginale.
Nous avons : ∆Yi = β1 ∆𝑋𝑖 . L’impact d’une variation de Xi se mesure directement sur
Yi au travers du coefficient β1 .
Autrement dit : lorsque X varie d’une unité, Y varie en moyenne de β1 unités, il s’agit
bien de la sensibilité de Y à la variation de X.
Exemple : supposons que β1 = 0,5
Donc lorsque X varie d’une unité (1dh par exemple) Y augmente de 0,5 unité.
o Signification de l’ordonner à l’origine
Pour X=0 ⇒ Yi = β0 + 𝑢𝑖
Au niveau de la p
E(X,Y)
β0 N’est rien d’autre que la moyenne de Y pour X=0
D. Propriétés de la droite de régression
Propriété1 : d’après l’expression des deux paramètres on déduits qu’ils sont fonctions
des observations seulement
̂0 + 𝜷
Propriété2 : la droite de régression Yi = 𝜷 ̂ 1Xi passe par le point moyen
𝑋̅ 𝑒𝑡 𝑌̅
Propriété3 : la moyenne de la variable Y observée au niveau de la
population est égale la moyenne estimée
Propriété4 : la valeur moyenne des résidus est nulle ∑𝑛𝑖=1 𝑢̂𝑖 = 0
Propriété5 : les résidus sont non corrélés avec les Xi c-à-d leurs covariance
est nulle
̂𝑖 sont non corrélés avec les erreurs 𝑢̂
Propriété6 : les 𝑌
E. Les hypothèses du modèle de régression linéaire simple
L ’estimation des moindres carrés et son évaluation ne prend effet que si certaines
hypothèses sont respectées.
Hypothèse1 : Le modèle doit être linéaire (sous forme 𝒚 = 𝒂𝒙 + 𝒃 )
Hypothèse2: Les valeurs de 𝐗i sont fixes dans l’échantillon c-à-d elles sont observées
sans erreurs (𝐗𝐢 non aléatoire)
Hypothèse3: 𝐄(𝐮𝐢) = 𝟎 , l’espérance mathématique de l’erreur est nulle
Hypothèse4:
Homoscédasticité : 𝐕(𝐮𝐢) = Constante = 𝛔2𝒖 , la variance de l’erreur est constante
Hétéroscédasticité : V(ui) n’est pas constante = 𝛔2
Hypothèse5: 𝐮𝐢~𝐍(𝟎, 𝛔2𝒖 ) , les erreurs suivent une loi normale
Le graphique ci-dessous illustre cette hypothèse sur la distribution des valeurs
projetées sur la droite des moindres carrés.
Hypothèse6: 𝐂𝐎𝐕(𝐮𝐢 , 𝐮𝐣) = 𝟎 , absence d’autocorrélation entre les erreurs.
Hypothèse7: 𝐂𝐎𝐕(𝐗𝐢, 𝐮𝐢) = 𝟎 , l’erreur est indépendante de la variable explicative.
Hypothèse8: la variance de la variable X doit être non nulle 𝐕(𝐗𝐢) ≠ 𝟎.
NB : ces hypothèses sont des hypothèses probabilistes et non pas structurelles.