Econométrie
Chapitre 2 : Modèle de Régression Linéaire Simple
Pr. Moad El kharrim
Université AbdelMalek Essaâdi, FSJES - Tétouan
sites.google.com/view/kharrim
[email protected] Année Universitaire 2023-2024
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 1 / 39
Sommaire du chapitre
1 Construction de Modèle de Régression
2 Estimation des Moindres Carrés et les Hypothèses Classiques
3 Conséquences de la Normalité des Erreurs
4 Inférences dans la Régression et Analyse de la Variance (ANOVA)
5 Prévision dans le Modèle de Régression Simple
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 2 / 39
Construction de Modèle de Régression
Présentation Formelle du Modèle
La régression simple est le modèle le plus simple : une variable
endogène est expliquée par une variable exogène.
Soit la fonction de consommation keynésienne : Y = β0 + β1 X
▶ Y = Consommation
▶ X = Revenu
▶ β1 = Propension marginale à consommer
▶ β0 = Consommation autonome ou incompressible
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 3 / 39
Construction de Modèle de Régression
Présentation Formelle du Modèle
La variable consommation est appelée variable à expliquer,
variable endogène, variable de réponse ou variable dépendante.
La variable revenu est appelée variable explicative, exogène ou
encore variable indépendante.
β1 et β0 sont les paramètres du modèle ou encore les coefficients de
régression
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 4 / 39
Construction de Modèle de Régression
Présentation Formelle du Modèle
Nous pouvons distinguer deux types des spécifications.
Les modèles en série temporelle, les variables représentent des
phénomènes observés à intervalles de temps réguliers.
Par exemple la consommation et le revenu annuel de 2000 à 2020
pour un pays donné :
Yi = β 0 + β 1 Xi i = 2000, . . . , 2020
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 5 / 39
Construction de Modèle de Régression
Présentation Formelle du Modèle
Les modèles en coupe instantanée, les variables représentent des
phénomènes observés au même instant mais concernant divers
individus, par exemple la consommation et le revenu observés sur un
échantillon de 20 pays
Yi = β 0 + β 1 Xi i = 1, . . . , 20
Yi = Consommation pour le pays i en 2020
Xi = Revenu pour le pays i en 2020
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 6 / 39
Construction de Modèle de Régression
Présentation Formelle du Modèle
Le modèle qu’il vient d’être spécifié n’est qu’une caricature de la
réalité.
En effet, ne retenir que le revenu pour l’explication de la
consommation est à l’évidence même insuffisant.
Il existe une multitude d’autre facteurs susceptibles d’expliquer la
consommation.
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 7 / 39
Construction de Modèle de Régression
Présentation Formelle du Modèle
C’est pourquoi nous ajoutons un terme (εi ) qui synthétise l’ensemble de
ces informations non explicitées dans le modèle.
Yi = β 0 + β 1 Xi + ε i i = 1, . . . , n
Où (ε) représente l’erreur de spécification du modèle, c’est-à-dire
l’ensemble des phénomènes explicatifs de la consommation non liés au
revenu.
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 8 / 39
Construction de Modèle de Régression
Présentation Formelle du Modèle
Consommation
Revenu Disponible
Fonction de consommation “réelle”
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 9 / 39
Construction de Modèle de Régression
Présentation Formelle du Modèle
En pratique, le terme (ε) mesure la différence entre les valeurs
réellement observées de Yi , et les valeurs qui auraient été observées
si la relation spécifiée avait été rigoureusement exacte.
Le terme (ε) regroupe donc trois types d’erreurs :
▶ Erreur de spécification, c.à.d. le fait que la variable explicative n’est
pas suffisante.
▶ Erreur de mesure : les données ne représentent pas exactement le
phénomène.
▶ Erreur de fluctuation d’échantillonnage.
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 10 / 39
Estimation des Moindres Carrés et les Hypothèses Classiques
Estimation des Moindres Carrés
Dans la réalité nous ne connaissons pas les valeurs vraies des
coefficients
On peut seulement observer le valeurs de Y et de X .
Les estimateurs de coefficients sont notés respectivement : βb0 et βb1 .
Ce sont des variables aléatoires, qui suivent les mêmes lois de
probabilité, celle de (ε), puisque ils sont fonction de (ε).
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 11 / 39
Estimation des Moindres Carrés et les Hypothèses Classiques
Estimation des Moindres Carrés
Consommation
Revenu Disponible
Fonction de consommation “éstimée”
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 12 / 39
Estimation des Moindres Carrés et les Hypothèses Classiques
Estimation des Moindres Carrés
Estimation des paramètres du modèle
Yi = β 0 + β 1 Xi + ε i pour i = 1, . . . , n
Avec :
Yi = Variable à expliquer au temps i
Xi = Variable explicative au temps i
βb0 , βb1 = Paramètres du modèle
εi = Erreur de spécification
n = Nombre d’observations
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 13 / 39
Estimation des Moindres Carrés et les Hypothèses Classiques
Hypothèses
H1 : E (εi ) = 0 pour tout i = 1, ..., n, c’est-à-dire, les erreurs ont une
moyenne nulle.
H2 : var (εi ) = E ε2i = σ 2 , pour tout i = 1, ..., n, c’est-à-dire, les
erreurs ont une variance constante (Homoscédasticité).
H3 : E (εi εj ) = 0 pour i ̸= j et i, j = 1, ..., n , c’est-à-dire, les erreurs ne
sont pas corrélées.
H4 : Les valeurs de X sont observés sans erreur (X est non
stochastique).
H5 : cov (Xi , εi ) = 0 pour tout i = 1, ..., n ; toutes les variables
explicatives ne sont pas corrélées avec le terme d’erreur.
H6 : Les εi ’s sont indépendants et identiquement distribués N 0, σ 2 .
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 14 / 39
Estimation des Moindres Carrés et les Hypothèses Classiques
Estimation des Moindres Carrés
Les estimateurs des coefficients βb0 et βb1 , sont obtenus en minimisant la
distance au carré entre chaque observation et la droite.
D’où le nom d’estimateur des moindres carrés ordinaires (MCO)
La résolution analytique est la suivante :
X
n n
X 2
Min SCR ≡ Min ei2 ≡ Min Yi − βb0 − βb1 Xi
i=1 i=1
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 15 / 39
Estimation des Moindres Carrés et les Hypothèses Classiques
Estimation des Moindres Carrés
En opérant par dérivation par rapport à β0 et β1 (c’est-à-dire les
conditions de premier ordre) afin de trouver le minimum de cette
fonction,
on obtient les résultats suivants :
P
n
∂ ei2
P
n P
n P
n
i=1
= −2 ei = 0 =⇒ Yi − n βb0 − βb1 Xi = 0
∂β0 i=1 i=1 i=1
Pn
∂ ei2
P
n P
n P
n P
n
i=1
= −2 ei Xi = 0 =⇒ Yi Xi − βb0 Xi − βb1 Xi2 = 0
∂β1 i=1 i=1 i=1 i=1
On obtient :
P
n
Xi − X̄ Yi − Ȳ
βb1 = i=1
2 et βb0 = Ȳ − βb1 X̄
P
n
Xi − X̄
i=1
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 16 / 39
Estimation des Moindres Carrés et les Hypothèses Classiques
Estimation des Moindres Carrés
La spécification du modèle n’est pas neutre :
▶ Y = f (X ) n’est pas équivalente à X = f (Y )
▶ Le coefficient β1 représente la pente de la droite ou encore la
propension marginale. On verra que lorsque les variables sont
transformées en logs, le coefficient représentera l’élasticité.
Il y a des cas spéciaux où le terme constante est nul : pour exemple
le cas d’une fonction de production où le facteur fixe n’intervienne
pas.
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 17 / 39
Estimation des Moindres Carrés et les Hypothèses Classiques
Estimation des Moindres Carrés
Le modèle de régression linéaire simple peut s’écrire sous deux formes
selon qu’il s’agit du modèle théorique spécifié par l’économiste ou du
modèle estimé à partir d’un échantillon.
Le résidu observé (ei ) est donc la différence entre les valeurs observées
bi à l’aide des
de la variable à expliquer Yi et les valeurs ajustées Y
estimations des coefficients du modèle, on a :
bi = Yi − βb0 − βb1 Xi
ei = Yi − Y i = 1, 2, ..., n
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 18 / 39
Estimation des Moindres Carrés et les Hypothèses Classiques
Propriétés Statistiques des Estimateurs des
Moindres Carrés
Les estimateurs obtenus en utilisant la méthode des moindres carrés
ordinaires ont deux proprieté importantes :
Estimateurs Sans Biais
Consistance (où Convergence)
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 19 / 39
Estimation des Moindres Carrés et les Hypothèses Classiques
Propriétés Statistiques des Estimateurs des
Moindres Carrés
Estimateurs Sans Biais :
E βb1 = β1 et E βb0 = β0
Consistance (où Convergence) :
σ2
▶ lim var βb1 = lim n
n→∞ n→∞ P 2 = 0
Xi − X̄
i=1
1 X̄ 2
▶ lim var βb0 = σ 2 + n
n→∞ n P 2 = 0
Xi − X̄
i=1
Ces types d’estimateurs sont dit ‘BLUE’ : Best Linear Unbiased
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 20 / 39
Conséquences de la Normalité des Erreurs
Conséquences de la Normalité des Erreurs
L’hypothèse de normalité des erreurs n’est pas nécessaire pour
obtenir des estimateurs convergents.
Cette hypothèse est en revanche importante pour construire des
tests statistiques concernent la validité du modèle estimé.
les εi sont indépendants N 0, σ 2
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 21 / 39
Conséquences de la Normalité des Erreurs
Estimation de la Variance des Erreurs σε2
La variance des erreurs de régression notée σ 2 est inconnue et doit être
estimée. En fait, la variance de βb1 et celle de βb0 dépendent de σ 2 . Un
estimateur sans biais pour σ 2 est :
P
n
ei2
i=1
b =
σ 2
n−2
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 22 / 39
Conséquences de la Normalité des Erreurs
Estimation des Variances des Estimateurs βb1 et βb0
Les variances estimées des deux estimateurs βb1 et βb0 sont :
b2
σ
bβ2b =
σ 2
1 P
n
Xi − X̄
i=1
1 X̄ 2
σ b2
bβ2b = σ n + P
n
2
0
Xi − X̄
i=1
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 23 / 39
Conséquences de la Normalité des Erreurs
En conséquence de l’hypothèse de normalité des erreurs, on peut
observer que :
βb1 − β1
∼ N (0, 1)
σβb1
βb0 − β0
∼ N (0, 1)
σβb0
En utilisant ces formules, on peut mettre en place des tests statistiques
pour :
Comparer un coefficient de régression par rapport a une valeur
fixée
Comparer deux coefficients provenant de deux échantillons
différents
Déterminer un intervalle de confiance pour un coefficient
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 24 / 39
Inférences dans la Régression et Analyse de la Variance (ANOVA)
Intervalles de Confiance
On peut obtenir un intervalle de confiance pour β1 en utilisant le fait
que
h i
Pr −tn−2 < tβ∗b < tn−2 = 1 − α
α/2 α/2
1
βb1 − β1
et en substituant t ∗b par sa valeur . Puisque les valeurs critiques
β1 bβ̂1
σ
sont connues, βb1 et σ
bβ̂1 peuvent être calculés à partir des données, et
l’intervalle de confiance de β1 avec un niveau de confiance (1 − α) % se
présente comme
h i
ICβ1 = βb1 ± tn−2 σ
α/2
bβ̂1
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 25 / 39
Inférences dans la Régression et Analyse de la Variance (ANOVA)
Tests de Signification des Paramètres de Régression
Une approche alternative mais complémentaire à la méthode des
intervalles de confiance pour tester des hypothèses statistiques est
l’approche des tests de signification développée indépendamment
par R. A. Fisher et conjointement par Neyman et Pearson.
De manière générale, un test de signification est une procédure par
laquelle des résultats d’échantillons sont utilisés pour vérifier la
véracité ou la fausseté d’une hypothèse nulle.
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 26 / 39
Inférences dans la Régression et Analyse de la Variance (ANOVA)
Test Bilatéral
Les deux alternatives possibles sont :
H0 ; β 1 = 0
H1 ; β1 ̸= 0
Tester l’hypothèse H0 contre l’hypothèse H1 , soit à comparer le ratio
βb1
empirique de Student |t ∗b | (dans ce cas t ∗b = ) à la valeur de t de
β1 β1 bβ̂1
σ
Student lue dans la table de de la loi de Student à (n − 2) degrés de
liberté pour un seuil de probabilité égal à 5%.
La règle de décision avec ce test pour contrôler le niveau de
signification est la suivante :
Si |t ∗b | ≤ tn−2 on accepte H0
α/2
β1
|t ∗b |
α/2
Si > tn−2 on accepte H1
β1
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 27 / 39
Inférences dans la Régression et Analyse de la Variance (ANOVA)
Test Unilatéral
Supposons que nous voulons vérifier si β1 est positif ou non. Les
alternatives seraient alors :
H0 ; β 1 ≤ 0
H1 ; β 1 > 0
Tester l’hypothèse H0 contre l’hypothèse H1 , soit à comparer le ratio
empirique de Student |t ∗b | à la valeur de t de Student lue dans la table
β1
de de la loi de Student à (n − 2) degrés de liberté pour un seuil de
probabilité égal à 5%.
La règle de décision avec ce test pour contrôler le niveau de
signification est la suivante :
Si |t ∗b | ≤ tn−2
α on accepte H0
β1
Si |t ∗b | > tn−2
α on accepte H1
β1
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 28 / 39
Inférences dans la Régression et Analyse de la Variance (ANOVA)
Analyse de la Variance (ANOVA)
L’analyse de la variance est importante pour évaluer dans quelle mesure
le modèle estimé est capable de expliquer la réalité.
La formule pour l’analyse de la variance est la suivante :
P
n 2 n
P 2 P
n
Yi − Ȳ = b
Yi − Ȳ + ei2
i=1 i=1 i=1
SCT = SCE + SCR
La variabilité totale est égale à la variabilité expliquée plus la
variabilité des residus
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 29 / 39
Inférences dans la Régression et Analyse de la Variance (ANOVA)
Analyse de la Variance (ANOVA)
Cette équation va nous permettre de juger de la qualité de l’ajustement
d’un modèle
Plus la variance expliquée est proche de la variance totale, meilleur est
l’ajustement du nuage de points par la droite des moindres carrés
n
P 2 P
n
bi − Ȳ
Y ei2
SCE SCR
R2 = = i=1
P
n 2 = 1 − P
n
i=1
2 = 1 − SCT
SCT
Yi − Ȳ Yi − Ȳ
i=1 i=1
R2 = Coefficient de détermination ;
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 30 / 39
Inférences dans la Régression et Analyse de la Variance (ANOVA)
Analyse de la Variance (ANOVA)
Notez que R2 a deux significations alternatives :
bi ;
C’est le coefficient de corrélation simple au carrée entre Yi et Y
c’est-à-dire r 2 bi .
Yi ,Y
C’est la corrélation simple au carré entre X et Y .
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 31 / 39
Inférences dans la Régression et Analyse de la Variance (ANOVA)
Analyse de la Variance (ANOVA)
Degrés de
Source de Somme des Carrés Carrés Moyens
liberté (ddl)
variation
n
P 2 SCE
X SCE = bi − Ȳ
Y 1 MCE =
i=1 1
P
n SCR
Résidu SCR = ei2 n−2 MCR =
i=1 n−2
P
n 2
Total SCT = Yi − Ȳ n−1
i=1
Tableau d’Analyse de la Variance
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 32 / 39
Inférences dans la Régression et Analyse de la Variance (ANOVA)
Test de Fisher
Le test d’hyopthèse H0 ; β1 = 0 est équivalent au test d’hypothèse
H0 ; SCE = 0 (la variable explicative Xi ne contribue pas à l’explication
du modèle).
Soit le test d’hypothèses H0 ; SCE = 0 contre H0 ; SCE ̸= 0. La
statistique de ce test est donnée par :
n
P 2
bi − Ȳ
Y
SCE i=1 R2
ddlSCE MCE
F∗ = = = 1 = 1
SCR MCR P
n
1 − R2
ei2
ddlSCR i=1 n−2
n−2
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 33 / 39
Inférences dans la Régression et Analyse de la Variance (ANOVA)
Test de Fisher
F ∗ suit une statistique de Fisher à 1 et n − 2 degrés de liberté. Si
F ∗ > F1;n−2
α nous rejetons au seuil α l’hypothèse H0 d’égalité des
variances, la variable Xi est significative ; dans le cas contraire, nous
acceptons l’hypothèse d’égalité des variances, la variable Xi n’est pas
explicative de la variable Yi .
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 34 / 39
Inférences dans la Régression et Analyse de la Variance (ANOVA)
Remarque
!2
2 βb1 βb12
∗
F = tβ∗b = =
1 bβ̂1
σ b2
σ
P
n 2
Xi − X̄
i=1
P
n 2 R2
βb12 Xi − X̄
= i=1
= 1
P
n
1 − R2
ei2
i=1 n−2
n−2
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 35 / 39
Prévision dans le Modèle de Régression Simple
Prévision dans le Modèle de Régression Simple
Losque les coefficients du modèle de régression sont estimés, il est serait
aisé de calculer une prévision futur à un horizon h.
Soit le modèle de régression estimé sur une période i = 1, ..., n
Yi = βb0 + βb1 Xi + εi i = 1, ..., n
Si la valeur de la variable explicative Xi est connue en n + 1 soit Xn+1 ,
la prévision est donnée par : Yn+1 = βb0 + βb1 Xn+1 , on parle d’une
prévision ponctuelle sans biais.
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 36 / 39
Prévision dans le Modèle de Régression Simple
Prévision dans le Modèle de Régression Simple
Dans la pratique, il n’est que de peu d’utilité de connaître la prévision
si nous ne savons pas quel degré de confiance nous pouvons lui
accorder. Nous allons donc calculer la variance de l’erreur de
prévision qui nous permet de déterminer un intervalle de confiance
bornant la prévision (on parle d’un intervalle de prédiction).
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 37 / 39
Prévision dans le Modèle de Régression Simple
Prévision dans le Modèle de Régression Simple
2
1 Xn+1 − X̄
bn+1 = σ
var (en+1 ) = var Yn+1 − Y b2 1 + +
n P
n 2
Xi − X̄
i=1
L’hypothèse de normalité de εi permet alors de déterminer un intervalle
à (1 − α) % pour la prévision :
2
bn+1 ∼ N 0, σ 2 1 + 1 + Xn+1 − X̄
en+1 = Yn+1 − Y n Pn 2
Xi − X̄
i=1
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 38 / 39
Prévision dans le Modèle de Régression Simple
Prévision dans le Modèle de Régression Simple
Soit
βb + βb1 Xn+1 − Yn+1
v 0 ∼ tn−2
u
u 2
u Xn+1 − X̄
u 1
b u1 + + n
σ 2
t n P
Xi − X̄
i=1
ainsi l’intervalle de prédiction est donnée comme suit :
v
u
u
u Xn+1 − X̄
2
bn+1 ± t α/2 σ u 1
Yn+1 =Y n−2 ub 1+ + n 2
t n P
Xi − X̄
i=1
Pr. Moad El kharrim Modèle de Régression Linéaire Simple 2023-2024 39 / 39