18/05/2021
1 2
FSJES
Ain SEBAA
ECONOMÉTRIE
CHAPITRE II
Safae Aissaoui LA RÉGRESSION MULTIPLE
2020 - 2021
1 2
3 4
Avantages de la régression multiple Avantages de la régression multiple
• Dans le chapitre 1, nous avons étudié l’impact d’une variable • L’analyse de la régression multiple permet en outre :
indépendante x sur la variable dépendante y
• La construction de meilleurs modèles de prédiction de la
Hypothèse : tous les autres facteurs affectant y ne sont
pas corrélés avec x
variable expliquée : grâce à l’introduction de plusieurs
variables dans le modèle, on obtient une meilleure
explication de la variance de y
Hypothèse non réaliste
• Une plus grande flexibilité : prise en compte de formes
fonctionnelles assez générales
Le modèle de régression multiple permet de contrôler explicitement
les autres facteurs qui affectent la variable dépendante
3 4
1
18/05/2021
5 6
Plan 1- La régression multiple : modèle à 2 variables
Exemple 1 : on souhaite estimer l’effet de l’éducation sur le
1. La régression multiple : du modèle à 2 variables au modèle salaire horaire
à k variables
• Le salaire est déterminé par le niveau d’éducation,
l’expérience (en nombre d’années) et d’autres facteurs inclus
2. Le mécanisme des MCO et son interprétation dans ɛ
salaire 0 1educ 2exper
3. Les propriétés des estimateurs des MCO • Dans cette équation, l’expérience est soustraite du terme
d’erreur et apparait en tant que variable : 2 mesure l’effet de
4. Applications l’expérience sur le salaire ceteris paribus
• Dans la régression multiple, nous pouvons estimer l’effet de l’éducation
sur le salaire en gardant l’expérience fixe
• Dans la régression simple, l’expérience est incluse dans le terme
d’erreur et est considérée comme non corrélée au niveau d’éducation
5 6
7 8
1- La régression multiple : modèle à 2 variables 1- La régression multiple : modèle à 2 variables
Le modèle à deux variables indépendantes Exemple 2 : on souhaite estimer l’effet du revenu sur la
• Généralement le modèle à deux variables s’écrit : consommation
• Supposons que la consommation est une fonction
y 0 1 x1 2 x2
quadratique du revenu :
cons 0 1rev 2 rev ²
• 0 est la constante
• Dans ce cas, mesurer l’effet du rev en gardant l’effet de rev²
• 1 mesure l’effet de x1 sur y si tous les autres facteurs sont
fixes fixe n’a pas de sens : si rev change alors rev² va aussi
changer
• 2 mesure l’effet de x2 sur y si tous les autres facteurs sont
• L’effet de la variation du revenu sur la variation de la
fixes
consommation est donné par la relation suivante :
cons
1 2 2 Pourquoi ?
rev
7 8
2
18/05/2021
9 10
1- La régression multiple : modèle à k variables 1- La régression multiple : modèle à k variables
Le modèle à k variables indépendantes • Exemple : supposons l’équation ci-dessous qui vise à
• La régression linéaire multiple permet la prise en compte de expliquer le salaire des PDG en introduisant les ventes de
plusieurs facteurs affectant y l’entreprise et l’ancienneté du PDG
y 0 1 x1 2 x2 3 x3 ... k xk log(salaire) 0 1log(ventes) 2 anc 3 anc²
• 0 est la constante • Notons que cette régression est linéaire respectivement aux
• 1 mesure l’effet de x1 sur y si tous les autres facteurs sont paramètres j mais que la relation entre le salaire et les
fixes variables explicatives est non linéaire
• 2 mesure l’effet de x2 sur y si tous les autres facteurs sont
• Le paramètre 1 représente, toutes choses étant égales par
fixes et ainsi de suite
ailleurs, l’élasticité du salaire au ventes
• Il y aura toujours des variables explicatives qui ne pourront
pas être incluses dans la régression, elles sont collectivement • Si 3 0 , 100 2 donne le pourcentage d’augmentation du
présentes dans salaire si l’ancienneté augmente d’une année
9 10
11 12
2- Le Mécanisme des MCO et son interprétation 2- Le Mécanisme des MCO et son interprétation
• Nous pouvons aussi écrire le modèle, par observation :
• L’estimation de l’équation des MCO pour deux variables
y1 0 1 x11 2 x12 3 x13 ... k x1k 1
indépendantes s’écrit :
ŷ ˆ0 ˆ1 x1 ˆ2 x2 y2 0 1 x21 2 x22 3 x23 ... k x2k 2
.
• Comme dans le chapitre I, la méthode des MCO minimise la .
somme des carrés des résidus yn 0 1 xn1 2 xn 2 3 xn 3 ... k xnk n
y ˆ
n
ˆ1 xi1 ˆ2 xi 2 ²
i 1
0
• Ou en utilisant la notation matricielle :
y1 1 x11 x12 . . x1k 1 1
• Pour k variables, l’estimation de 0, 1... k se fait à travers
y2 1 x21 x22 . . x2 k 2 2
l’équation y3 1 x31 x32 . . x3k 3 3
yˆ ˆ0 ˆ1 x1 ˆ2 x2 ... ˆk xk
Y . , X 1 . . . . . , . , .
. 1 . . . . . . .
. 1 . . . . . . .
y 1 x xn 2 . . xnk
n n1 k n
11 12
3
18/05/2021
13 14
2- Le Mécanisme des MCO et son interprétation 2- Le Mécanisme des MCO et son interprétation
• Ce qui peut s’écrire : Y X • On doit donc minimiser la somme des carrés des résidus
( n ,1) ( k ,1) ( n ,k) ( n ,1)
• Rappelons que cette somme est : S ( ) Y ' Y 2 'X'Y ' X ' X
• Pour estimer le vecteur composé des coefficients 1 , 2 ... k ,
dS
nous minimisons la somme des carrés des résidus • La solution doit annuler la dérivée : 0
d
n
min S ( ) min 2 min ' 0 2 X ' Y 2 X ' X ˆ 0
i 1
• Le développement de ɛ’ɛ donne Y'X ' X ' Y ' X ' Y ˆ X ' X
' (Y X ) '(Y X ) ' X 'Y ' ' X 'Y • Si l’inverse de X’X existe, la solution est donnée par :
(Y ' ' X ')(Y X )
ˆ X ' X X ' Y
1
Y ' Y Y ' X ' X 'Y ' X ' X
Y ' Y ' X ' Y ' ' X 'Y ' X ' X
Y ' Y 2 ' X 'Y ' X ' X
13 14
15 16
2- Le Mécanisme des MCO et son interprétation 2- Le Mécanisme des MCO et son interprétation
• L’interprétation de l’équation estimée • La valeur actuel de y i pour toute observation i n’est pas égale
yˆ ˆ0 ˆ1 x1 ˆ2 x2 ... ˆk xk à la valeur prédite yˆi
• La constante ˆ 0 est la valeur prédite de y lorsque • On peut obtenir le résidu pour chaque observation eˆi yi yˆ i
x1 0 , x2 0,..., xk 0
• Un résidu positif implique que y i est sous-prédit
ˆ ˆ ˆ
• 1, 2 ... k donnent des effets partiels ou des effets ceteris
• Un résidu négatif implique que y i est sur-prédit
paribus
• En termes de variation, on note yˆ ˆ1 x1 ˆ2 x2 ... ˆk xk yi
Valeur résidus
• Le coefficient de x1 mesure la variation de ŷ dûe à actuelle
résidus yi
l’augmentation de x1 d’une unité, si toutes les autres Valeur Valeur
variables étaient fixes prédite Valeur prédite
actuelle
15 16
4
18/05/2021
17 18
2- Le Mécanisme des MCO et son interprétation 2- Le Mécanisme des MCO et son interprétation
Exemple : l’estimation de l’équation du salaire donne le La qualité de régression
résultat suivant • Comme démontré pour la régression simple, on peut définir :
log(salaire) 0.284 0.092educ 0.0041exper 0.022anc n
• La somme des carrés totale (SCT) : y y ²
i 1
i
• L’interprétation de cette équation se fait comme suit : n
• La somme des carrés des résidus (SCR) : e ²
i 1
i
• La constante 0,284 est le salaire prédit en logarithme si toutes n
les autres variables sont nulles
• La somme des carrés expliqués (SCE) : yˆ y ²
i 1
i
• Si l’expérience et l’ancienneté sont fixes, une année d’éducation • … et en déduire le même résultat SCT SCR SCE
supplémentaire augmente le salaire en logarithme de 0,092
• …ainsi que le R² :
• On peut envisager la variation de deux variables indépendantes N
(expérience et ancienneté), l’effet total est : yˆ y ²
i
SCE SCT SCR SCR
log( salaire) 0.0041 0.022 0.0261 R² i 1
N
R² 1
SCT SCT SCT
y y ²
i 1
i
17 18
19 20
3- Les propriétés des estimateurs des MCO 3- Les propriétés des estimateurs des MCO
• Les estimateurs obtenus par les MCO sont les meilleurs
estimateur linéaires non biaisés (BLUE)
• Un estimateur est une règle qui peut être appliquée pour Estimateur BLUE si
n’importe quel échantillon de données pour produire une
estimation
• Non biaisé signifie que pour tout estimateur E ( ˆ j ) j pour
chaque 1 , 2 ... j Hypothèses Hypothèses
structurelles stochastiques
• Un estimateur ˆ j de j est linéaire si et seulement si il peut
être estimé comme une fonction linéaire des données de la
variable dépendante
• Par meilleur, on entend que c’est l’estimateur qui qui fournit la
variance la plus faible
19 20
5
18/05/2021
21 22
3- Les propriétés des estimateurs des MCO 3- Les propriétés des estimateurs des MCO
Hypothèses Hypothèses
structurelles stochastiques
1- Absence de colinéarité entre les variables explicatives 1- Les valeurs de xi sont observées sans erreur
2- E ( i ) 0
X 'X
2- tend vers une matrice finie non singulière
n
3- Var ( i ) ²
3- n k 1 4- Cov( i , j ) 0
5- Cov( i , xi ) 0
21 22
23 24
4- Applications – Exercice 1 4- Applications – Exercice 2
Soit le modèle suivant : Le modèle suivant étudie le compromis entre le temps de travail et le temps de
ˆ 10.36 0.094 frat 0.131meduc 0.210 peduc
educ sommeil som 0 1trav 2 educ 3 age
Où som et trav sont mesurés en minutes par semaine, educ et age sont
n 722, R 0.214 mesuré en années,
où educ est le nombre d’années d’études, frat le nombre de frères et 1- Si les parents échangent le sommeil contre le travail, quel signe aura β1 ?
sœurs(fratrie), meduc le nombre d’années d’études de la mère et
peduc le nombre d’années d’études du père. 2- Quels signes pensez vous que β2 et β3 auraient ?
1- Est-ce que la fratrie a l’effet attendu ? Si meduc et peduc sont fixes, 3- L’estimation de cette équation sur des données donne le résultat suivant :
de combien devrait augmenter frat pour réduire le nombre prédit ˆ 3638.25 0.148trav 11.13educ 2, 20age
som
d’année d’éducation d’une année ? n 706, R 0.113
2- Interpréter le coefficient de meduc Si une personne travaille 5 heures supplémentaires, de combien diminuera son
temps de sommeil en minutes ?
3- Soient deux individus qui n’ont aucune fratrie : les parents de
l’individu A ont fait 12 années d’études alors que ceux de l’individu B 4- Interpréter le signe et l’ampleur du coefficient de la variable educ
ont fait 16 années d’études. Quelle est la différence estimée en 5- Selon vous, dans quelle mesure les trois variables explicatives expliquent la
années d’éducation entre l’individu A et l’individu B ? variation du sommeil ? Quels autres facteurs pourraient impacter le sommeil ?
23 24
6
18/05/2021
25 26
4- Applications – Exercice 3 4- Applications – Exercice 3
Soit la variable à expliquer yt et deux variables explicatives x1 1-Ecrire le modèle sous forme matricielle
et x2 connues sur 10 périodes 2- Estimer les paramètres du modèle
t yt x1 x2
3- Que signifie un estimateur BLUE ?
1 12 7 48
2 21 9 40
4- Calculer les résidus
3 24 11 18 5- En déduire la somme des carrés des résidus
4 24 12 28
5 13 7 40
6 17 9 32
7 21 12 31
8 26 14 24
9 31 19 22
10 30 21 25
25 26