Licence 2 SEA
UIST
Econométrie
2022-2023
TALNAN EVRARD
TD 2
Le modèle de régression linéaire multiple
Exercice 1 Le modèle suivant est une version simpli…ée du modèle de régression linéaire
multiple utilisé par Biddle et Hamermesh (1990) pour étudier la relation entre sommeil et
travail, en tenant compte d’autres facteurs qui a¤ectent la relation. Soit
sleep = 0 + 1 totwrk + 2 educ + 3 age +u
où le sommeil (sleep) et le travail (totwrk, « total work » en anglais) sont mesurés en
minutes par semaine. Les variables educ et age sont mesurées en années, avec educ qui désigne
le nombre d’années d’études.
1. Si les adultes dorment moins pour travailler, quel est le signe attendu de 1 ?
2. Quels sont, à votre avis, les signes attendus de 2 et 3 ?
3. A partir d’un …chier de données, l’équation estimée est :
[
sleep = 3638; 25 0; 148totwrk 11; 13educ + 2; 20age
N = 706; R2 = 0; 113
Quel est l’e¤et ceteris paribus sur le sommeil (estimé en minutes) d’une augmentation de
cinq heures de travail par semaine ? Est-ce important ?
4. Que pensez-vous du signe et de la taille du coe¢ cient estimé pour educ ?
1
5. Estimez-vous que totwrk, educ, et age expliquent une grande part de la variation de
sleep ? Quels autres facteurs pourraient a¤ecter le sommeil ? Sont-ils susceptibles d’être
corrélés avec totwrk ?
Exercice 2 Vous distribuez un questionnaire à plusieurs étudiants dans le but d’estimer le
lien entre la moyenne générale obtenue à l’université (GP A) et le temps consacré à di¤érentes
activités. Il est notamment demandé aux étudiants d’évaluer les heures consacrées chaque
semaine à leurs diverses activités en les classant obligatoirement dans les quatre catégories
suivantes : les études, le sommeil, le travail rémunéré, et le divertissement. Pour chaque
étudiant, la somme des heures consacrées aux quatre activités doit donc être égale à 168 heures,
soit 7 journées de 24 heures.
1. Dans le modèle
GP A = 0 + 1 study + 2 sleep + 3 work + 4 leisure +u
est-il sensé de faire varier study toutes choses égales par ailleurs ?
2. Comment pourriez-vous reformuler ce modèle en respectant l’hypothèse d’absence de
colinéarité parfaite et en lui permettant d’avoir une interprétation utile ?
Exercice 3 Supposons que la productivité moyenne des employés dans l’industrie manufac-
turière (avgprod) dépende de deux facteurs : le nombre moyen d’heures de formation (avgtrain)
et les capacités moyennes des employés (avgabil) :
avgprod = 0 + 1 avgtrain + 2 avgabil +u
Supposons que cette équation respecte les hypothèses de Gauss-Markov. Si des subventions
sont accordées aux entreprises dont les employés ont des capacités moyennes plus faibles (de
telle sorte que les variables avgtrain et avgabil sont corrélées négativement), quel sera le biais
probable de e 1 , sachant que e 1 correspond à l’estimateur de la pente d’une régression linéaire
simple de avgprod sur avgtrain ?
2
Exercice 4 L’équation suivante décrit le prix médian de l’immobilier dans un quartier en
fonction de deux variables : le degré de pollution dans l’atmosphère, mesuré par le protoxyde
d’azote (nox pour « nitrous oxide » en anglais), et le nombre moyen de pièces dans les logements
du quartier (rooms). Soit le modèle :
log(price) = 0 + 1 log(nox) + 2 rooms +u
1. Quels sont les signes probables de 1 et 2 ? Quelle est l’interprétation de 1 et 2 ?
Expliquez.
2. Pourquoi nox (ou plus précisément log(nox)) et rooms pourraient être négativement cor-
rélés ? Si tel est le cas, la régression linéaire simple de log(price) sur log(nox) produirait-
elle un estimateur de 1 biaisé vers le haut ou vers le bas ?
3. Nous pouvons estimer l’équation par les MCO :
\ = 9; 23
log(price) 0; 718 log(nox) + 0; 306rooms; N = 506; R2 = 0; 514
Interprétez l’e¤et de nox et de rooms sur price.
4. Nous estimons également par les MCO le modèle de régression linéaire simple :
\ = 11; 71
log(price) 1; 043 log(nox); N = 506; R2 = 0; 264
Étant donnée votre réponse à la question 2, la di¤érence entre cette estimation et celle de
la question 3 est-elle celle que vous anticipiez ? Cela signi…e-t-il que l’estimation 0; 718
est plus proche de la vraie élasticité que l’estimation 1; 043 ?
Exercice complémentaire Des données sur la population employée masculine ont été util-
isées pour estimer l’équation suivante :
d
educ = 10; 36 0; 094sibs + 0; 131meduc + 0; 210f educ
N = 722; R2 = 0; 214
où educ est le nombre d’années d’études, sibs est le nombre de frères et sœurs, meduc est le
nombre d’années d’études de la mère, et f educ est celui du père.
3
1. La variable sibs a-t-elle l’e¤et attendu ? Expliquez. Les autres variables (meduc et f educ)
demeurant constantes (ceteris paribus), quelle est l’augmentation de sibs qui conduit à
une diminution d’une année d’études ? (La réponse ne correspond pas forcément à un
nombre entier).
2. Donnez une interprétation au coe¢ cient de meduc.
3. Supposez que l’individu A est …ls unique et que ses parents ont chacun fait 12 années
d’études. L’individu B est également …ls unique mais ses parents ont fait chacun 16 ans
d’études. Quelle sera la di¤érence d’instruction prédite entre A et B, en nombre d’années
d’études ?