TP1
La régression simple
les variables aléatoires - Intervalle de Confiance - test d’hypothèse
FORMULES UTILES
– yi = b0 + b1xi + ui
– yˆi = bˆ0 + bˆ1xi n n
P P
(xi −X̄)(yi −Ȳ ) ( xi yi )−X̄ Ȳ
Cov(X,Y ) i=1 i=1
– bˆ1 = = n = n
P 2 P
V (X) (xi −X̄) ( xi 2 )−X̄ 2
i=1 i=1
– bˆ0 = Ȳ − bˆ1 X̄
– û i = yi − yˆi
n
P
ûi2
SCR
– σ̂2 = i=1
n−2 = n−2
2 σ̂ 2
– σ̂βˆ1 = P
n
2
(xi −X̄)
i=1
n
P
ûi2
SCE SCR =1- i=1
– R2 = SCT =1− SCT n
P
(yi −Ȳ )2
i=1
Exercice 1 :
L’objectif de l’exercice est de familiariser l’étudiant avec les formules de base de la ré-
gression linéaire simple yi = b0 + b1xi + ui. A cet effet, l’étudiant est supposé répondre aux
questions suivantes en n’utilisant qu’une calculatrice. La barre = la moyenne
xi yi (x − X̄) (xi − X̄)2 (yi − Ȳ ) (xi − X̄)(yi − Ȳ )
3 5 2 4 3 6
2 2 1 1 0 0
1 3 0 0 1 0
-1 2 -2 4 0 0
0 -2 -1 1 -4 4
5 5 5 5 5 5
(xi − X̄) (xi − X̄)2 (yi − Ȳ ) (xi − X̄)(yi − Ȳ )
P P P P P P
xi yi
i=1 i=1 i=1 i=1 i=1 i=1
5 10 0 10 0 10
1. Complétez le tableau en mettant la somme de chaque colonne dans la dernière
ligne.
1 2
2. Calculez X¯ et Ȳ . = la moyenne de x et de y
3. Calculez les estimateurs de b0 et b1 et interprétez les résultats. formules au dessus
4. Utilisez les estimateurs de la question 2 pour compléter le tableau suivant :
3. 1
formules au dessus
xi yi yˆi ûi û i2 xiû i
3 5 4 1 1 3
2 2 3 -1 1 -2
1 3 2 1 1 1
-1 2 0 2 4 -2
0 -2 1 -3 9 0
5 5 5 5 5 5
ûi û i2 xiû i
P P P P P P
xi yi yˆi
i=1 i=1 i=1 i=1 i=1 i=1
5 10 10 0 16 0
5. Dessinez le nuage de point et la droite de régression estimée yˆi = bˆ0 + bˆ1xi.
6. Sur le graphique, localisez le point des moyennes (X¯ , Ȳ ). Que remarquez-
vous ?
7. Calculez σ̂ 2 et σ̂ 2ˆ .
β1
Exercice 2 : Quel effet ont le niveau d’étude et l’expérience professionnelle sur le salaire ?
Le fichier cps_small contient 1000 observations sur le salaire horaire (WAGE), le niveau
d’étude EDUC), l’expérience professionnelle EXPER) et d’autres variables d’une enquête
menée en 1997 aux États-Unis.
1. Obtenez le résumé statistique et l’histogramme des variables WAGE et EDUC.
Commentez les résultats.
2. Estimez la régression linéaire W AGE = b0 + b1EDU C + u et commentez les résul-
tats.
3. Retrouvez la variance des estimateurs.
4. Calculez les résidus et dessinez un graphique des résidus contre EDUC. Remarquez-
vous une tendance évidente ? Si les hypothèses vues en cours étaient vérifiées,
devrait-il y avoir une tendance évidente ? Rappelez l’hypothèse en question.
5. Quel est le salaire horaire d’un individu avec un niveau d’étude moyen ?
6. Construisez un intervalle de confiance à 95% autour de b0 et b1. Vérifiez que les
estimateurs sont significativement différents de 0 ?
7. Refaites les mêmes questions en remplaçant EDUC par EXPER ?
8. Quelle régression explique mieux la variation du salaire horaire ?