Université de Caen M1
TD no 3 : Régression linéaire multiple 1
Exercice 1. Soient Y1 , Y2 et Y3 3 var indépendantes telles que
Y1 = 2a − b + 1 ,
Y2 = a + b + 2 ,
Y3 = −a + 2b + 3 ,
où 1 , 2 et 3 sont 3 var iid suivant chacune la loi normale N (0, σ 2 ). Les paramètres a, b et σ
sont des réels inconnus.
1. Écrire le modèle linéaire associé sous la forme matricielle usuelle : Y = Xβ + , en indiquant
ce que sont ici Y , X, β et .
a de a et l’emco bb de b.
2. Calculer l’emco b
a, bb). Est-ce que b
3. Calculer C(b a et bb sont indépendantes ?
Exercice 2. On souhaite expliquer le nombre d’années d’études d’un enfant (unique) (variable
Y ) à partir du nombre d’années d’études de la mère (variable Xm ) et du nombre d’années d’études
du père (variable Xp ). On dispose du nombre d’années d’études de n = 20 enfants ainsi que des
données concernant leurs parents. En notant (y1 , xm,1 , xp,1 ), . . . , (yn , xm,n , xp,n ) ces n observations
de (Y, Xm , Xp ), on a les résultats numériques suivants :
n
X n
X n
X n
X n
X
x2m,i x2p,i yi xm,i yi xp,i xm,i xp,i
i=1 i=1 i=1 i=1 i=1
228 202 184 158 144
On adopte le modèle de rlm (sans terme constant pour simplifier) : pour tout i ∈ {1, . . . , n}, yi
est une réalisation de
Yi = axm,i + bxp,i + i ,
où 1 , . . . , n sont n var iid suivant chacune la loi normale N (0, σ 2 ). Les paramètres a, b et σ sont
des réels inconnus.
1. Écrire le modèle linéaire associé sous la forme matricielle usuelle : Y = Xβ + , en indiquant
ce que sont ici Y , X, β et .
2. Calculer l’emco βb de β. Donner l’emco ponctuel b de β.
3. Donner un estimateur σ b2 sans biais de σ 2 . En posant y = (y1 , . . . , yn )t et en adoptant les
−1
notations de la question 1, on donne ky − X (X t X) X t yk2 = 16.776, où k.k désigne la
norme euclidienne dans Rn . Donner l’estimation ponctuelle de σ.
4. Quelles sont les hypothèses adaptées à la situation suivante : "on souhaite affirmer, avec un
faible risque de se tromper, qu’en moyenne, le nombre d’années d’études de la mère et celui
du père n’ont pas le même effet sur le nombre d’années d’études de leur enfant" ?
C. Chesneau 1 TD no 3
Université de Caen M1
Exercice 3. On souhaite expliquer une variable quantitative Y à partir de 3 variables quantita-
tives X1 , X2 et X3 . On observe n = 18 valeurs de (Y, X1 , X2 , X3 ) notées (y1 , x1,1 , x2,1 , x3,1 ), . . . ,
(yn , x1,n , x2,n , x3,n ). On adopte le modèle de rlm : pour tout i ∈ {1, . . . , n}, yi est une réalisation
de
Yi = β0 + β1 x1,i + β2 x2,i + β3 x3,i + i ,
où 1 , . . . , n sont n var iid suivant chacune la loi normale N (0, σ 2 ). Les paramètres β0 , β1 , β2 , β3
et σ sont des réels inconnus.
1. Écrire le modèle linéaire associé sous la forme matricielle usuelle : Y = Xβ + , en indiquant
ce que sont ici Y , X, β et .
En posant y = (y1 , . . . , yn )t et en adoptant les notations de la question 1, les données recueillies
donnent :
555.5 0 0 0 −5.92
−1
0 3.6 −14.7 9.2 , b = (X t X)−1 X t y = 0.133
(X t X) = 10−4 0 −14.7 1219 3.8 0.55
0 9.2 3.8 1000 2.1
et ky − Xbk2 = 1.4, où k.k désigne la norme euclidienne dans Rn . Soit βb = (βb0 , βb1 , βb2 , βb3 )t , l’emco
de β = (β0 , β1 , β2 , β3 )t .
2. Exprimer βb en fonction de X et Y . Donner l’emco ponctuel de β.
3. Quelle est la loi de β,
b ainsi que celle de chacune de ses composantes : βb0 , βb1 , βb2 et βb3 ?
4. Est-ce que βb2 et βb3 sont indépendantes ? Calculer V(βb2 − 2βb3 ).
5. Donner un estimateur sans biais de σ 2 en fonction de X et Y . En déduire une estimation
ponctuelle de σ 2 .
6. Donner l’emco ponctuel de β2 et une estimation ponctuelle de la variance de βb2 .
7. On considère les hypothèses :
H0 : β2 = 0 contre H1 : β2 6= 0.
Peut-on rejeter H0 au risque 5% ?
Exercice 4. On considère le modèle : pour tout (u, i) ∈ {1, 2} × {1, . . . , 2m}, avec m ∈ N∗ ,
Yu,i = au + bu xu,i + u,i ,
où xu,i = (−1)u+i et 1,1 , . . . , 1,2m , 2,1 , . . . , 2,2m sont 4m var iid suivant chacune la loi normale
N (0, σ 2 ). Les paramètres a1 , a2 , b1 , b2 et σ sont inconnus.
1. Déterminer l’emco βb de β = (a1 , a2 , b1 , b2 )t .
2m b 1
2. Donner la loi de K = 2
kβ − βk2 , et la loi de K ∗ = K + 2 kY − X βk
b 2 , où k.k désigne la
σ σ
norme euclidienne dans R4m .
C. Chesneau 2 TD no 3