INSEA Boumahdi Ilyes
2ème année IE
2007-2008
Série2 : Régression linéaire multiple
Objectif :
Se familiariser avec la méthodologie d'estimation des modèles linéaires multiples
(MLM) en utilisant SPSS.
Appréhender certaines particularités des MLM : modèle centré, modélisation sous
contrainte, variables muettes,…
Analyser la validité d'un modèle.
Les données sont tirées de "économétrie, Damodar N.Gujarati".
Exercice1:
Objectif : Estimer un MLM sur SPSS.
Nous voulons modéliser la mortalité infantile (MI) en fonction du PIB/habitant
(PIBT) et le taux d'alphabétisation féminine (TAF) :
MIi = β0 + β1 PIBTi + β2 TAFi + εi
A cette fin, nous disposons de données relatives à 64 pays (mortaliteinfantile.sav)
1- Ecrire la forme matricielle de ce modèle en précisant les dimensions.
2- Appréhender le lien entre la variable dépendante et les variables explicatives
graphiquement et par un test adéquat.
3- Estimer les paramètres du modèle par SPSS.
4- Interpréter l'output (coefficients, signification, adéquation,…).
5- Quels sont les intervalles de confiance à 95% pour les coefficients β0, β1 et β2?
6- Estimer la mortalité infantile moyenne pour un pays ayant un PIBT de 2500$ et un
TAF de 81% et pour un pays ayant un PIBT de 25000$ et un TAF de 95%.
Evaluer la précision de ces prévisions par les intervalles de confiance. Que
remarquez-vous?
Exercice 2:
Objectif : Comprendre le mécanisme de la régression linéaire multiple en liaison avec
la régression linéaire simple.
On reprend les données de l'exercice précédemment avec le même objectif; à savoir,
modéliser la mortalité infantile (MI) en fonction du PIB/habitant (PIBT) et le taux
d'alphabétisation féminine (TAF). Cependant, la procédure est de faire une succession
de régression linéaire simple pour atteindre cet objectif.
1-On voudrait neutraliser l'effet du TAF sur la MI, d'une part, et sur le PIBT, d'autre
part. Quelles sont les MLS à estimer? (rappel: le résidu reflète la part non expliqué par
la variable explicative introduite dan le modèle).
2-Estimer ces deux modèles.
1
3-Estimer l'effet net du PIBT sur la MI en dehors de l'influence du TAF et ce, en
utilisant les résidus des deux régressions simples précédentes (avec ou sans
constante !!!?)
4-Comparer la pente de ce modèle avec le coefficient β1 estimé dans l'exercice 1.
Conclure.
5-Etant donné le modèle MIi = β0 + β1 PIBTi + εi. Quelle serait la contribution
marginale du TAF si on l'intègre au modèle.
6-Tester si la variable TAF devrait être intégré au modèle.
7-Comparer la statistique utilisée pour le dernier test avec la statistique de student du
coefficient de régression multiple relative à la variable TAF.
Exercice 3:
Objectif : Estimer un modèle sous contrainte.
Pour estimer la fonction de production cobb-Douglas pour le Mexique :
Yi = β1X2i2 X3i3eεi
on dispose de données relatives à la production Y, le facteur travail X2 et le facteur
capital X3 couvrant la période 1955-1974 (FCDmexique.sav).
1- Estimer le modèle après transformation.
2- Que représente β2 et β3? Interpréter les résultats.
3- Nous voulons tester si l'économie mexicaine était dans un cas de rendement
d'échelle constant ( ie β1 + β2=1) de deux manières :
a- Tester l'hypothèse de rendement d'échelle constant sur le modèle sans
contrainte.
b- Réécrire le modèle sous cette nouvelle contrainte.
c- Estimer le modèle.
d- Refaire le test de la validité de la contrainte.
Exercice 4:
Objectif : Introduire des variables explicatives qualitatives.
Considérant les données relatives le traitement salarial dans 51 états réparties en 3
régions (salaire.sav).
1- Quel(s) serai(en)t le(s) modèle(s) à considérer pour tester s'il y a une différence
significative entre les salaires des 3 régions.
2- Estimer le(s) modèle(s).
3- Interpréter les résultats en donnant la signification des coefficients.
4- Intégrer la variable d'échelle relative à la dépense par élève dans les écoles
publiques et interpréter les résultats.
Exercice 4:
Objectif : Manipuler les formules.
Soit n=474 observations relatives aux salariés d'une banque (employes.sav). Nous
nous intéressons à l'explication du salaire actuel (salact) en fonction du salaire
d'embauche (saldeb) et l'expérience (exp). Nous avons les résultas suivants:
V(salact)= 291578214,45 ; rsalact,saldeb= 0,8801 ; rsaldeb,exp= 0,0451 ; rsalact,exp= -0.0975
; moyenne(salact)= 34419,57 $.
2
1- La régression simple de salact par saldeb est donnée par : salact = 1,909 * saldeb +
1928,206
Tester la signification du coefficient du salaire d'embauche.
2- La régression simple de salact par exp est donnée par : salact = 35945,029 –
15,913 * exp
Tester la signification du coefficient de l'expérience.
3- Estimer les coefficients du modèle de régression multiple salacti = β0 + β1 saldebi +
β2 expi + εi , et calculer son terme d'adéquation R².
4- Tester la signification de β1 et β2 ainsi que la signification globale du modèle.
Exercice 4:
Objectif : Récapituler, analyser la validité d'un modèle et choisir le meilleur modèle.
1- Utiliser SPSS sur le fichier employe.sav de l'exercice précédent pour vérifier
les résultats obtenus manuellement.
2- Analyser les résidus pour tester la validité du modèle.
3- Localiser les valeurs aberrantes à l'aide des résidus.
4- Refaire l'estimation après transformation logarithmique et conclure.
5- Construire le modèle adéquat par la méthode pas à pas pour prédire le salaire
d'embauche en fonction de l'âge, du sexe, de l'expérience et du niveau
d'éducation.
6- Interpréter les résultats à chaque étape du déroulement de l'algorithme de
sélection.
7- Interpréter l'équation obtenue.
8- Y-a-t il un traitement discriminatoire des salaires par sexe?