0% ont trouvé ce document utile (0 vote)

46 vues29 pages

Outilsdiag

Le document traite des outils diagnostiques en régression linéaire, en mettant l'accent sur l'impact des observations atypiques sur les estimations. Il présente des mesures d'influence telles que la distance de Cook et DFBETAS, ainsi que des méthodes pour évaluer et gérer ces observations. Enfin, il suggère des approches pour traiter les données influentes afin d'améliorer la validité du modèle.

Transféré par

Ines

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PPT, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

46 vues29 pages

Outilsdiag

Transféré par

Ines

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PPT, PDF, TXT ou lisez en ligne sur Scribd

La régression linéaire

Outils diagnostiques

Alice Guéguen
Inserm U687/IFR69
Introduction

Le modèle peut être correct pour la presque totalité

de l’échantillon : linéarité, variance constante et
normalité et indépendance des erreurs.
Mais, la présence de quelques observations
atypiques peut remettre en cause les estimations
obtenues.

2
Une variable explicative

X
avec observation atypique

3
Une variable explicative

avec observation atypique

sans observation atypique

4
Y

avec observation atypique

5
Y

avec observation atypique

sans observation atypique

6
Y

avec observation atypique

7
Y

avec observation atypique

sans observation atypique

8
Exemple illustratif
Simulation d’un échantillon de 100 observations
pour lequel le modèle est correct
Y

X1
Exemple illustratif
Simulation d’un échantillon de 100 observations
pour lequel le modèle est correct
Addition de 3 observations atypiques

104
Y

101

107

10
X1
Les éléments diagonaux de la
matrice chapeau H

Y = Xβ + e e ∝ N(0, σ 2In )

Ŷ = Xβ̂ = X( X' X)-1 X' Y = HY

ŷ i = h1i y1 + h2i y 2 +  + hii y i +  + hni y n

ŷ i est une combinaison linéaire des valeurs observées

hii représente le poids de la ième observation y j sur la ième
valeur prédite ŷ i

11
Les éléments diagonaux de la
matrice chapeau H
1 ( x i  x )2
Une variable explicative hii  
n  i ( x i  x )2

Deux variables
explicatives

X1
Les éléments diagonaux de la
matrice chapeau H

La valeur moyenne des hii est h =p n

( p est le nombre de coefficients du modèle)
2p
Observations à examiner hii >
n

13
48
107
2
1
x2
0-1

101
-2

-2 -1 0 1
+------------------------------------------------+2
x1
| id y x1 x2 leverage |
|------------------------------------------------|
| 48 3.00 1.85 2.39 .081 |
| 101 0 2 -2 .138 |
14
| 107 -4 -2.04 2.06 .140 |
+------------------------------------------------+
Résidus

Résidu ri = y i - ŷ i

Bien que les ei soient indépendants et de même variance,

il n’en est pas de même pour les résidus.
var(ri ) = σ 2 (1 - hii )

Les observations avec des hii élevées ont des résidus plus
petits ; elles attirent le plan de régression.

15
Résidus
Résidu standardisé
ri
rs tan d i = où s2 = ∑ ri2 (n - p) = σ̂ 2
s 1 - hii
Le numérateur ri et le dénominateur s ne sont pas
indépendants.
Résidu studentisé
ri où s²(-i) est l’estimation de σ² obtenue
rstud i = à partir de toutes les observations
s(-i) 1 - hii
exceptée i
rstudi ∝ t n-p-1

Observations à examiner |rstud| >2

16
+---------------------------------------+
| id y x1 x2 studres |
|---------------------------------------|
| 31 3.78 0.57 0.80 2.17 |
| 66 -0.13 1.08 1.38 -2.21 |
| 77 -3.39 -0.33 -0.28 -2.57 |
| 91 -1.79 -0.06 0.86 -2.24 |
| 104 3.5 0.0 0.0 3.10 |
| 107 -4.0 -2.04 2.06 -3.66 |
+---------------------------------------+

17
Mesures d’influence
Une observation a d’autant plus d’influence sur
l’estimation des coefficients qu’ elle est à la fois « hors
norme » pour les covariables et « hors norme » pour la
réponse Y conditionnellement aux covariables.

Distance de Cook
(β̂ - β̂( -i ) )' ( X' X )(β̂ - β̂( -i ) )
Distance entre β̂ et β̂( -i ) =
ps 2
rs2tan d i hii
dcook i =
p 1 - hii

4
Observations à examiner dcook i >
n-p
18
4
104

31
2
Studentized residuals

100
0

37
1881 101
4
48
-2

91 66
77

107
-4

0 .05 .1 .15
Leverage

La taille de chaque observation est proportionnelle à la

distance de Cook 19
Influence sur les coefficients
DFBETAS
Mesure l’influence de l’observation i sur le jème coefficient
β̂ j - β̂(-i)j
DFBETAS ij =
s(-i) ( X' X) jj1

Une valeur DFBETA positive indique que la présence de

l’observation i augmente la valeur du coefficient.

2
Observations à examiner DFBETA i >
n

20
+-------------------------------------+
| id y x1 x2 dfx1 |
|-------------------------------------|
| 8 -3.47 -1.55 -0.47 .21 |
| 20 4.90 1.62 1.70 .20 |
| 25 -0.35 1.13 0.65 -.21 |
| 94 -0.38 1.14 0.41 -.21 |
| 107 -4.0 -2.04 2.06 1.18 |
+-------------------------------------+

21
Graphe de régression partielle
(partial regression plot ou added variable plot)

Ce graphe permet de visualiser les observations influentes sur

le coefficient de régression associé à X1
• régression de X1 sur X2 résidu resX1_X2
• régression de Y sur X2 résidu resY_X2

• régression de resY_X2 sur resX1_X2

le coefficient obtenu est le même que celui qui résulte du
modèle de régression multiple.
les résidus sont les mêmes que ceux du modèle de
régression multiple. 22
Graphe de régression partielle
(partial regression plot ou added variable plot)

4
2
0
-2
-4
-6

-4 -2 0 2 4
Residuals

23
Graphe de régression partielle
(partial regression plot ou added variable plot)

4
2 0 20
Residuals

94
25
-2

8
-4
-6

107

-4 -2 0 2 4
Residuals

La taille de chaque observation est proportionnelle au

DFBETA associé à X1 24
Influence sur les variance des
paramètres
COVRATIO
Mesure de l’influence de l’observation i sur les variances
des paramètres
det (var(β̂( -i) )) s(2-i) p
1
cov ratioi =
det (var(β̂))
= (s )
2
1 - hii

Une valeur de covratio supérieure à 1 indique que la

présence de l’observation diminue la variance des
paramètres.
3p
Observations à examiner cov ratioi - 1 >
n
25
+-------------------------------------+
| id y x1 x2 covratio |
|-------------------------------------|
| 101 0.0 2.0 -2.0 1.19 |
| 104 3.5 0.0 0.0 .79 |
| 107 -4.0 -2.04 2.06 .82 |
+-------------------------------------+

La présence de l’observation 104 au centre du nuage

des covariables X1,X2 et située sur en dehors du
plan de régression fait augmenter la variance des
estimations.
La présence de l’observation 101 « hors norme » dans
le plan des covariables X1,X2 et située sur le plan de
régression fait diminuer la variance des estimations.
26
Influence conjointe de
plusieurs observations

Difficile de généraliser les mesures d’influence à des

couples ou des triplets d’observations

Solution graphique : graphe de régression partielle

27
Que faire des observations
influentes?
• Vérification des données
• Transformation des variables
une ou plusieurs covariables de manière à ramener
les observations « hors norme » vers le centre du
nuage des covariables.
la variable Y pour se rapprocher d’une distribution
normale

28
Que faire des observations
influentes?
Observations ayant un résidu élevé et non « hors
norme » pour les covariables
• peuvent suggérer qu’il manque une covariable dans le
modèle
Observations « hors norme » pour les covariables
• influence sur les estimations des coefficients et/ou sur
leur variance
• ont des caractéristiques très différentes du reste de
l’échantillon
Définition de la population de l’étude
29

Vous aimerez peut-être aussi

Régression Linéaire Simple et Modèles Statistiques
100% (1)
Régression Linéaire Simple et Modèles Statistiques
51 pages
Introduction à la régression multiple
Pas encore d'évaluation
Introduction à la régression multiple
83 pages
Introduction à la régression linéaire
Pas encore d'évaluation
Introduction à la régression linéaire
6 pages
Modèle de régression linéaire simple
Pas encore d'évaluation
Modèle de régression linéaire simple
20 pages
Partie 2-1 Régression Linéaire Simple
Pas encore d'évaluation
Partie 2-1 Régression Linéaire Simple
25 pages
Régression et Corrélation: Guide SEO
100% (1)
Régression et Corrélation: Guide SEO
33 pages
Analyse de la régression linéaire
Pas encore d'évaluation
Analyse de la régression linéaire
126 pages
Régression Linéaire et Logistique expliquées
Pas encore d'évaluation
Régression Linéaire et Logistique expliquées
51 pages
Régression Linéaire Simple: Concepts et Estimations
Pas encore d'évaluation
Régression Linéaire Simple: Concepts et Estimations
7 pages
Regression Linéaire Simple PDF
Pas encore d'évaluation
Regression Linéaire Simple PDF
7 pages
Chapitre 2 - R├йgression Lin├йaire
100% (1)
Chapitre 2 - R├йgression Lin├йaire
38 pages
Modèle de régression linéaire simple
Pas encore d'évaluation
Modèle de régression linéaire simple
11 pages
Analyse de la variance et régression linéaire
Pas encore d'évaluation
Analyse de la variance et régression linéaire
4 pages
Régression Linéaire et Moindres Carrés
Pas encore d'évaluation
Régression Linéaire et Moindres Carrés
53 pages
Introduction à la régression linéaire
Pas encore d'évaluation
Introduction à la régression linéaire
11 pages
Modèle de régression multiple expliqué
Pas encore d'évaluation
Modèle de régression multiple expliqué
17 pages
Chap2 Regression
Pas encore d'évaluation
Chap2 Regression
78 pages
Modèle de régression linéaire simple
100% (1)
Modèle de régression linéaire simple
69 pages
Econométrie L3 2023-24
Pas encore d'évaluation
Econométrie L3 2023-24
51 pages
Méthode Linéaire Gaussienne Simple
Pas encore d'évaluation
Méthode Linéaire Gaussienne Simple
60 pages
Guide sur la régression multiple et ses tests
Pas encore d'évaluation
Guide sur la régression multiple et ses tests
3 pages
Guide sur la régression multiple et ses tests
Pas encore d'évaluation
Guide sur la régression multiple et ses tests
3 pages
Techniques Prédictives en Data Mining
Pas encore d'évaluation
Techniques Prédictives en Data Mining
151 pages
Cours m1 Econometrie Appliquee Slide34
100% (2)
Cours m1 Econometrie Appliquee Slide34
60 pages
Prévisions Quantitatives et Régression
100% (6)
Prévisions Quantitatives et Régression
25 pages
Modèle de régression linéaire simple
Pas encore d'évaluation
Modèle de régression linéaire simple
27 pages
Cours Reg
Pas encore d'évaluation
Cours Reg
34 pages
Cours d'Économétrie : Régression Linéaire
Pas encore d'évaluation
Cours d'Économétrie : Régression Linéaire
42 pages
Statistique Bivariée
Pas encore d'évaluation
Statistique Bivariée
9 pages
Variables Expliquées et Explicatives
Pas encore d'évaluation
Variables Expliquées et Explicatives
20 pages
Introduction à l'économétrie et variance
Pas encore d'évaluation
Introduction à l'économétrie et variance
19 pages
Cours de Statistique Appliquée ENCG Oujda
Pas encore d'évaluation
Cours de Statistique Appliquée ENCG Oujda
27 pages
La Regression
Pas encore d'évaluation
La Regression
3 pages
Analyse Statistique et Géostatistique des Données
Pas encore d'évaluation
Analyse Statistique et Géostatistique des Données
25 pages
Modèles Linéaires et Moindres Carrés
Pas encore d'évaluation
Modèles Linéaires et Moindres Carrés
20 pages
Introduction à la régression linéaire
Pas encore d'évaluation
Introduction à la régression linéaire
9 pages
TP5 Methodes Inductives - RL
Pas encore d'évaluation
TP5 Methodes Inductives - RL
4 pages
Concepts de Régression Linéaire
Pas encore d'évaluation
Concepts de Régression Linéaire
92 pages
Modélisation Linéaire et ANOVA
Pas encore d'évaluation
Modélisation Linéaire et ANOVA
46 pages
Introduction à la régression linéaire simple
Pas encore d'évaluation
Introduction à la régression linéaire simple
37 pages
ST M Modlin Regmult
Pas encore d'évaluation
ST M Modlin Regmult
13 pages
Régression Linéaire: Concepts et Calculs
Pas encore d'évaluation
Régression Linéaire: Concepts et Calculs
16 pages
Analyse de la régression linéaire multiple
Pas encore d'évaluation
Analyse de la régression linéaire multiple
31 pages
Question de Cours en Analyse Des Donnees S5
Pas encore d'évaluation
Question de Cours en Analyse Des Donnees S5
5 pages
Introduction à la régression multiple
100% (2)
Introduction à la régression multiple
60 pages
TD Stat 2022
Pas encore d'évaluation
TD Stat 2022
7 pages
7.cours Regression
Pas encore d'évaluation
7.cours Regression
8 pages
Exercice de Régression Linéaire Simple
Pas encore d'évaluation
Exercice de Régression Linéaire Simple
6 pages
ECONOMETRIEsérie 01
Pas encore d'évaluation
ECONOMETRIEsérie 01
6 pages
CHAPITRE II MODELE DE REGRESSION LINEAIRE SIMPLE - Copie - Copie
Pas encore d'évaluation
CHAPITRE II MODELE DE REGRESSION LINEAIRE SIMPLE - Copie - Copie
26 pages
Régression multiple : Modèles et Estimations
Pas encore d'évaluation
Régression multiple : Modèles et Estimations
22 pages
Introduction à l'économétrie et régression
100% (1)
Introduction à l'économétrie et régression
39 pages
Analyse de la variance et régression linéaire
Pas encore d'évaluation
Analyse de la variance et régression linéaire
10 pages
Econométrie I: Mounir JERRY Année Universitaire 2021-2022
Pas encore d'évaluation
Econométrie I: Mounir JERRY Année Universitaire 2021-2022
68 pages
Ajustement Linéaire Hqse
Pas encore d'évaluation
Ajustement Linéaire Hqse
30 pages
Correction Examen Méthode Économétriques 2024 Rattrapage
Pas encore d'évaluation
Correction Examen Méthode Économétriques 2024 Rattrapage
5 pages
Modèle de régression linéaire multiple
Pas encore d'évaluation
Modèle de régression linéaire multiple
8 pages
Econométrie I 17 18
Pas encore d'évaluation
Econométrie I 17 18
31 pages
FR Tanagra Outlier Influential Points For Regression
Pas encore d'évaluation
FR Tanagra Outlier Influential Points For Regression
12 pages
Macro Mass Avril2001
Pas encore d'évaluation
Macro Mass Avril2001
3 pages
Poly MacroMass N6
Pas encore d'évaluation
Poly MacroMass N6
13 pages
Poly MacroMass N1
Pas encore d'évaluation
Poly MacroMass N1
10 pages
Analyse des variables nominales avec TANAGRA
Pas encore d'évaluation
Analyse des variables nominales avec TANAGRA
15 pages
Coefficients de régression en PLS1
Pas encore d'évaluation
Coefficients de régression en PLS1
11 pages
Fonctions et Graphiques en 1ère L
Pas encore d'évaluation
Fonctions et Graphiques en 1ère L
5 pages
Introduction aux Nombres Complexes
Pas encore d'évaluation
Introduction aux Nombres Complexes
78 pages
C fonctionsCyclometriquesSOLUTIONS
100% (1)
C fonctionsCyclometriquesSOLUTIONS
12 pages
Algorithmes Récursifs : Exemples Pratiques
Pas encore d'évaluation
Algorithmes Récursifs : Exemples Pratiques
1 page
Dérivation Numérique et DL3 Optimisé
Pas encore d'évaluation
Dérivation Numérique et DL3 Optimisé
2 pages
Licence Calcul Differentiel
100% (2)
Licence Calcul Differentiel
95 pages
Limites et Convergences des Suites
Pas encore d'évaluation
Limites et Convergences des Suites
2 pages
Correction Examen Analyse L1PCSM S2 2019
Pas encore d'évaluation
Correction Examen Analyse L1PCSM S2 2019
3 pages
Cours de Systemes Asservis
Pas encore d'évaluation
Cours de Systemes Asservis
78 pages
Compléments d'algèbre linéaire 2001
100% (1)
Compléments d'algèbre linéaire 2001
11 pages
Cor pb004
Pas encore d'évaluation
Cor pb004
2 pages
Analyse Numerique PDF
83% (6)
Analyse Numerique PDF
490 pages
Preuve du théorème de Cauchy linéaire
Pas encore d'évaluation
Preuve du théorème de Cauchy linéaire
1 page
Serie3 Les Fonctions Et Récursivité
Pas encore d'évaluation
Serie3 Les Fonctions Et Récursivité
6 pages
Ch3 MGC-800
Pas encore d'évaluation
Ch3 MGC-800
93 pages
Examen Blanc 2ème Bac PC-SVT
Pas encore d'évaluation
Examen Blanc 2ème Bac PC-SVT
3 pages
Courbes Parametrees Coniques PDF
Pas encore d'évaluation
Courbes Parametrees Coniques PDF
24 pages
Corrigés de Maths Terminale : Polynômes et Dérivées
Pas encore d'évaluation
Corrigés de Maths Terminale : Polynômes et Dérivées
23 pages
Résolution d'équations du 2nd degré
Pas encore d'évaluation
Résolution d'équations du 2nd degré
5 pages
Suites de Nombres Réels : Concepts Clés
Pas encore d'évaluation
Suites de Nombres Réels : Concepts Clés
20 pages
RT TD3 Graphe&Optimisation 23-24
Pas encore d'évaluation
RT TD3 Graphe&Optimisation 23-24
3 pages
677fa9a6a0cbf - Fiche Méthode Problèmes Du Premier Et Problèmes Du Second Degré
Pas encore d'évaluation
677fa9a6a0cbf - Fiche Méthode Problèmes Du Premier Et Problèmes Du Second Degré
4 pages
MAT145 20233 Plan
Pas encore d'évaluation
MAT145 20233 Plan
7 pages
Mécanique Rationnelle : Calcul Vectoriel
100% (1)
Mécanique Rationnelle : Calcul Vectoriel
379 pages
Approximations Linéaires et Gradient
100% (1)
Approximations Linéaires et Gradient
24 pages
TD1 StatInf
Pas encore d'évaluation
TD1 StatInf
2 pages
Analyse5 Serie1 Ouakrim
Pas encore d'évaluation
Analyse5 Serie1 Ouakrim
4 pages
14 Formes Bilinéaires Symétriques Et Formes Quadratiques
100% (1)
14 Formes Bilinéaires Symétriques Et Formes Quadratiques
23 pages
Corrigé d'Algèbre ENS Cachan
Pas encore d'évaluation
Corrigé d'Algèbre ENS Cachan
17 pages
Cours 03 Limites Continuite
Pas encore d'évaluation
Cours 03 Limites Continuite
12 pages