0% ont trouvé ce document utile (0 vote)

19 vues5 pages

Comprendre la multicolinéarité en régression

Multicollinearity

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

19 vues5 pages

Comprendre la multicolinéarité en régression

Multicollinearity

Transféré par

zeydane80

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

. . . . . . . . . . . . . . . . . . . . . .

Le problème de la multicolinéarité . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . .
Sidi Mohamed MAOULOUD
. . . . . . . . . . . . . . . . . . . . . .
28 novembre 2015
. . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . .

Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 1 / 18 Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 2 / 18

Définition et conséquences
. . . . . . . . . . . . . . . . . . . . . .

La multicolinéarité est le fait qu’une variable explicative est une . . . . . . . . . . . . . . . . . . . . . .

combinaison linéaire des autres variables explicatives. Par exemple si
une variable X3 en faisant la somme pondérée de deux autres . . . . . . . . . . . . . . . . . . . . . .
variables X1 et X2 , par exemple X3 = 2X1 + 3X2 , alors X1 , X2 et X3
seront multicolinéaires et on parle de multicolinéarité parfaite. . . . . . . . . . . . . . . . . . . . . . .
En pratique on rencontre rarement ce genre de situation. Par contre,
on rencontre assez souvent la situation où X3 est très proche d’une . . . . . . . . . . . . . . . . . . . . . .
combinaison linaire de X1 et X3 . Cela veut dire que la régression de
X3 sur X1 et X2 est très significative. . . . . . . . . . . . . . . . . . . . . . .
Dans ce cas la variable X3 partage une partie de sa variabilité avec X1
et X2 . . . . . . . . . . . . . . . . . . . . . . .

Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 3 / 18 Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 4 / 18
Conséquences
Si la multicolinéarité est parfaite alors la matrice (X T X )−1 n’est pas . . . . . . . . . . . . . . . . . . . . . .
inversible, l’estimateur MCO n’est pas calculable
. . . . . . . . . . . . . . . . . . . . . .
Lorsque l’une des variables explicatives est proche d’une combinaison
linaire des autres variables alors X T X serait mal conditionnée
. . . . . . . . . . . . . . . . . . . . . .
(det(X T X ) proche de 0). (X T X )−1 aura des éléments très grands.
En cas de multicolinéarité, certaines des variances estimées des . . . . . . . . . . . . . . . . . . . . . .
coefficients vont être très grands
L’écart-type σ̂âi d’un coefficient ai est un indicateur de la stablité de . . . . . . . . . . . . . . . . . . . . . .
l’estimation de ce dernier. Si σ̂âi est du même ordre de grandeur que
ai , ce dernier est mal déterminé . . . . . . . . . . . . . . . . . . . . . .
Les t de Student sont sous-estimés, certaines variables ne paraissent
pas significatives . . . . . . . . . . . . . . . . . . . . . .
Les valeurs et signes de certains coefficients sont contradictoires :
coefficient d’une variable explicative négatif alors que la corrélation de
celle-ci avec y est positive.
Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 5 / 18 Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 6 / 18

Comment détecter la multicolinéarité

. . . . . . . . . . . . . . . . . . . . . .

Critère de Klein. Il s’agit simplement d’un critère de présomption de . . . . . . . . . . . . . . . . . . . . . .

la multicolinéarité. Il y a présomption de multicolinéarité si au moins
un des rxi ,xj élevé au carré est supérieur au R 2 . . . . . . . . . . . . . . . . . . . . . .
Le test de Farrar et Glauber teste les hypothèses H0 : Absence de
multicolinéartié et H1 : présence de multicolinéartié. Soit R la matrice . . . . . . . . . . . . . . . . . . . . . .
des corrélations des variables explicative. Ce test est basé sur la
statistique du . . . . . . . . . . . . . . . . . . . . . .

χ2 = − (n − 1 − (2p + 7)/6) ln(|R|) ∼ χ2p(p+1)/2 . . . . . . . . . . . . . . . . . . . . . .

Il y présomption de multicolinéarité si χ2 > χ21−α;p(p+1)/2 . . . . . . . . . . . . . . . . . . . . . .

Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 7 / 18 Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 8 / 18
Tolérance
. . . . . . . . . . . . . . . . . . . . . .
Pour diagnostiquer la multicolinéarité, on régresse chacune des VEs
sur les autres et on calcule le Rj2 . . . . . . . . . . . . . . . . . . . . . . .
Le coefficient de détermination Rj2 représente la part de variabilité de
. . . . . . . . . . . . . . . . . . . . . .
Xj qui est expliquée par les autres.
Idéalement ce Rj2 doit être faible et par conséquent 1 − Rj2 doit être
. . . . . . . . . . . . . . . . . . . . . .
grand
1 − Rj2 représente la partie de la variable qui n’est pas expliquée par . . . . . . . . . . . . . . . . . . . . . .
les autres variables et est donc la partie de Xj qui est susceptible
d’améliorer le modèle. . . . . . . . . . . . . . . . . . . . . . .
1 − Rj2 est appelée tolérance de la variable Xj . Idéalement elle doit
elle doit être le plus élevé possible. Si la tolérance¡ 0.10, il n’est pas . . . . . . . . . . . . . . . . . . . . . .
prudent (et en tout cas probablement peu intéressant) d’inclure la VE
dans les analyses en plus des VEs qui la prédisent.

Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 9 / 18 Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 10 / 18

Facteur d’inflation de la variance

On définit le facteur d’inflation de la variance par VIFj = 1/(1 − Rj2 ) . . . . . . . . . . . . . . . . . . . . . .
où Rj2 est le coefficient de détermination de la régression de la VE Xj
sur les autres VEs . . . . . . . . . . . . . . . . . . . . . .
V (â )
On peut montrer que VIFj = Vmin (âj j ) ici V (âj ) désigne la variance du
. . . . . . . . . . . . . . . . . . . . . .
coefficient de la VE j dans le modèle contenant toutes les VEs et
Vmin (âj ) est la petite variance du coefficient de la VE j dans un . . . . . . . . . . . . . . . . . . . . . .
modèle contenant la VE j c-à-d, le modèle de régression simple. C’est
ainsi qu’on l’appelle facteur d’inflation de la variance
. . . . . . . . . . . . . . . . . . . . . .
Dans le cas ou la VE j est indépendantes des autres VEs alors
VIFj = 1 donc pas d’inflation . . . . . . . . . . . . . . . . . . . . . .
On peut calculer plus simplement les VIFj en inversant la matrice de
corrélation des VEs et en prenant les éléments diagonaux de cette . . . . . . . . . . . . . . . . . . . . . .
dernière.
Comme pour la tolérance, il n’est pas prudent d’inclure une VE dont
la VIF dépasse 10, dans les analyses en plus des VEs qui la prédisent.
Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 11 / 18 Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 12 / 18
Coefficient de corrélation partielle
. . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . .
On définit le coefficient de corrélation partielle, noté ici rx1 ,x2 |x3 ,···xp ,
permet de connaı̂tre la valeur de la corrélation entre deux variables x1 . . . . . . . . . . . . . . . . . . . . . .
et x2 , si les variables x3 , · · · xp étaient demeurées constantes pour la
série d’observations considérées. . . . . . . . . . . . . . . . . . . . . . .
Autrement, le coefficient de corrélation partielle rx1 ,x2 |x3 ,···xp est le
coefficient de corrélation totale entre les variables x1 et x2 quand on . . . . . . . . . . . . . . . . . . . . . .
leur a retiré leur meilleure explication linéaire en termes de x1 , · · · xp .
Il est donné par re1 ,e2 où e1 et e2 sont résidus des régressions de x1 est . . . . . . . . . . . . . . . . . . . . . .
x2 sur les autres variables.
. . . . . . . . . . . . . . . . . . . . . .

Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 13 / 18 Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 14 / 18

Coefficient de corrélation partielle

. . . . . . . . . . . . . . . . . . . . . .
On peut montrer que
. . . . . . . . . . . . . . . . . . . . . .
rx1 ,x2 − rx1 ,x3 rx2 ,x3
rx1 ,x2 |x3 = q
(1 − rx21 ,x3 )(1 − rx22 ,x3 ) . . . . . . . . . . . . . . . . . . . . . .

Cette formule se généralise et permet de calculer de proche en proche . . . . . . . . . . . . . . . . . . . . . .

Une corrélation partielle r est significative si . . . . . . . . . . . . . . . . . . . . . .

(n − d − 2)r 2 /(1 − r 2 ) > f1−α;n−d−2 où d est le nombre de variables
fixées.

Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 15 / 18 Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 16 / 18
Comment corriger le problème de multicolinéarité
. . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . .

Utiliser une des procédure de sélection de modèle pour choisir un . . . . . . . . . . . . . . . . . . . . . .

modèle contenant moins de variables
Effectuer une ACP sur les variables explicatives et utiliser les . . . . . . . . . . . . . . . . . . . . . .
premières composantes principales comme variables explicative es
hypothèses suivantes . . . . . . . . . . . . . . . . . . . . . .
Régression Ridge
Régression PLS . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . .

Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 17 / 18 Sidi Mohamed MAOULOUD Le problème de la multicolinéarité 28 novembre 2015 18 / 18

Vous aimerez peut-être aussi

Économétrie et Multicolinéarité
100% (1)
Économétrie et Multicolinéarité
298 pages
Violations des Hypothèses en Régression
Pas encore d'évaluation
Violations des Hypothèses en Régression
28 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
71 pages
Corrélation partielle et multicolinéarité
Pas encore d'évaluation
Corrélation partielle et multicolinéarité
37 pages
Multicolinéarité et Modèles Optimaux
Pas encore d'évaluation
Multicolinéarité et Modèles Optimaux
46 pages
1 La Multicolinéarité
100% (1)
1 La Multicolinéarité
5 pages
Statistique à Deux Variables : Corrélations
Pas encore d'évaluation
Statistique à Deux Variables : Corrélations
16 pages
Multicolinéarité en économétrie expliquée
Pas encore d'évaluation
Multicolinéarité en économétrie expliquée
29 pages
Corrélation et Régression Linéaire
Pas encore d'évaluation
Corrélation et Régression Linéaire
7 pages
Econometrie II
100% (1)
Econometrie II
40 pages
Détection et Solutions à la Multicolinéarité
Pas encore d'évaluation
Détection et Solutions à la Multicolinéarité
7 pages
Dérivation de La Formule Du Coefficient de Corrélation Partielle
Pas encore d'évaluation
Dérivation de La Formule Du Coefficient de Corrélation Partielle
17 pages
ST M Modlin Regmult
Pas encore d'évaluation
ST M Modlin Regmult
13 pages
Unité 11 PDF
Pas encore d'évaluation
Unité 11 PDF
18 pages
Initiation à SAS: Économétrie et Statistiques
Pas encore d'évaluation
Initiation à SAS: Économétrie et Statistiques
75 pages
Multicolinéarité et Modèle Optimal
Pas encore d'évaluation
Multicolinéarité et Modèle Optimal
23 pages
Cours Acp Handout
Pas encore d'évaluation
Cours Acp Handout
10 pages
2nde 2022 2023 Cours Statistiques
Pas encore d'évaluation
2nde 2022 2023 Cours Statistiques
14 pages
Cours12 Diagnostique de La Multicolinéairité
Pas encore d'évaluation
Cours12 Diagnostique de La Multicolinéairité
52 pages
Devoir sur la projection orthogonale et régression linéaire
Pas encore d'évaluation
Devoir sur la projection orthogonale et régression linéaire
8 pages
Banque Commune D'épreuves (BCE) 2010 ECE Mathématiques 3-HEC Ca
Pas encore d'évaluation
Banque Commune D'épreuves (BCE) 2010 ECE Mathématiques 3-HEC Ca
17 pages
Classe modale et statistiques des céréales
Pas encore d'évaluation
Classe modale et statistiques des céréales
7 pages
Résumé Mathématiques 12ème Année
Pas encore d'évaluation
Résumé Mathématiques 12ème Année
6 pages
Chap2 Econométrie
Pas encore d'évaluation
Chap2 Econométrie
31 pages
Resume Finall
Pas encore d'évaluation
Resume Finall
6 pages
Multicolinéarité Et Sélection Du Modèle Optimal
Pas encore d'évaluation
Multicolinéarité Et Sélection Du Modèle Optimal
8 pages
Corrélations et propriétés des MCO
Pas encore d'évaluation
Corrélations et propriétés des MCO
11 pages
Introduction à la Régression Multiple
Pas encore d'évaluation
Introduction à la Régression Multiple
11 pages
Résumés numériques : Moyennes et Corrélations
Pas encore d'évaluation
Résumés numériques : Moyennes et Corrélations
25 pages
Hétéroscédasticité et Multicolinéarité en Économie
Pas encore d'évaluation
Hétéroscédasticité et Multicolinéarité en Économie
49 pages
Problèmes de colinéarité en économie
Pas encore d'évaluation
Problèmes de colinéarité en économie
9 pages
Inférence Statistique en Régression Multiple
Pas encore d'évaluation
Inférence Statistique en Régression Multiple
18 pages
S6 Econométrie Multicolinearité 19 20 PDF
Pas encore d'évaluation
S6 Econométrie Multicolinearité 19 20 PDF
46 pages
Statistiques Appliquées en MSP avec R
Pas encore d'évaluation
Statistiques Appliquées en MSP avec R
55 pages
Statistiques Bac Sciences 2009
Pas encore d'évaluation
Statistiques Bac Sciences 2009
10 pages
Régression Linéaire Multiple et Corrélations
Pas encore d'évaluation
Régression Linéaire Multiple et Corrélations
6 pages
Méthodes d'Analyse Numérique et Erreurs
Pas encore d'évaluation
Méthodes d'Analyse Numérique et Erreurs
9 pages
C02 - Indépendance
Pas encore d'évaluation
C02 - Indépendance
39 pages
Notes sur la régression multiple en économétrie
Pas encore d'évaluation
Notes sur la régression multiple en économétrie
121 pages
Resume de Statistique Descriptive Unidimensionnelle
Pas encore d'évaluation
Resume de Statistique Descriptive Unidimensionnelle
5 pages
Statistique 4sc-Exp
Pas encore d'évaluation
Statistique 4sc-Exp
11 pages
Statistiques Descriptives et Probabilités
100% (1)
Statistiques Descriptives et Probabilités
33 pages
Chapitre 4 L3EQ Econométrie I
Pas encore d'évaluation
Chapitre 4 L3EQ Econométrie I
7 pages
Cours Econometrie M1 2024
Pas encore d'évaluation
Cours Econometrie M1 2024
85 pages
Modèle de Régression Linéaire Multiple
100% (2)
Modèle de Régression Linéaire Multiple
65 pages
Économétrie : Modèles Linéaires et Tests
Pas encore d'évaluation
Économétrie : Modèles Linéaires et Tests
64 pages
Rappels Seconde 1ere Et Toutes Formules Tle Ok
Pas encore d'évaluation
Rappels Seconde 1ere Et Toutes Formules Tle Ok
18 pages
Correction Exercice 4 Et 5 de Série 1
Pas encore d'évaluation
Correction Exercice 4 Et 5 de Série 1
2 pages
Support de Cours Séance N°6 Econométrie 2020 2021
Pas encore d'évaluation
Support de Cours Séance N°6 Econométrie 2020 2021
12 pages
Cours de Statistiques Descriptives
Pas encore d'évaluation
Cours de Statistiques Descriptives
43 pages
Effet des Dépenses Ménagères sur l'Alimentation
100% (1)
Effet des Dépenses Ménagères sur l'Alimentation
17 pages
Régression linéaire multiple expliquée
Pas encore d'évaluation
Régression linéaire multiple expliquée
50 pages
L'econométrie - La Règression PDF
100% (2)
L'econométrie - La Règression PDF
50 pages
Stat Et Ptobabilité 3 Et 4
Pas encore d'évaluation
Stat Et Ptobabilité 3 Et 4
33 pages
CM-2-AnalyseDonnées2024 Vendredi9Fev PascalSailhac
Pas encore d'évaluation
CM-2-AnalyseDonnées2024 Vendredi9Fev PascalSailhac
32 pages
Stat 2 Variable
Pas encore d'évaluation
Stat 2 Variable
17 pages
Épreuve de Mathématiques - Baccalauréat S2-S4-S5
Pas encore d'évaluation
Épreuve de Mathématiques - Baccalauréat S2-S4-S5
10 pages
Quelques Concepts Fondamentaux: Espace Euclidien
Pas encore d'évaluation
Quelques Concepts Fondamentaux: Espace Euclidien
11 pages
Analyse des données statistiques fondamentales
Pas encore d'évaluation
Analyse des données statistiques fondamentales
45 pages
Machine Learning (ML)
Pas encore d'évaluation
Machine Learning (ML)
1 page
gc67 Inf4 FR
Pas encore d'évaluation
gc67 Inf4 FR
82 pages
Quiz sur le recensement des ménages
Pas encore d'évaluation
Quiz sur le recensement des ménages
2 pages
Énergie nucléaire : recherches et enjeux futurs
Pas encore d'évaluation
Énergie nucléaire : recherches et enjeux futurs
104 pages
Fiche Licence AES 2022 2023
Pas encore d'évaluation
Fiche Licence AES 2022 2023
3 pages
s3 - Statinfr - Tdexcorr - 1 Lois Discretes - Rev 2014n
Pas encore d'évaluation
s3 - Statinfr - Tdexcorr - 1 Lois Discretes - Rev 2014n
8 pages
Étude de la demande pour un nouveau produit
Pas encore d'évaluation
Étude de la demande pour un nouveau produit
2 pages
Factorisation de P(x) en étapes
Pas encore d'évaluation
Factorisation de P(x) en étapes
3 pages
2 Cours Methodes Factorielles
Pas encore d'évaluation
2 Cours Methodes Factorielles
32 pages
Permutations Aléatoires
Pas encore d'évaluation
Permutations Aléatoires
3 pages
Théories classiques en management et organisation
Pas encore d'évaluation
Théories classiques en management et organisation
20 pages
2024 MP Rapport Ads de Mathematiques - 0
Pas encore d'évaluation
2024 MP Rapport Ads de Mathematiques - 0
3 pages
TP 41 33
Pas encore d'évaluation
TP 41 33
9 pages
Dimensionnement des bois en flexion
Pas encore d'évaluation
Dimensionnement des bois en flexion
20 pages
Calculs et Techniques d'Estampage
50% (2)
Calculs et Techniques d'Estampage
16 pages
JOTIM 2016 : Journées d'Optique et Info
Pas encore d'évaluation
JOTIM 2016 : Journées d'Optique et Info
2 pages
ERIKS - Documentation Technique - Joints Quad-Ring
Pas encore d'évaluation
ERIKS - Documentation Technique - Joints Quad-Ring
6 pages
1390 20140618
Pas encore d'évaluation
1390 20140618
19 pages
TP TSI Asservissement-Scilab - Final
Pas encore d'évaluation
TP TSI Asservissement-Scilab - Final
5 pages
Chapitre 4 - Outils Du Manager
Pas encore d'évaluation
Chapitre 4 - Outils Du Manager
10 pages
Accord de Groupement pour Appel d'Offres
Pas encore d'évaluation
Accord de Groupement pour Appel d'Offres
2 pages
Vitesse sismique et propriétés des roches
Pas encore d'évaluation
Vitesse sismique et propriétés des roches
13 pages
Relevé de notes L1 Droit Angers 2022/23
Pas encore d'évaluation
Relevé de notes L1 Droit Angers 2022/23
2 pages
Colle Texte Méthodo
Pas encore d'évaluation
Colle Texte Méthodo
1 page
Techniques de Closing pour Commerciaux
Pas encore d'évaluation
Techniques de Closing pour Commerciaux
2 pages
Chap2-Le Poids D'un Corps
Pas encore d'évaluation
Chap2-Le Poids D'un Corps
4 pages
SS Dunod-Collections
100% (2)
SS Dunod-Collections
2 pages
Annales d'examens en informatique 2020-2021
Pas encore d'évaluation
Annales d'examens en informatique 2020-2021
48 pages
Roue de La Vie
Pas encore d'évaluation
Roue de La Vie
3 pages
Méthodes Chimiométriques en Agroalimentaire
Pas encore d'évaluation
Méthodes Chimiométriques en Agroalimentaire
12 pages
TCSF CH4 Planification
Pas encore d'évaluation
TCSF CH4 Planification
5 pages
Gurdjieff Georges - Recits de Belzebuth A Son Petit-Fils Tome 2 PDF
50% (2)
Gurdjieff Georges - Recits de Belzebuth A Son Petit-Fils Tome 2 PDF
343 pages
L'actualité de Karl Krauss
Pas encore d'évaluation
L'actualité de Karl Krauss
8 pages
Instances et Relations Universitaires
Pas encore d'évaluation
Instances et Relations Universitaires
6 pages
Localisation des sols salés par satellite
100% (1)
Localisation des sols salés par satellite
77 pages
Gestion des stocks en pharmacie
Pas encore d'évaluation
Gestion des stocks en pharmacie
55 pages
Calcul Des CRT
Pas encore d'évaluation
Calcul Des CRT
6 pages
Fonctions Du Chef de Spécialité
Pas encore d'évaluation
Fonctions Du Chef de Spécialité
2 pages
Gestion de Projets R&D : Compétences et Motivations
Pas encore d'évaluation
Gestion de Projets R&D : Compétences et Motivations
1 page