0% ont trouvé ce document utile (0 vote)
1K vues3 pages

correctionTD2 PDF

Transféré par

wikokkk
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
1K vues3 pages

correctionTD2 PDF

Transféré par

wikokkk
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Master 1 BEM MQEM

T. D. n◦ II . L’ACP pratique.

Exercice n◦ 1.
Une étude sur des fournisseurs de matériel informatique a conduit à apprécier le service, la
qualité et le prix de quatre fournisseurs. Pour cela un expert a noté ces entreprises avec des notes
allant de -3 à 3. Les résultats sont consignés ci-dessous

Ent Service Qualité Prix


E1 -2 3 -1
E2 -1 1 0
E3 2 -1 -1
E4 1 -3 2

1) Calculer le vecteur moyen des individus. Qu’en conclure?


2) Calculer la covariance entre x1 et x1 . Que représente cette quantité?
3) Calculer la covariance entre x1 et x2 .
4) Donner la matrice de corrélation.
On veut faire une ACP centrée avec des poids uniformes.
5) Sur quelle matrice faut-il travailler? Vérifier qu’elle admet une valeur propre nulle. Qu’est ce
que cela implique?
6) On donne λ1 = 61/8. En déduire λ2 .
7) Calculer les pourcentages d’inertie. Quelle dimension retenez-vous?
8) Soient les vecteurs propres a1 = (1/2, −4/5, 3/10)0 et a2 = (0.65, 0.11, −0.75)0 . Calculer les
composantes principales.
9) Représenter les individus et les variables dans le plan principal (1, 2). Interpréter.
10) Calculer la corrélation entre les variables initiales et les composantes principales.

Exercice n◦ 2. Soit X = (x1 , x2 , x3 ) tel que


⎡ ⎤
1 ρ −ρ
R=⎣ ρ 1 ρ ⎦
−ρ ρ 1
avec −1 ≤ ρ ≤ 1. On veut faire une ACP centrée réduite de X.
1) Vérifier que R admet pour vecteur propre ξ1 = √13 (1, −1, 1)0 .
2) Déterminer les autres éléments de la décomposition aux valeurs propres de R.
3) Quels sont les % de variance expliquée? Quels axes retenir?

Corrections
1) Il suffit de faire la moyenne des colonnes du tableau, ce qui donne x = (x1 , x2 , x3 )0 = (0, 0, 0)0 .
Le tableau est donc centré.
­ ® 2
2) cov (x1 , x1 ) = x1 − x1 1, x1 − x1 1 Dp = n1 x10 x1 = kx1 kDp où Dp est la matrice associée à la
métrique diagonale des poids des individus.

1
3) cov (x1 , x1 ) = n1 x10 x2 puisque les données sont déjà centrées. On obtient cov (x1 , x1 ) =
1
4
(−2, −1, 2, 1) (3, 1, −1, −3)0 = −3. On peut également calculer la matrice de variance
⎡ ⎤
5 −6 1
1
V = ⎣ −6 10 −4 ⎦
2
1 −4 3
4) La¡matrice ¢ de corrélation R a pour terme général
cov xj , xk 1
. Elle est telle que R = M1/2 VM1/2 où M est la matrice de terme général
j k
kx kDp kx kDp kxj k2Dp
et V la matrice de variance-covariance. Après calculs :

5) On travaille sur la matrice de covariance (tableau initial non réduit).


Exercice n◦ 2.

1. Si R admet pour vecteur propre ξ1 alors il vérifie Rξ 1 = λ1 ξ1 , λ1 ∈ R+ . On calcule Rξ1 :


⎡ ⎤⎛ ⎞ ⎛ ⎞
1 ρ −ρ 1 1 − 2ρ
1 1
√ ⎣ ρ 1 ρ ⎦ ⎝ −1 ⎠ = √ ⎝ 2ρ − 1 ⎠ = (1 − 2ρ) ξ1
3 −ρ ρ 1 1 3 −2ρ + 1

donc, ξ1 est bien vecteur propre de R pour la valeur propre λ1 = 1 − 2ρ. Cette valeur propre
étant positive (propriété de R matrice symétrique définie positive) on doit avoir −1 ≤ ρ ≤ 12 .
2. Pour déterminer les autres éléments propres de R, on résout det (R − λI) = 0, ce qui équivaut
à ¡ ¢
(1 − λ) (1 − λ)2 − ρ2 − 2ρ2 (1 − λ + ρ) = 0
£ ¤
(1 − λ + ρ) (1 − λ) (1 − λ − ρ) − 2ρ2 = 0
£ ¤
(1 − λ + ρ) λ2 − λ (2 − ρ) + 1 − ρ − 2ρ2 = 0
On sait que λ1 = 1 − 2ρ est valeur propre de R. Ceci permet de calculer par identification
la racine du polynôme ci-dessus. On montre que λ = 1 + ρ est racine double. On peut
maintenant déterminer les vecteurs propres pour cette valeur propre. Soit ξ = (x, y, z)0 un
vecteur vérifiant Rξ = λξ. En développant, on obtient le système

⎨ −ρx + ρy − ρz = 0
ρx − ρy + ρz = 0 .

−ρx + ρy − ρz = 0

Il nous faut maintenant trouver des valeurs arbitraires de x, y et z qui vérifient ce système. On
en trouve facilement 2 tiercés avec (1, 1, 0) et (1, 0, −1) qui ne soient pas combinaison linéaire
l’un de l’autre. En normalisant ces vecteurs, on obtient finalement les deux vecteurs propres
ξ2 = √12 (1, 1, 0)0 et ξ3 = √12 (1, 0, −1)0 . Finalement, la matrice des corrélations R peut être
décomposée sous la forme R = PΛP0 avec P = [ξ 1 , ξ2 , ξ3 ], matrice des vecteurs propres et Λ,
matrice des valeurs propres de termes diagonaux (1 − 2ρ, 1 + ρ, 1 + ρ).

2
3. Les pourcentages d’inertie expliquée sont donnés, dans chaque direction propre, par le rapport
d’une valeur propre sur la somme totale des valeurs propres, égale dans ce cas à 3, puisqu’elle
correspond à l’inertie totale calculée à partir de la matrice des corrélations (variables réduites).
Nous avons déjà vu que les valeurs possibles de ρ sont −1 ≤ ρ ≤ 12 pour assurer la positivité des
valeurs propres. Supposons maintenant que −1 < ρ < 0. On peut ranger les valeurs propres
par ordre décroissant avec 1−2ρ > 1 +ρ. On se rend alors compte que l’espace initial à 3 vari-
ables peut être réduit à une seule variable, combinaison linéaire des 3 variables initiales. En
effet, si l’on considère le sous-espace propre de dimension 2 associé à la valeur propre double,
l’information du nuage de points résumé dans cet espace est identique dans les deux direc-
tions. Cela n’apporte rien de les conserver : on ne gardera qu’un axe. Dans ce cas, l’éboulis
correspond au tracé, sur le même graphique, de barres de hauteur (1 − 2ρ) /3, (1 + ρ) /3 et
(1 + ρ) /3. Voyons maintenant le cas où ρ = 0. Dans ce cas, la matrice de corrélation est
diagonale : les variables sont non corrélées deux à deux. Les valeurs propres sont toutes
égales à 1 : le nuage de point est sphérique. Si 0 < ρ < 0.5, les valeurs propres sont telles que
1 + ρ > 1 − 2ρ : les deux premiers sous-espaces sont à retenir, de même inertie. A vous de
regarder les cas extrêmes ρ = −1 et ρ = 0.5 et d’en déduire les axes à retenir et les variances
associées.

Vous aimerez peut-être aussi