Analyse des données S6, Option : Gestion Prof.
Mohamed El Merouani
ACP
Exercices
Exercices corrigés
Exercice 1 :
On considère la matrice de données X de type (2,3) suivante :
− 1 0 1
X =
0 − 1 1
1) Calculer le produit matriciel X’X et s’assurer que c’est une matrice carrée et
symétrique.
2) Chercher les valeurs propres λi de X’X et ses vecteurs propres associés ui. Donner la
matrice diagonale Λ semblable à X’X et la matrice de passage A.
3) Vérifier que tr(X ' X ) = tr () = i
i
Solution 1 :
−1 0 −1 0 −1 0 1 1 0 −1
1) X ' = 0 −1 ; X ' X = 0 −1 = 0 1 −1
0 −1 1
−1 −1 2
1 1 1 1
qui est bien une matrice carrée d’ordre 3 et elle est symétrique.
1− 0 −1
2) det(X ' X − I ) = 0 0 1− −1 = 0
−1 −1 2−
Si on développe suivant la 1ère ligne, on aura :
1− − 1 − (− 1)4 0 1 −
(1 − )(− 1)2 = 0 (1 − )(1 − )(2 − ) − 1− (1 − ) = 0
−1 2− −1 −1
(1 − )(1 − )(2 − ) − 1 − 1 = 0 (1 − ) 2 − 3 = 0
D’où, l’équation caractéristique (1 − )( − 3) = 0 ,
Alors, les valeurs propres de X’X sont : λ1=3 ; λ2=1 ; λ3=0
Déterminons les sous-espaces propres associés ;
1 0 −1 x 3x
Si λ1=3, alors X’Xu=λ1u, c'est-à-dire 0 1 −1 y = 3y
−1 −1 2 z 3z
avec x,y et z sont les coordonnées du vecteur propre u cherché.
1 www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani
−1
x= z
x − z = 3x − 2x = z 2
−1
y − z = 3y − 2y = z y= 2 z
− x − y + 2z = 3z − x − y = z
z (quelconque) IR
1 1 1 1
D’où
F = − z, − z, z / z IR = z − ,− ,1 / z IR
2 2 2 2
1
F1 est un espace vectoriel de dimension 1 (c’est une droite vectoriel, un axe, le
6 6 6
premier axe principal). Un vecteur unitaire de F1 est u1 = − ;− ; , sa
6 6 3
6 6 6
norme est u1 = + + =1.
36 36 9
1 0 −1 x x
Si λ2=1, alors 0 1 −1 y = y
−1 −1 2 z z
avec x,y et z sont les coordonnées du vecteur propre cherché.
x−z = x x = −y
y−z = y y(quelconque) IR
− x − y + 2z = z z=0
D’où F2 = (− y, y, 0 ) / y IR= y(−1,1,0)/ y IR
F 2 est un espace vectoriel de dimension 1 (c’est une droite vectoriel, un axe, le
2
deuxième axe principal). Un vecteur unitaire de F est − 2 ;0 , sa norme
2 u2 = ;
2 2
2 2
est u2 = + = 1.
4 4
Si λ3=0, alors si on note x,y et z les coordonnées du vecteur propre cherché.
x−z =0 x=z
y−z =0 y=z
− x − y + 2z = 0 z (quelconque) IR
D’où F = (z, z, z )/ z IR= z(1,1,1)/ z IR
3
2 www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani
F 3 est un espace vectoriel de dimension 1 (c’est une droite vectoriel, un axe, le
3 3 3
troisième axe principal). Un vecteur unitaire de F 3 est u3 = ; ; , sa norme
3 3 3
3 3 3
est u3 = + + = 1.
9 9 9
−1
2 − 1 1
3 0 0
−1 −1
= 0 1 0; A= = A X ' XA
2
1 1 ; donc
0 0 0 1 0 1
3) tr () = tr(A−1 X ' XA) = tr(A−1 AX ' X ) = tr(I X ' X ) = tr(X ' X )
et on a tr(X ' X ) = 1 + 1 + 2 = 4 = tr() = 3 + 1 + 0
Exercice 2 :
Soit la matrice des données suivantes :
4 5
X = 6 7
8 0
1) Soient C1 et C2 les vecteurs colonnes de X. Centrer et normer les variables C1 et C2.
2) Déterminer la matrice V des variances-covariances et la matrice Γ des corrélations.
3) Diagonaliser la matrice V. On note λi ses valeurs propres.
4) Déterminer les vecteurs propres Fi associés aux valeurs propres λi.
Solution 2 :
4 5
1) C1 = 6 et C2 = 7 ,
8 0
8+6+ 4 5+ 7+0
Les moyennes : C1 = X 1 = 3
=6 et C2 = X 2 = 3
=4
( )
Center les variables x ij − x j :
4-6=-2 5-4=1
6-6=0 7-4=3
8-6=2 0-4=-4
3 www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani
Leur normes (écart-types Xi i ) :
1
C1 = X1 = = [4 + 4] = 2 2
3 3 3
[1 + 3 + (− 4) ] =
1 2 2 26
C2 = X 2 =
2
et
3 3
−2 3
3
2 2
26
yij = xij − x j
3 3
2) Y = 0 avec
26 Xi
3 −4 3
2 26
Y1 = C1 = 0 et Y2 = C 2 = 0
yj = 1; j = 1,2
Cov (X ,Y )
De plus r = entre deux variables X et Y, mais si (X ) = (Y ) = 1,
(X ) (Y )
alors r = Cov(X ,Y ) .
1
Calcul du produit matriciel Y 'Y :
p
3 −
3 3 − 15 −5
0
2
3 2 26 3
− 1 2 13 1
1 2 0 3 3 = = 2 13
3 3 3 3 − 4 3 26 3 − 15 −5
3 1
26 26 26 3 − 4 3 2 13 2 13
2 26
Le résultat de ce calcul est la matrice Γ=V.
3) Valeurs propres de V=Γ :
1 − − 0,69
det( − I ) = 0 =0
− 0,69 1 −
(1 − ) − (− 0,69) = 0
2 2
(1 − − 0,69)(1 − + 0,69) = 0
(0,31 − )(1,69 − ) = 0
1 = 1,69; 2 = 0,31
Ce sont les deux valeurs propres de Γ.
4) Calcul des vecteurs propres associés :
Pour 1 = 1,69 ;
1 − 0,69 x1 x1
u1 = 1u1 1 x = 1,69 x
− 0,69 2 2
4 www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani
x1 − 0,69x2 = 1,69x1
− 0,69x + x = 1,69x
1 2 2
− 0,69x1 − 0,69x2 = 0 x1 = −x 2
− 0,69x − 0,69x = 0
1 2
Donc F1 = (x1 , − x1 )/ x1 IR = x1 (1, − 1)/ x1 IR
F1 est un espace vectoriel de dimension 1 (c’est une droite vectoriel, un axe, le
2
premier axe principal). Un vecteur unitaire de 1 F est u =
2 , sa norme est
2
1
−
2
2 2
u = + = 1.
1
4 4
Pour 2 = 0,31,
1 − 0,69 x1 x1 x1 − 0,69x2 = 0,31x1
− 0,69 1 x = 0,31 x − 0,69x + x = 0,31x
2 2 1 2 2
0,69x − 0,69x = 0
− 0,69x + 0,69x = 0
1 2
1 2
x1 = x2
Donc F 2 = (x1 , x1 )/ x1 IR = x1 (1,1)/ x1 IR
F 2 est un espace vectoriel de dimension 1 (c’est une droite vectoriel, un axe, le
2
2 , sa norme est
deuxième axe principal). Un vecteur unitaire de F 2 est u2 =
2
2
2 2
u2 = + = 1.
4 4
u1 .u2 = 0 u1 ,u2 est une base orthonormée.
Exercice 3 :
Réaliser l’ACP de la matrice suivante, à partir de sa matrice de dispersion (données centrées
mais non réduites) :
2 2
6 2
6 4
10 4
5 www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani
Solution 3 :
2 2
6 2
Soit Y = centrée mais non réduites,
6 4
10 4
On a : C1 = 1 = (2 + 6 + 62 + 102 = 44 = 2 11
1 2 2
4
C2 = 2 =
1
(22 + 22 + 42 + 42 ) = 10
4
2 2 1 2
2 11 10 11 10
2 611 2 3 2
Alors : Z = 10 = 11 10
6 4 3 4
2 11 10 11 10
10 4 5 4
2 11 10 11 10
1
La matrice des corrélations est Z Z =
4
1 2
11 10
1 3 3 5 3 2 4 2 1
1 11 11 11 11 11 10 1 11 1
= = = 44
4 2 4 4 4 2
4
1
2 4 3 1
5 4
10
Les valeurs propres de Γ :
1
1−
det( − I ) = 0 44 = 0
1
1−
44
( )2
1 2
1− − =0
44
1 1 ) = 0
(1 − ) − ( ) (1 − ) + (
44 44
6 www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani
(0,85 − )(1,15 + ) = 0
Alors 1 = 1,15 et 2 = 0,85 sont les valeurs propres de Γ.
Cherchons, maintenant, leurs vecteurs propres associés :
• Pour 1 = 1,15 :
1 1
44 x x x + 0,15 y = 1,15x
= 1,15
1
1 y y 0,15x + y = 1,15 y
44
x = y
D’où F1 = (x, x)/ x IR = x(1,1)/ x IR
F1 est un espace vectoriel de dimension 1 (c’est une droite vectoriel, un axe, le premier axe
2
principal). Un vecteur unitaire de F1 est u1 = 2 , sa norme est u1 = 2 + 2 = 1.
2 4 4
2
• Pour 2 = 0,85 :
1 0,15 x x x + 0,15 y = 0,85x
0,15 1 y = 0,85 y 0,15x + y = 0,85 y x = − y
Donc F 2 = (x, − x)/ x IR = x(1, − 1)/ x IR
F 2 est un espace vectoriel de dimension 1 (c’est une droite vectoriel, un axe, le
D’où
2
F
premier axe principal). Un vecteur unitaire de 2 est u = 2 , sa norme est
2
− 2
2
2 2
u1 = + = 1.
4 4
Leur produit scalaire est nul : u1 .u2 = 0 u1 ,u 2 est une base orthonormée.
7 www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani
Exercices proposés
Exercice 1 :
On veut faire l’ACP centrée de la matrice :
1 0 0 0
1 1 0 0
X = de type (4,4).
1 1 1 0
1 1 1 1
On a 4 lignes-individus et 4 colonnes-variables. La pondération des lignes est uniforme, la
pondération des colonnes est unitaires, la transformation préalable est le centrage par colonne.
1) Donner les moyens des 4 variables. Donner les variances des 4 variables. Donner la
matrice des variances-covariances de la matrice X.
3 2 1
2) Donner les valeurs propres de la matrice A = 2 4 2 . En déduire les valeurs
1 2 3
propres de l’ACP de X.
3) Donner tr (), où est la matrice diagonale des valeurs propres.
4) Donner le 2ème axe principal de l’ACP de X.
5) Donner les coordonnées des lignes sur le 2ème axe principal de l’ACP de X.
6) Donner les coordonnées des colonnes sur le 2ème axe principal de l’ACP de X.
Exercice 2 :
Une étude gastronomique a conduit à apprécier le service, la qualité et le prix de quatre
restaurants. Pour cela, un expert a noté ces restaurants avec des notes allant de -3 à 3. Les
résultats sont les suivants :
Restaurant Service Qualité Prix
R1 -2 +3 -1
R2 -1 +1 0
R3 +2 -1 -1
R4 1 -3 2
La matrice des variances-covariances est :
5 −3 1
2 2
V = − 3 5 − 2
1 3
2 −2 2
Et celle des corrélations (aux erreurs d’arrondi près) est :
8 www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani
1 − 0,85 0,26
= − 0,85 1 − 0,73
1
0,26 − 0,73
Pour l’étude, on effectue une ACP centrée avec des poids equi-répartis.
1) Étude des valeurs propres :
a) Vérifier simplement que V admet une valeur propre λ3=0.
30,5
b) On donne 1 = . En déduire λ2.
4
c) Calculer les pourcentages d’inerties. Quelle est la dimension à retenir?
0,5 0,65
2) a) On donne, aux erreurs d’arrondi près, v1 = − 0,8 et v2 = 0,11 . Calculer les
0,3 − 0,75
composantes principales.
b) Représenter les individus dans le plan principal (1,2).
3) a) Déterminer les corrélations entre les variables et les composantes.
b) Représenter les variables sur le cercle des corrélations dans le plan factoriel (1,2).
c) Interpréter les résultats.
Exercice 3 :
Soit la matrice X=(X1,X2,X3) dont les variables ont pour matrice des corrélations
1 r − r
= r 1 r
avec − 1 r 1 . On désire effectuer une ACP centrée réduite de X.
− r r 1
1
1 1 .
Vérifier que Γ admet pour vecteur propre
3 −
1)
1
2) Déterminer les autres valeurs propres et vecteurs propres de Γ.
3) Quelles sont les valeurs possibles de r ?
4) Justifier le fait que l’ACP n’a d’intérêt que si -1< r <0.
5) Calculer dans ce cas les pourcentages de variance expliquée.
6) Comment s’interprète par rapport à X1, X2 et X3 l’unique composante à retenir ici ?
9 www.elmerouani.jimdo.com
Analyse des données S6, Option : Gestion Prof. Mohamed El Merouani
Exercice 4 :
2 2 3
3 1 2
Soit la matrice T = 10 1 0 3 des mesures de 5 individus munis de poids statistiques
2 1 4
2 1 3
égaux ; sur 3 variables notées T1, T2 et T3. On désire effectuer une ACP sur variables
centrées-réduites.
1) Calculer l’individu moyen, le vecteur (σ1,σ2,σ3) des écarts types et la X des variables
centrées-réduites.
2) Calculer la matrice Γ des corrélations.
3) Calculer les éléments propres de Γ.
2
4) Les deux premiers vecteurs propres de Γ associés aux valeurs propres 1 = 1 + et
2
0
1 2 1
2 = 1, sont : v1 = 1 et v2 = 1 .
2 2 1
−1
Déterminer les composantes principales c1 et c2 dont on vérifie les propriétés
statistiques.
5) Représenter les individus et les variables dans le plan factoriels (1,2). Quelle est
l’interprétation des variables c1 et c2 ?
6) Représenter dans le plan (1,2) l’individu supplémentaire ( 10, 2 )
10, 2 10 .
Références:
• Jean-François Durand : «Eléments de Calcul Matriciel et d’Analyse Factorielle de
Données », polycopie de l’Université Montpellier II, Licence MASS, Maîtrise MASS,
Maîtrise d’Ingénierie Mathématique, DEA de Biostatistique, Novembre 2002.
• Le site Web : foad.refer.org/IMG/pdf/
10 www.elmerouani.jimdo.com