EXEMPLE D’ANALYSE EN COMPOSANTES PRINCIPALES Valeurs propres et Pourcentage d’inertie
1 2,3628 59,07%
2 0,7980 19,95%
Nous exposons dans le détail l’ACP du tableau de 10 individus et 4 variables suivant :
3 0,5316 13,29%
X1 : le poids en kilogrammes 4 0,3076 7,69%
X2 : la taille en mètre
X3 : l’âge en années
X4 : la note obtenue dans l’année (note sur 20)
ETUDE DU NUAGE DES INDIVIDUS
Coordonnées des individus (1ère ligne)
Cosinus carrés avec les axes (2ème ligne)
X1 X2 X3 X4
1 45 1,50 13 14 1 -2,686 0,081 0,187 -1,106
2 50 1,60 13 16 0,851 0,001 0,004 0,144
3 50 1,65 13 15
2 -1,932 0,416 -0,277 0,342
4 60 1,70 15 9
0,911 0,042 0,019 0,028
5 60 1,70 14 10
Individus -1,402 0,901 -0,591 0,478
6 60 1,70 14 7 3
7 70 1,60 14 8 0,586 0,242 0,104 0,068
8 65 1,60 13 13 4 1,800 -0,361 -0,983 -0,400
9 60 1,55 15 17 0,721 0,029 0,215 0,036
10 65 1,70 14 11 1,061 0,498 -0,396 0,099
5
Individus 1’ 63 1,65 13,5 12 0,731 0,161 0,102 0,006
supplémentaires 2’ 59 1,60 14,5 16
6 1,555 0,837 -0,187 -0,546
Les variables sont d’abord centrées, puis, comme elles sont hétérogènes, réduites : nous effectuons
0,701 0,203 0,010 0,086
l’ACP normée. Le petit nombre d’individus permet de vérifier toutes les propriétés vues en théorie.
7 1,359 -0,391 1,397 -0,403
ETUDE UNIVARIEE 0,449 0,037 0,475 0,040
8 -0,388 0,201 1,262 0,641
Nombre d’individus : 10 0,069 0,018 0,726 0,187
VAR. PRINC. MOYENNE ECART-TYPE
9 -0,614 -2,382 -0,390 0,266
1 58,50 7,4330
0,060 0,904 0,024 0,011
2 1,63 0,0678
3 13,80 0,7483 10 1,247 0,200 -0,023 0,629
4 12,00 3,3166 0,781 0,020 0,000 0,199
Matrice de covariance ANALYSE DES INDIVIDUS SUPPLEMENTAIRES
1 2 3 4
1’ 0,290 0,274 0,442 0,509
1 55,2500 0,1950 2,7000 -14,0000
0,137 0,123 0,319 0,422
2 0,1950 0,0046 0,0160 -0,1400
3 2,7000 0,0160 0,5600 -0,8000 2’ -0,440 -1,374 -0,464 0,482
4 -14,0000 -0,1400 -0,8000 11,0000 0,077 0,746 0,085 0,092
Matrice de corrélation ANALYSE DU NUAGE DES VARIABLES
1 2 3 4 Coordonnées des variables (1ère ligne)
1 1,0000 0,3868 0,4854 -0,5679
Reconstruction de la norme (2ème ligne)
2 0,3868 1,0000 0,3152 -0,6224
3 0,4854 0,3152 1,0000 -0,3223 1 0,801 -0,245 0,481 0,260
4 -0,5679 -0,6224 -0,3223 1,0000 0,642 0,060 0,231 0,067
2 0,763 0,452 -0,379 0,264
Vecteurs propres (en colonnes) 0,582 0,204 0,144 0,070
0,5210 -0,2744 0,6588 0,4682
0,4965 0,5056 -0,5206 0,4763 3 0,660 -0,649 -0,358 -0,118
0,4296 -0,7271 -0,4913 -0,2129 0,436 0,422 0,128 0,014
-0,5454 -0,3746 -0,2315 0,7132 4 -0,838 -0,335 -0,169 0,396
0,703 0,112 0,029 0,157
INTERPRETATION
Les deux premières composantes principales reconstruisent environ 80% de la variance totale. Nous
nous bornerons donc au cercle de corrélation sur le plan 1 x 2. Taille
3
6
Cercle de corrélation 5
2
1'
8 10
1,0 1
Poids
7 4
Note
0,5
Taille Age
2'
0,0
-1,0 -0,5 0,0 0,5 1,0
Poids 9
Note
-0,5
Age
En ce qui concerne les individus, on constate deux groupes à droite et à gauche de l’axe 1 ; les
individus 8 et 9 paraissent isolés. La représentation simultanée permet d’expliquer ces groupes : à
droite se trouvent les élèves physiquement développés, à gauche les élèves bien notés : on retrouve
-1,0
bien sûr le sens de la première composante principale.
Le groupe 1, 2 et 3 est formé d’individus bien représentés ; par contre, dans le groupe 4, 5, 6, 7 et
Toutes les variables sont bien représentées sur le cercle de corrélation puisqu’elles sont proches de 10, l’individu 7 n’est pas bien reconstruit, et l’examen des coordonnées des individus sur l’axe 3
la circonférence. Il apparaît une distinction évidente entre la variable Note et les variables Taille, montre qu’il se distingue des autres le long de cet axe : cela semble dû à son poids plus élevé.
Poids et Age : la caractéristique intellectuelle s’oppose aux caractéristiques physiques, et la L’individu 8 est particulier : il est très mal représenté sur le plan 1 x 2, cela s’explique par le fait
première composante principale est définie par cette opposition. La deuxième aurait plutôt tendance que sur le plan physique, il est aussi développé que les élèves 4, 5, 6, 7 et 10 et que sur le plan
séparer l’Age de la Taille : la corrélation est faible entre ces deux variables, mais l’individu 9 suffit scolaire, il réussit aussi bien que les élèves 1, 2 et 3.
à les opposer ; cela est dû à la petite taille de la population, et la variance de cette composante Quant à l’individu 9, il est petit, il est gros, il est vieux mais il travaille très bien.
principale montre, par sa faiblesse qu’elle n’apporte guère d’information. Les individus supplémentaires 1’ et 2’ sont également projetés sur le plan principal. Le premier est
mal représenté (le cosinus carré de l’angle qu’il forme avec le plan 1 x 2 est égal à 0,260) ; le
second l’est correctement : sa proximité avec l’individu 9 est réelle et on peut la vérifier sur les
données.