Analyse des composants principales
1. Définition de l’ACP
L’ACP est une méthode de description et de résumer d’un tableau de données. Ces données
sont issues de l’observation de p variables quantitatives observées sur n individus.
L’ACP est présenté comme une technique exploratoire où résumaient les relations entre les
variables à l’aide d’un jeu de facteurs aussi réduit que possible.
Cette technique est très utilisée en évaluation des préférences individuelles lors de
l’identification de sous-groupes homogènes dans le sens où ils partagent le même facteur.
L’ACP est une technique statistique dont le but est de représenter les relations qui lient les
variables à travers des valeurs prises par un échantillon d’individus.
Un des aspects de l’étude est de résumer l’ensemble des variables en un petit nombre de
variables synthétiques appelées facteurs.
Cette méthode trouve de nombreuses applications dans le domaine des études marketing :
Segmentation du marché ;
Etudes de positionnement ;
En recherche produit ;
Etudes publicitaires ;
Evaluer le risque d’un phénomène climatique ;
Détecter la fraude ;
Comprendre ou explorer un phénomène ;
Automatiser certaines tâches.
Etudes prix…
2. Présentation des données
L’ACP travaille sur des tableaux de type individus * variables qui se présentent comme suit :
Var 1 Var 2 … Var p
Ind 1 𝑥11 𝑥12 … 𝑥1𝑝
Ind 2 𝑥21 𝑥22 … 𝑥2𝑝
⋮ ⋮ ⋮ ⋮ ⋮
Ind n 𝑥𝑛1 𝑥𝑛2 … 𝑥𝑛𝑝
a. Les individus
L’ACP trouve la meilleure représentation plane de l’ensemble des individus la qualité globale
de la représentation ainsi que la qualité de représentation de chaque individu. On regroupera les
groupes d’individus homogènes et on détectera les individus exceptionnels.
b. Les variables
De même, l’ACP permet d’avoir la meilleure représentation plane de l’ensemble des variables.
On représentera les différentes variables par des points sur un plan puis on analysera les
relations entre les différentes variables.
L’analyse comparée de la carte des individus et celle des variables permet d’analyser l’influence
des variables sur les différents groupe d’individus.
L’ACP résume le tableau initial par un tableau de plus faible dimension.
Remarque : en remplaçant les variables initiales par un petit nombre de variables non corrélées
appelées composantes principales résumant au mieux l’information initial.
3. Objectifs de l’ACP
Le tableau des données (n lignes et p colonnes) contient une information globale en matière de
indépendance entre les variables sur l’ensemble des individus et de positionnement des n
individus les uns par rapport aux autres au regard des p variables observées.
L’analyse de cette information n’est pas facile, elle est d’autant plus complexe que les
dimensions n et p du tableau sont importants.
L’objectif général de l’ACP est de construire à partir des p variables observés des variables
composites ou non corrélées.
Linéairement, ceci permettra de décrire de façon synthétique par exemple à l’aide de
représentation graphique la différenciation des profils des individus.
A partir des graphiques, on peut se poser plusieurs questions à savoir :
1) Quelle est la signification des axes qui engendrent le plan ?
2) Comment interprète-t-on les proximités ou l’éloignement entre les points ?
3) Quelle est la qualité de l’information recueillie dans un tel plan ?
4) Quelle est le lien entre le graphique dit plan factoriel où sont représentés les critères de
performances (les variables) ?
4. La démarche de l’ACP
4.1. Analyse des nuages des points individus
On associe à chaque individu i un point de ℝ𝑝 de coordonnées 𝑥𝑖 = (𝑥𝑖1 , 𝑥𝑖2 , 𝑥𝑖3 , … , 𝑥𝑖𝑝 )
On affecte à chaque individu un poids : 𝑃𝑖 avec 𝑃𝑖 > 0 et ∑ 𝑃𝑖 = 1.
1
Généralement, 𝑃𝑖 = 𝑛 (n : nombre d’individus)
Donc on définit une matrice des poids diagonale notée 𝐷(𝑛,𝑛) dont les éléments de sa diagonale
principale sont les 𝑃𝑖 et hors la diagonale il y a des zéros.
𝑃1 0 … 0
0 𝑃2 … 0
𝐷(𝑛,𝑛) = [ ]
⋮ ⋮ ⋱ ⋮
0 0 … 𝑃𝑛
1
𝐷(𝑛,𝑛) = 𝑃𝑖 𝐼𝑁 = 𝐼
𝑛 𝑁
On définit le nuage des individus par :
𝑀𝑖 = {(𝑥𝑖 , 𝑃𝑖 ); 𝑖 = 1, … , 𝑛}
4.1.1. Données centrées réduites
Le tableau de type individus variables qui peut traiter par l’ACP correspond souvent à des
données hétérogènes c à d que les différents variables observées sur les individus ne s’expriment
pas dans la même unité (âge, année, salaire, poids,…) donc l’analyse du tableau devient très
délicate donc une transformation des données principales proposées par l’ACP a pour objectif
de remédier à cette hétérogénéité, il s’agit de centrer et de réduire la distribution observée sur
𝑥−𝑥̅
les n individus. On a donc x est l’observation initiale, on pose 𝑦 = dans ce cas on a :
𝜎
𝐸(𝑥−𝑥̅ ) 𝑉(𝑥−𝑥̅ )
𝐸(𝑦) = = 0 et 𝑉(𝑦) = = 1.
𝜎 𝜎
On obtient donc un 2éme tableau des variables centrées réduites de matrice 𝑍=
𝑗
𝑗 𝑥𝑖 −𝑥̅
[𝑧𝑖 = ]
𝜎𝑗
4.1.2. Axes principaux
Les axes principaux sont déterminés en cherchant les vecteurs propres de la matrice des
corrélations notée R avec
𝑧11 𝑧21 … 𝑧𝑛1 𝑃1 0 … 0 𝑧1
1
𝑧12 … 𝑧1𝑝
𝑧2
𝑅 = 𝑍𝑡 𝐷 𝑍 = 1
𝑧22 … 𝑧𝑛2 [ 0 𝑃2 … 0 𝑧21
] 𝑧22 … 𝑧2𝑝
⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
𝑝
[𝑧1 𝑧2𝑝 𝑝
… 𝑧𝑛 ] 0 0 … 𝑃𝑛 [𝑧𝑛1 𝑧𝑛2 … 𝑧𝑛𝑝 ]
Les vecteurs propres sont notés 𝑢1 , 𝑢2 , … , 𝑢𝑛
Les valeurs propres de 𝑅 sont des 𝜆𝑖 qui vérifient le polygone caractéristique : |𝑅 − 𝜆𝐼 | = 0
=> det(𝑅 − 𝜆𝐼) = 0
Donc les valeurs propres sont en nombre de p et par suite on a p valeurs propres car à chaque
valeur propre on associe un vecteur propre 𝐸𝑖 ; 𝑖 = 1, … , 𝑛
On note 𝑈 la matrice des vecteurs propres d’ordre 𝑝 ; 𝑈 = [𝑢1 , 𝑢2 , … , 𝑢𝑝 ]
Les valeurs propres étant classées par ordre décroissant
4.1.3. Inertie
L’inertie totale du nuage des individus vaut la somme des 𝜆𝑖 qui est égale à la trace de 𝑅 (matrice
de corrélation) : ∑ 𝜆𝑖 = 𝑡𝑟𝑎𝑐𝑒(𝑅) = ∑ 𝑟𝑖𝑖 = 𝑝
La qualité globale de la représentation du nuage est mesurée par la proportion de l’inertie
𝜆1 +𝜆2
absorbée par l’axe principale. Le taux d’inertie absorbé par le 1ère plan est donnée par 𝑝
Le taux d’inertie définit le pouvoir explicatif d’un facteur. Il représente la part de variance totale
prise en compte par ce facteur. Son appréciation doit cependant tenir compte du nombre de
variables et du nombre d’individus.
4.1.4. Coordonnées factorielles des individus
Les coordonnés de composantes principales sont les données factorielles du point individu
donné par le produit matriciel 𝑍𝑈.
𝑐11 𝑐12 … 𝑐1𝑝
On note 𝐶 = 𝑍𝑈 = 𝑐2
1
𝑐22 … 𝑐2𝑝
⋮ ⋮ ⋱ ⋮
[𝑐𝑛1 𝑐𝑛2 … 𝑐𝑛𝑝 ]
Le critère de choix des axes principaux se fait selon le critère de ‘’Kaiser’’ qui dit que les axes
à retenir sont ceux qui correspondent à 𝜆 > 1.
4.1.5. Contribution absolue et relative sur les axes
Pour trouver les individus significatifs qui contribuent le plus à chaque axe. On doit calculer
l’inertie de projection sur chaque axe. Cette inertie est calculée en fonction des composantes
principales et les valeurs propres définis par :
𝑃𝑖 (𝐶𝑖𝛼 )2
𝐶𝑇𝐴(𝑖, 𝛼) =
𝜆𝛼
Avec : 𝐶𝑖𝛼 : composante principale , 𝜆𝛼 : valeur propre et 𝑃𝑖 : le poids des individus.
Les individus qui contribuent le plus aux axes sont ceux qui ont une contribution supérieure ou
égale à 2 fois le poids c.à.d : si 𝐶𝑇𝐴 ≥ 2𝑃𝑖 => l’individu contribue à l’axe d’une manière
significative.
La contribution relative indiquant la qualité de la représentation du point 𝑖 sur l’axe 𝛼
(𝐶𝑖𝛼 )2
𝐶𝑇𝑅(𝑖, 𝛼) =
∑(𝑧𝑖𝑗 )2
Les qualités de représentation sont additives. Par exemple, la qualité de représentation d'un
individu i par le plan (1, 2) est donnée par :
𝐶𝑇𝑅(𝑖, 1 ∗ 2) = 𝐶𝑇𝑅(𝑖, 1) + 𝐶𝑇𝑅(𝑖, 2)
4.2. Analyse des nuages des points variables
4.2.1. Coordonnées factorielles des variables
𝑗
𝑥1
𝑗
Chaque variable 𝑥 𝑗 est représentée dans un repère ℝ𝑛 avec 𝑥 𝑗 = 𝑥2
⋮
𝑗
(𝑥𝑛 )
𝑗
La moyenne de la variable 𝑥 𝑗 est 𝑥̅ 𝑗 = ∑𝑛𝑖=1 𝑃𝑖 𝑥𝑖
𝑗
La variance empirique de 𝑥 𝑗 est 𝑉𝑎𝑟(𝑥 𝑗 ) = ∑𝑛𝑖=1 𝑃𝑖 (𝑥𝑖 − 𝑥̅ 𝑗 )2 et 𝜎 = √𝑉𝑎𝑟(𝑥) son écart
type.
Quand on travaille sur les variables centrées réduites, la corrélation de composantes 𝐶𝑘 et une
variable 𝑍𝑗 est donnée par :
𝐶𝑗𝑘 = ( 𝜆𝑘 )1/2 𝑈𝑘
4.2.2. Contribution absolues des variables
La contribution absolue de variable est l’influence de la variable dans la définition de la
composante :
(𝐶𝑗𝛼 )2
𝐶𝑇𝐴(𝑗, 𝛼) =
𝜆𝛼
Avec : 𝐶𝑗𝛼 : coordonnée factorielle du variable et 𝜆𝛼 : valeur propre.
4.2.3. Contribution relatives des variables
La contribution relative de variable est la qualité de représentation de la variable sur la
composante. On peut la cumuler sur les premières composantes.
𝐶𝑇𝑅(𝑗, 𝛼) = (𝐶𝑗𝛼 )2
Conclusion
La démarche d’interprétation d’une ACP est de donner une signification aux nouveaux axes
retenus par l’analyse (en général on obtient 1 axe ou 2 ou 3 et parfois 4), on les interprétant à
partir des variables de départ pour cela on examine le nuage des points variables inscrit dans le
cercle des corrélations et le nuage des points individus représentés dans un repère orthonormé
ce qui permet l’interprétation des différences entre les individus.