0% ont trouvé ce document utile (0 vote)
46 vues99 pages

Cours Acp Master

Le document présente un cours sur l'Analyse par Composantes Principales (ACP) dans le cadre d'un Master en Intelligence Artificielle et Science des Données. Il aborde les rappels mathématiques, les méthodes d'analyse des données, ainsi que les applications pratiques de l'ACP pour résumer des informations multidimensionnelles. L'ACP est décrite comme une méthode clé en statistique exploratoire, permettant de révéler des relations entre variables et de former des groupes d'individus similaires.

Transféré par

jihanemd00
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
46 vues99 pages

Cours Acp Master

Le document présente un cours sur l'Analyse par Composantes Principales (ACP) dans le cadre d'un Master en Intelligence Artificielle et Science des Données. Il aborde les rappels mathématiques, les méthodes d'analyse des données, ainsi que les applications pratiques de l'ACP pour résumer des informations multidimensionnelles. L'ACP est décrite comme une méthode clé en statistique exploratoire, permettant de révéler des relations entre variables et de former des groupes d'individus similaires.

Transféré par

jihanemd00
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Cours: Analyse de Données

(Master :IA & SD)


Analyse par composantes principales (ACP)

Pr. Abdelaziz Assadouq

Faculté des Sciences et Techniques -Tanger-

17 décembre 2024
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR

Plan du Chapitre
1 Introduction
Présentation de l’analyse de données
Analyse des données
Principales méthodes d[Pleaseinsertintopreamble]analyse des données
Analyse en composantes principales
2 Rappels mathématiques, notations et données
Vision statistique
Vision matricielle
Vision géométrique
Inerties
3 Ajustement du nuage des individus dans l’espace des variables
Ajustement du nuage des individus
Décomposition de l’inertie
4 Méthode de l’ACP
Détermination des axes principaux
Composantes principales
Qualité et contribution d’un individu
Qualités de la représentation des variables
5 Exemple d’ACP
Résultats relatifs Pr.
aux individus
Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR

Analyse des données

Analyse des données


La terminologie "analyse des données" désigne un sous-ensemble de ce qui
est appelé plus généralement la statistique multivariée.
L’analyse des données est un ensemble de techniques descriptives, dont
l’outil mathématique majeur est l’algèbre matricielle, et qui s’exprime sans
supposer a priori un modèle probabiliste.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR

Analyse des données

Analyse des données


La terminologie "analyse des données" désigne un sous-ensemble de ce qui
est appelé plus généralement la statistique multivariée.
L’analyse des données est un ensemble de techniques descriptives, dont
l’outil mathématique majeur est l’algèbre matricielle, et qui s’exprime sans
supposer a priori un modèle probabiliste.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR

Analyse par réduction des dimensions

Méthodes de classification
Réduire la taille de l’ensemble des individus en formant des groupes homogènes

Méthodes factorielles
Réduire le nombre de variables en les résumant par un petit nombre de
composantes synthétiques.

Deux types de méthodes factorielles


Variables numériques : Analyse en composantes principales (ACP).
Variables qualitatives : Analyse factorielle des correspondances (AFC) et
analyse des correspondance multiples (ACM).

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR

Analyse en composantes principales

Analyse en composantes principales


L’analyse en composantes principales (ACP) est la plus répandue des
méthodes factorielles.
L’ACP s’applique à un tableau dans lequel un ensemble d’individus
(statistiques) est décrit par un ensemble de variables quantitatives.
l’ACP a été conçue par Karl Pearson en 1901.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR

Analyse en composantes principales

Analyse en composantes principales


L’analyse en composantes principales (ACP) est la plus répandue des
méthodes factorielles.
L’ACP s’applique à un tableau dans lequel un ensemble d’individus
(statistiques) est décrit par un ensemble de variables quantitatives.
l’ACP a été conçue par Karl Pearson en 1901.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR

Analyse en composantes principales

Analyse en composantes principales


L’analyse en composantes principales (ACP) est la plus répandue des
méthodes factorielles.
L’ACP s’applique à un tableau dans lequel un ensemble d’individus
(statistiques) est décrit par un ensemble de variables quantitatives.
l’ACP a été conçue par Karl Pearson en 1901.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR

Motivation

Motivation
I L’Analyse en Composantes Principales (ACP) est la méthode de base en
statistique exploratoire multidimensionnelle (ou analyse des données)
Multidimensionnelle : l’analyse porte sur plusieurs variables
Exploratoire : descriptive (par opposition à inférentielle)
I Il s’agit de résumer l’information portant sur plusieurs variables en
Faisant émerger des liaisons entre variables.
Formant des groupes d’individus qui se ressemblent.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR

Motivation

Motivation
I L’Analyse en Composantes Principales (ACP) est la méthode de base en
statistique exploratoire multidimensionnelle (ou analyse des données)
Multidimensionnelle : l’analyse porte sur plusieurs variables
Exploratoire : descriptive (par opposition à inférentielle)
I Il s’agit de résumer l’information portant sur plusieurs variables en
Faisant émerger des liaisons entre variables.
Formant des groupes d’individus qui se ressemblent.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR

Motivation

Motivation
I L’Analyse en Composantes Principales (ACP) est la méthode de base en
statistique exploratoire multidimensionnelle (ou analyse des données)
Multidimensionnelle : l’analyse porte sur plusieurs variables
Exploratoire : descriptive (par opposition à inférentielle)
I Il s’agit de résumer l’information portant sur plusieurs variables en
Faisant émerger des liaisons entre variables.
Formant des groupes d’individus qui se ressemblent.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR

Motivation

Motivation
I L’Analyse en Composantes Principales (ACP) est la méthode de base en
statistique exploratoire multidimensionnelle (ou analyse des données)
Multidimensionnelle : l’analyse porte sur plusieurs variables
Exploratoire : descriptive (par opposition à inférentielle)
I Il s’agit de résumer l’information portant sur plusieurs variables en
Faisant émerger des liaisons entre variables.
Formant des groupes d’individus qui se ressemblent.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR

Les données en ACP

Les données en ACP


En ACP les données se présentent dans un tableau X à n lignes et p
colonnes où
 Chaque ligne représente un individu.
 Chaque colonne représente une variable.
Les variables sont quantitatives : la matrice X est constituée de valeurs
numériques

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR

Les données en ACP

Les données en ACP


En ACP les données se présentent dans un tableau X à n lignes et p
colonnes où
 Chaque ligne représente un individu.
 Chaque colonne représente une variable.
Les variables sont quantitatives : la matrice X est constituée de valeurs
numériques

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR

Les données en ACP

Les données en ACP


En ACP les données se présentent dans un tableau X à n lignes et p
colonnes où
 Chaque ligne représente un individu.
 Chaque colonne représente une variable.
Les variables sont quantitatives : la matrice X est constituée de valeurs
numériques

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR

Les données en ACP

Les données en ACP


En ACP les données se présentent dans un tableau X à n lignes et p
colonnes où
 Chaque ligne représente un individu.
 Chaque colonne représente une variable.
Les variables sont quantitatives : la matrice X est constituée de valeurs
numériques

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR

Les données en ACP

Les données en ACP


En ACP les données se présentent dans un tableau X à n lignes et p
colonnes où
 Chaque ligne représente un individu.
 Chaque colonne représente une variable.
Les variables sont quantitatives : la matrice X est constituée de valeurs
numériques

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Plan du Chapitre
1 Introduction
Présentation de l’analyse de données
Analyse des données
Principales méthodes d[Pleaseinsertintopreamble]analyse des données
Analyse en composantes principales
2 Rappels mathématiques, notations et données
Vision statistique
Vision matricielle
Vision géométrique
Inerties
3 Ajustement du nuage des individus dans l’espace des variables
Ajustement du nuage des individus
Décomposition de l’inertie
4 Méthode de l’ACP
Détermination des axes principaux
Composantes principales
Qualité et contribution d’un individu
Qualités de la représentation des variables
5 Exemple d’ACP
Résultats relatifs Pr.
aux individus
Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Approches des données

Combinaison de trois approches


Statistique : Chaque colonne représente une variable mesurée sur différent
individus (moyenne, variance, corrélation).
Matricielle : Le tableau complet de données est une matrice de nombres
réels (valeurs propres, vecteurs propres).
Géométrique : Chaque ligne du tableau représente les coordonnées d’un
point dans un espace dont la dimension est le nombre de variables
(distances, angles, projection).

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Caractéristiques des données


Les données quantitatives

Variable
On appelle "variable" un vecteur x de taille n. Chaque coordonnée xi correspond à la valeur
prise par l’un individu i. On s’intéresse ici à des valeurs numériques.

Poids
Chaque individu peut avoir un poids pi, tel que p1 + ... + pn = 1, notamment quand les
individus n’ont pas la même importance (échantillons redressés, données regroupées,...). On a
souvent p = 1/n.

Moyenne arithmétique
Pn
On note : x̄ = i=1 pi xi = p1 x1 + ... + pn xn .

Variance et écart-type
2 Pn
La variance de x est définie par : var(x) = σx = i=1 pi (xi − x̄)2 . L’écart-type σx est la
racine carrée de la variance.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Caractéristiques des données


Mesure de liaison entre deux variables

Covariance
La covariance observée
P entre deux variables x et Pyn est définie par :
cov(x, y) = σxy = n i=1 pi (xi − x̄)(yi − ȳ) = i=1 pi xi yi − x̄ȳ..

Coefficient de corrélation
Le Coefficient corrélation est donné par :
σxy cov(x, y)
cor(x, y) = rxy = = p p
σx σy var(x) var(y)
.
−1 ≤ cor(x, y) ≤ 1
|cor(x, y)| = 1 =⇒ Variables liées
cor(x, y) = 0 =⇒ Variables décorrélées.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Tableau de données

Matrice
On note xji la valeur de la variable xj pour le ie individu. X = (x1 , ..., xn ) est
une matrice rectangulaire à n lignes et p colonnes.
x1 x21 ... xp1
 1 
1 2 p
 j 
x1  x1 x2 ... x2 
 .. .. .. .. 
 
 xj2   . . . . 
xj =  .  , X = 
 
 x1i ... xj ... 

 ..   i 
 . .. .. .. 
xjn  .. . . . 
x1n ... ... xpn

Le ie individu est représenté par :

e0i = [x1i , ..., xji , ..., xpi ]

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Matrice des poids

Matrice des poids


Pn
On associe aux individus un poids pi tel que i=1 pi = 1 que l’on représente par la
matrice diagonale de taille n.

p 0
1
 .. 

 . 

Dp = 
 pi 

 .. 
 . 
0 pn

Symétrie
La matrice Dp est diagonale donc symétrique : D0p = Dp

Cas uniforme
Tous les individus ont le même poids pi = 1/n et Dp = 1/nIn

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Point moyen et tableau centré

Point moyen
C’est le vecteur g des moyennes arithmétiques de chaque variable :
n
X
g0 = (x̄1 , ..., x̄p ) = pi e0i .
i=1

Sous forme matricielle


g = X0 Dp In

Tableau centré
En centrant les variables autour de leur moyenne, on obtient : yij = xji − x̄j ,
sous forme matricielle
Y = X − In g0

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Matrice de variance-covariance

Matrice de variance-covariance
C’est une matrice carrée de dimension p.
Où σjl représente la covariance des variables xj et xl . σj2 est la variance de la
variable xj .
Forme matricielle : V = X0 Dp X − gg0 = Y0 Dp Y.

σ12
 
σ12 ... σ1p
σ21 
V= .
 
 .. .. 
. 
σp1 σp2

Symétrie
Comme σjl = σlj la matrice V est symétrique : V0 = V .

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Matrice de corrélation

Matrice de corrélation
C’est une matrice de dimension p × p, avec rjl = σσjl
j σl
est le coefficient de
corrélation.
Symétrie : Comme rjl = rlj , la matrice R est symétrique : R0 = R.
Forme matricielle : R = D1/σ VD1/σ .

 
1 r12 ... r1p
r21 
R= .
 
 .. .. 
. 
rp1 1

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Les données centrées réduites

Matrice centrée réduite


C’est la matrice Z contenant les données :
j yij xj − x̄j
zi = = i
σj σj
Forme matricielle : Z = YD1/σ .

Pourquoi centrer et réduire

pour que les distances soient indépendantes des unités de mesure.


pour ne pas privilégier les variables dispersées.
Rendre comparables des variables qui ne le seraient pas directement parce qu’elles ont
des moyennes et ou des variances trop différentes.

Matrice Variance-covariance des z j


n n
k l
X k l 1 X k l k l
cov(z , z ) = pi zi zi = pi yi yi = cor(x , x ).
i=0
σ k σl i=0
La matrice de variance-covariance des variables centrées-réduites est donc la matrice de
corrélation R.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Nuage de points

Nuage de points
Chaque individu est considéré comme un point d’un espace vectoriel F de
dimension p. Ses coordonnées dans F sont (x1i , ..., xpi ).
L’ensemble des individus est un nuage de points dans F et g est son centre de
gravité. ( )
X n
p
N = (xi , pi )|xi ∈ R , pi > 0 et pi = 1
i=1

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Distance entre individus

Motivation
Afin de pouvoir considérer la structure du nuage des individus, il faut définir une distance, qui
induira une géométrie.

Distance euclidienne classique


la distance la plus simple entre deux points de Rp est définie par :
p
2
X 2 2
d (u, v) = (uj − vj ) = ku − vk
i=1
Généralisation : On donne un poids mj > 0 à la variable j
p
2
X 2
d (u, v) = mj (uj − vj )
i=1

Cela revient à multiplier la coordonnée j par mj .

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Métrique

Métrique
Une métrique est une matrice permettant de définir un produit scalaire et donc des
distances entre individus ou entre variables. La métrique que l’on utilise de manière
naturelle pour mesurer les proximités entre variables est celle définie par la matrice Dp
qui est la métrique de la covariance quand les variables sont centrées :

Espace métrique
Soit M = diag(mj ), où m1 , ..., mp sont des réels strictement positifs.
L’espace Rp est muni d’un produit scalaire grâce à une matrice M symétrique et
définie positive :
Xp
hu, viM = mj uj vj = u0 Mv
j=1
p
X
hu, uiM = mj u2j = u0 Mu = kuk2M .
j=1
d2M (u, v) = ku − vk2M

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Métrique

Orthogonalité
On dit que u et v sont M-orthogonaux si hu, viM = 0

Métrique usuelle
Si m1 , ..., mp = 1, alors M = Ip et on note hu, vi = hu, viI .

Métrique réduite

Diviser les variables par σj est équivalent à prendre mj = 1/σ 2 . On D1/σ2 = D1/σ D1/σ et
donc
0 0
hD1/σ u, D1/σ vi = u D1/σ D1/σ v = u D1/σ2 v = hu, viD 2 1/σ
Il est équivalent de travailler avec la métrique D1/σ2 sur le tableau X, ou avec la métrique
euclidienne I sur le tableau centré réduit Z composé des données :

j xji − x̄j
zi =
σj
Le tableau de données centré réduit Z se calcule matriciellement ainsi :
>
Z = YD1/σ = (X − 1m )D1/σ

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Inerties

Inertie en un point
L’inertie du nuage de points {x1 , ..., xn } en un point quelconque v est donnée par :
n n n
0
X 2
X X 2
Iv = pi kxi − vkM = pi (xi − v) M(xi − v) = pi dM (xi , v)
i=1 i=1 i=1

Inertie totale
La plus petite inertie possible est Ig , donnée par :
n n n
0
X 2
X X 2
Ig = pi kxi − gkM = pi (xi − g) M(xi − g) = pi dM (xi , g),
i=1 i=1 i=1
Conséquence : Iv = Ig + kv − gk2M = Ig + d2M (v, g).
Interprétation : L’inertie totale mesure l’étalement du nuage de points

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Calcul de l’inertie

Forme matricielle
L’inertie totale est aussi donnée par la trace de la matrice VM (ou MV)
Ig = T r(VM) = T r(MV)

Métrique usuelle
M = Ip correspond au produit scalaire usuel et
p
X 2
Ig = T r(V) = σi
j=1

Métrique réduite

Obtenue quand M = D1/σ2 = D21/σ

Ig = T r(D1/σ2 V) = T r(D1/σ VD1/σ ) = T r(R) = p

Variables centrées réduites : On se trouve encore dans le cas où


Ig = T r(R) = p

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Inertie par rapport à un axe

Inertie par rapport à un axe


L’inertie du nuage de points {x1 , ..., xn } par rapport à un axe ∆ est donnée
par :
Xn
I∆ = pi d2M (xi , ∆)
i=1

Où d2M (xi , ∆) = d2M (xi , xˆi ) en notant xˆi le projeté orthogonal de xi sur ∆.
Cette inertie quantifie la dispersion du nuage des individus autour de ∆

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR

Inertie par rapport à un sous-espace affine

Inertie par rapport à un sous-espace affine


L’inertie du nuage de points {x1 , ..., xn } par rapport à un sous-espace affine F
est donnée par :
X n
IF = pi d2M (xi , F).
i=1

Où d2M (xi , F) = d2M (xi , xˆi ) en notant xˆi le projeté orthogonal de xi sur F.
Cette inertie quantifie la dispersion du nuage des individus dans F.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR

Plan du Chapitre
1 Introduction
Présentation de l’analyse de données
Analyse des données
Principales méthodes d[Pleaseinsertintopreamble]analyse des données
Analyse en composantes principales
2 Rappels mathématiques, notations et données
Vision statistique
Vision matricielle
Vision géométrique
Inerties
3 Ajustement du nuage des individus dans l’espace des variables
Ajustement du nuage des individus
Décomposition de l’inertie
4 Méthode de l’ACP
Détermination des axes principaux
Composantes principales
Qualité et contribution d’un individu
Qualités de la représentation des variables
5 Exemple d’ACP
Résultats relatifs Pr.
aux individus
Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR

Meilleure représentation d’un nuage de points

Principe général et Objectif


En analyse factorielle, l’ajustement d’un nuage consiste à le projeter sur
une suite d’axes orthogonaux d’inertie maximum.
Fournir une image simplifiée de Np la plus fidèle possible.
=⇒ Trouver le sous-espace qui résume au mieux les données.
Restitue fidèlement la forme générale du nuage.
Meilleure représentation de la diversité, de la variabilité
Ne perturbe pas les distances entre individus

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR

Meilleure représentation d’un nuage de points

Principe général et Objectif


En analyse factorielle, l’ajustement d’un nuage consiste à le projeter sur
une suite d’axes orthogonaux d’inertie maximum.
Fournir une image simplifiée de Np la plus fidèle possible.
=⇒ Trouver le sous-espace qui résume au mieux les données.
Restitue fidèlement la forme générale du nuage.
Meilleure représentation de la diversité, de la variabilité
Ne perturbe pas les distances entre individus

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR

Meilleure représentation d’un nuage de points

Principe général et Objectif


En analyse factorielle, l’ajustement d’un nuage consiste à le projeter sur
une suite d’axes orthogonaux d’inertie maximum.
Fournir une image simplifiée de Np la plus fidèle possible.
=⇒ Trouver le sous-espace qui résume au mieux les données.
Restitue fidèlement la forme générale du nuage.
Meilleure représentation de la diversité, de la variabilité
Ne perturbe pas les distances entre individus

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR

Meilleure représentation d’un nuage de points

Principe général et Objectif


En analyse factorielle, l’ajustement d’un nuage consiste à le projeter sur
une suite d’axes orthogonaux d’inertie maximum.
Fournir une image simplifiée de Np la plus fidèle possible.
=⇒ Trouver le sous-espace qui résume au mieux les données.
Restitue fidèlement la forme générale du nuage.
Meilleure représentation de la diversité, de la variabilité
Ne perturbe pas les distances entre individus

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR

Meilleure représentation d’un nuage de points

Principe général et Objectif


En analyse factorielle, l’ajustement d’un nuage consiste à le projeter sur
une suite d’axes orthogonaux d’inertie maximum.
Fournir une image simplifiée de Np la plus fidèle possible.
=⇒ Trouver le sous-espace qui résume au mieux les données.
Restitue fidèlement la forme générale du nuage.
Meilleure représentation de la diversité, de la variabilité
Ne perturbe pas les distances entre individus

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR

Meilleure représentation d’un nuage de points

Principe général et Objectif


En analyse factorielle, l’ajustement d’un nuage consiste à le projeter sur
une suite d’axes orthogonaux d’inertie maximum.
Fournir une image simplifiée de Np la plus fidèle possible.
=⇒ Trouver le sous-espace qui résume au mieux les données.
Restitue fidèlement la forme générale du nuage.
Meilleure représentation de la diversité, de la variabilité
Ne perturbe pas les distances entre individus

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR

Meilleure représentation d’un nuage de points

Principe général et Objectif


En analyse factorielle, l’ajustement d’un nuage consiste à le projeter sur
une suite d’axes orthogonaux d’inertie maximum.
Fournir une image simplifiée de Np la plus fidèle possible.
=⇒ Trouver le sous-espace qui résume au mieux les données.
Restitue fidèlement la forme générale du nuage.
Meilleure représentation de la diversité, de la variabilité
Ne perturbe pas les distances entre individus

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR

Meilleure représentation d’un nuage de points

Principe général et Objectif


En analyse factorielle, l’ajustement d’un nuage consiste à le projeter sur
une suite d’axes orthogonaux d’inertie maximum.
Fournir une image simplifiée de Np la plus fidèle possible.
=⇒ Trouver le sous-espace qui résume au mieux les données.
Restitue fidèlement la forme générale du nuage.
Meilleure représentation de la diversité, de la variabilité
Ne perturbe pas les distances entre individus

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR

Meilleure représentation d’un nuage de points

Principe général et Objectif


En analyse factorielle, l’ajustement d’un nuage consiste à le projeter sur
une suite d’axes orthogonaux d’inertie maximum.
Fournir une image simplifiée de Np la plus fidèle possible.
=⇒ Trouver le sous-espace qui résume au mieux les données.
Restitue fidèlement la forme générale du nuage.
Meilleure représentation de la diversité, de la variabilité
Ne perturbe pas les distances entre individus

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR

Décomposition de l’inertie

Principe
L’ACP consiste en fait en une décomposition de cette inertie dans des directions privilégiées
des espaces propres aux représentations des individus et des variables.

1er axe : Axe principal de variabilité du nuage

Direction de Rp qui maximise l’inertie projetée :


On cherche u−
→ telle que Pn GH 2 soit maximale.
1 i=1 i

Choix du 2ème Axe principale

On cherche ensuite un axe −→, orthogonal à −


u2
→, qui maximise l’inertie projetée
u 1

On itère le procédé en cherchant u3 orthogonal au plan formé par −



→ →, −
u →
1 u2 qui maximise
l’inertie projetée

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR

Décomposition de l’inertie

Principe
L’ACP consiste en fait en une décomposition de cette inertie dans des directions privilégiées
des espaces propres aux représentations des individus et des variables.

1er axe : Axe principal de variabilité du nuage

Direction de Rp qui maximise l’inertie projetée :


On cherche u−
→ telle que Pn GH 2 soit maximale.
1 i=1 i

Choix du 2ème Axe principale

On cherche ensuite un axe −→, orthogonal à −


u2
→, qui maximise l’inertie projetée
u 1

On itère le procédé en cherchant u3 orthogonal au plan formé par −



→ →, −
u →
1 u2 qui maximise
l’inertie projetée

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR

Décomposition de l’inertie

Principe
L’ACP consiste en fait en une décomposition de cette inertie dans des directions privilégiées
des espaces propres aux représentations des individus et des variables.

1er axe : Axe principal de variabilité du nuage

Direction de Rp qui maximise l’inertie projetée :


On cherche u−
→ telle que Pn GH 2 soit maximale.
1 i=1 i

Choix du 2ème Axe principale

On cherche ensuite un axe −→, orthogonal à −


u2
→, qui maximise l’inertie projetée
u 1

On itère le procédé en cherchant u3 orthogonal au plan formé par −



→ →, −
u →
1 u2 qui maximise
l’inertie projetée

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR

Décomposition de l’inertie

Principe
L’ACP consiste en fait en une décomposition de cette inertie dans des directions privilégiées
des espaces propres aux représentations des individus et des variables.

1er axe : Axe principal de variabilité du nuage

Direction de Rp qui maximise l’inertie projetée :


On cherche u−
→ telle que Pn GH 2 soit maximale.
1 i=1 i

Choix du 2ème Axe principale

On cherche ensuite un axe −→, orthogonal à −


u2
→, qui maximise l’inertie projetée
u 1

On itère le procédé en cherchant u3 orthogonal au plan formé par −



→ →, −
u →
1 u2 qui maximise
l’inertie projetée

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR

Plan du Chapitre
1 Introduction
Présentation de l’analyse de données
Analyse des données
Principales méthodes d[Pleaseinsertintopreamble]analyse des données
Analyse en composantes principales
2 Rappels mathématiques, notations et données
Vision statistique
Vision matricielle
Vision géométrique
Inerties
3 Ajustement du nuage des individus dans l’espace des variables
Ajustement du nuage des individus
Décomposition de l’inertie
4 Méthode de l’ACP
Détermination des axes principaux
Composantes principales
Qualité et contribution d’un individu
Qualités de la représentation des variables
5 Exemple d’ACP
Résultats relatifs Pr.
aux individus
Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR

Principe

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR

Détermination des axes principaux

Détermination du premier axe I∆ (u1 )


L’axe I∆ (u1 ) recherché correspond au vecteur propre u1 de la matrice des
corrélations R = ZT DZ
Le vecteur propre recherché est donc celui associé à la plus grande valeur
propre

Détermination du deuxième axe I∆ (u2 )


L’axe I∆ (u2 ) recherché est orthogonal au premier.
Le vecteur propre u2 corresponds à la deuxième plus grande valeur propre.
Et ainsi de suite pour les autres axes ∆(uk ).

Axes principaux
Les axes ∆(uk ) sont appelés axes factoriels ou axes principaux.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR

Axes principaux et inertie expliquée

Vecteurs propre et Inertie maximale


Soient u1 , ..., up les vecteurs propres de la matrice de corrélation R et
λ1 , ..., λp les valeurs propres associées telles que :
λ1 ≥ λ2 ≥ ...λp ≥ 0.
En ACP normée, l’espace EK de dimension K d’inertie maximale est :
EK = V ect{u1 , ..., up }.

Variance expliquée et valeurs propres


Valeur propre λj : inertie du nuage de points NI projetée sur l’axe ∆(uj )
= variance expliquée par le j-ème axe.
IEk = λ1 + ... + λK : inertie du nuage de points NI projetée sur l’espace
EK = variance expliquée par les K premiers axes de l’ACP.
I = λ1 + ... + λp : inertie totale.
λi
:mesure la part d’inertie expliquée par l’axe i
λ1 + ... + λp

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR

Axes principaux et inertie expliquée

Vecteurs propre et Inertie maximale


Soient u1 , ..., up les vecteurs propres de la matrice de corrélation R et
λ1 , ..., λp les valeurs propres associées telles que :
λ1 ≥ λ2 ≥ ...λp ≥ 0.
En ACP normée, l’espace EK de dimension K d’inertie maximale est :
EK = V ect{u1 , ..., up }.

Variance expliquée et valeurs propres


Valeur propre λj : inertie du nuage de points NI projetée sur l’axe ∆(uj )
= variance expliquée par le j-ème axe.
IEk = λ1 + ... + λK : inertie du nuage de points NI projetée sur l’espace
EK = variance expliquée par les K premiers axes de l’ACP.
I = λ1 + ... + λp : inertie totale.
λi
:mesure la part d’inertie expliquée par l’axe i
λ1 + ... + λp

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR

Axes principaux et inertie expliquée

Vecteurs propre et Inertie maximale


Soient u1 , ..., up les vecteurs propres de la matrice de corrélation R et
λ1 , ..., λp les valeurs propres associées telles que :
λ1 ≥ λ2 ≥ ...λp ≥ 0.
En ACP normée, l’espace EK de dimension K d’inertie maximale est :
EK = V ect{u1 , ..., up }.

Variance expliquée et valeurs propres


Valeur propre λj : inertie du nuage de points NI projetée sur l’axe ∆(uj )
= variance expliquée par le j-ème axe.
IEk = λ1 + ... + λK : inertie du nuage de points NI projetée sur l’espace
EK = variance expliquée par les K premiers axes de l’ACP.
I = λ1 + ... + λp : inertie totale.
λi
:mesure la part d’inertie expliquée par l’axe i
λ1 + ... + λp

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR

Axes principaux et inertie expliquée

Vecteurs propre et Inertie maximale


Soient u1 , ..., up les vecteurs propres de la matrice de corrélation R et
λ1 , ..., λp les valeurs propres associées telles que :
λ1 ≥ λ2 ≥ ...λp ≥ 0.
En ACP normée, l’espace EK de dimension K d’inertie maximale est :
EK = V ect{u1 , ..., up }.

Variance expliquée et valeurs propres


Valeur propre λj : inertie du nuage de points NI projetée sur l’axe ∆(uj )
= variance expliquée par le j-ème axe.
IEk = λ1 + ... + λK : inertie du nuage de points NI projetée sur l’espace
EK = variance expliquée par les K premiers axes de l’ACP.
I = λ1 + ... + λp : inertie totale.
λi
:mesure la part d’inertie expliquée par l’axe i
λ1 + ... + λp

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR

Axes principaux et inertie expliquée

Vecteurs propre et Inertie maximale


Soient u1 , ..., up les vecteurs propres de la matrice de corrélation R et
λ1 , ..., λp les valeurs propres associées telles que :
λ1 ≥ λ2 ≥ ...λp ≥ 0.
En ACP normée, l’espace EK de dimension K d’inertie maximale est :
EK = V ect{u1 , ..., up }.

Variance expliquée et valeurs propres


Valeur propre λj : inertie du nuage de points NI projetée sur l’axe ∆(uj )
= variance expliquée par le j-ème axe.
IEk = λ1 + ... + λK : inertie du nuage de points NI projetée sur l’espace
EK = variance expliquée par les K premiers axes de l’ACP.
I = λ1 + ... + λp : inertie totale.
λi
:mesure la part d’inertie expliquée par l’axe i
λ1 + ... + λp

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR

Axes principaux et inertie expliquée

Vecteurs propre et Inertie maximale


Soient u1 , ..., up les vecteurs propres de la matrice de corrélation R et
λ1 , ..., λp les valeurs propres associées telles que :
λ1 ≥ λ2 ≥ ...λp ≥ 0.
En ACP normée, l’espace EK de dimension K d’inertie maximale est :
EK = V ect{u1 , ..., up }.

Variance expliquée et valeurs propres


Valeur propre λj : inertie du nuage de points NI projetée sur l’axe ∆(uj )
= variance expliquée par le j-ème axe.
IEk = λ1 + ... + λK : inertie du nuage de points NI projetée sur l’espace
EK = variance expliquée par les K premiers axes de l’ACP.
I = λ1 + ... + λp : inertie totale.
λi
:mesure la part d’inertie expliquée par l’axe i
λ1 + ... + λp

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR

Choix du nombre d’axes

Critère du coude
Existence d’un coude dans le tracé de j 7→ λj =⇒ Conserver les axes associés
aux valeurs propres situées avant le coude (la cassure).

Critère d’inertie moyenne (règle de Kaiser)


Conserver tous les axes apportant une inertie supérieure à la valeur I.M
(Inertie moyenne)=⇒ (Inertie supérieure à 1 en ACP normée)

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR

Choix du nombre d’axes

Critère du coude
Existence d’un coude dans le tracé de j 7→ λj =⇒ Conserver les axes associés
aux valeurs propres situées avant le coude (la cassure).

Critère d’inertie moyenne (règle de Kaiser)


Conserver tous les axes apportant une inertie supérieure à la valeur I.M
(Inertie moyenne)=⇒ (Inertie supérieure à 1 en ACP normée)

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR

Choix du nombre d’axes

Critère du coude
Existence d’un coude dans le tracé de j 7→ λj =⇒ Conserver les axes associés
aux valeurs propres situées avant le coude (la cassure).

Critère d’inertie moyenne (règle de Kaiser)


Conserver tous les axes apportant une inertie supérieure à la valeur I.M
(Inertie moyenne)=⇒ (Inertie supérieure à 1 en ACP normée)

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR

Composantes principales

Coordonnées des individus


La coordonnée cik de l’individu zi sur l’axe principal ∆(uk ) est donnée par sa
projection sur uk .
cik = ziT uk

Composantes principales
Il s’agit des vecteurs ck des coordonnées des individus sur l’axe principal
∆(uk ), c’est à dire
ck = Zuk

Propriétés des composantes principales


Moyenne arithmétique : c¯k = 0.
Variance : var(ck ) = λk .
Covariance : cov(ck , cl ) = 0, Les composantes principales sont donc
décorrélées.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR

Qualité de la représentation d’un individu

Qualité de la représentation d’un individu


La qualité de la représentation d’un individu i sur l’axe principal k est donnée
par le cosinus carré de leur angle, soit

c2ik
Qlt(zi , uk ) = cos2 (zi , uk ) = p
X 2
cil
l=1

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR

Contribution d’un individu à une composante principale

Contribution d’un individu à une composante principale


Il est très utile aussi de calculer pour chaque axe la contribution apportée
par les divers individus à cet axe.
On définit la contribution de l’individu l à un axe principal k par
1 2 n
c
n lk
X 1 2
Ctr(l, k) = où λk = var(ck ) = cik
λk i=1
n

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR

Corrélation des composantes principales et variables

Corrélation des composantes principales et variables

On donne une signification aux composantes principales en reliant ces composantes aux
variables initiales.
Le plus simple est de calculer le coefficient de corrélation linéaire entre une composante
ck et une variable z i donné par
Pn k i
k i j=1 cj zj
cor(c , z ) = √
n λk

Cercle des corrélations


Afin d’interpréter les axes principaux obtenus, On représente traditionnellement chaque
variable z i par un point de coordonnées
 
i i i
cor(z , c1 ), cor(z , c2 ), cor(z , c3 ), ...

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR

Plan du Chapitre
1 Introduction
Présentation de l’analyse de données
Analyse des données
Principales méthodes d[Pleaseinsertintopreamble]analyse des données
Analyse en composantes principales
2 Rappels mathématiques, notations et données
Vision statistique
Vision matricielle
Vision géométrique
Inerties
3 Ajustement du nuage des individus dans l’espace des variables
Ajustement du nuage des individus
Décomposition de l’inertie
4 Méthode de l’ACP
Détermination des axes principaux
Composantes principales
Qualité et contribution d’un individu
Qualités de la représentation des variables
5 Exemple d’ACP
Résultats relatifs Pr.
aux individus
Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR

Données de l’exemple

Données
Ci-dessous, un tableau de notes attribuées à 9 sujets dans 5 matières.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR

Données de l’exemple

Données centrées réduites :


En général, les variables retenues pour décrire les individus sont exprimées avec
des unités différentes, et ne sont pas directement comparables entre elles. Dans
la plupart des cas, on procède donc à un centrage réduction des variables de
départ.
On définit ainsi p variables Z1 , Z2 , ..., Zp .

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR

Corrélations des variables prises deux à deux

Matrice de corrélation
Comme les variables sont centrées réduites, la corrélation entre la variable Zk
n
1X
et la variable Zl est simplement Zik Zil
n i=1

Corrélation
Dans notre exemple, toutes les variables sont corrélées positivement. La
corrélation est forte entre les 2 premières, et entre la 3è et la 4è. La cinquième
est faiblement corrélée aux autres variables.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR

Valeurs propres et vecteurs propres. Composantes principales

Composantes principales
Les composantes principales CP 1, CP 2, ..., CPp sont des variables obtenues comme
combinaisons linéaires des variables de départ, et qui vérifient les propriétés suivantes :
CP1 représente la direction de plus grande dispersion du nuage de points.
CP2 représente la direction de plus grande dispersion des résidus, une fois l’effet
de CP1 pris en compte.
même chose pour CP3 , CP4 , etc

Valeurs propres
Les variables CPk ne sont en général pas réduites : la variance de la composante
principale CPk est égale à la k-ième valeur propre.
Il s’agit en fait des valeurs propres de la matrice des corrélations.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR

Résultats relatifs aux individus

Scores des individus


Les scores des individus sont les valeurs des composantes principales sur les individus.

Contributions des individus


La contribution relative d’un individu i à la formation de la composante principale k
est l’inertie relative de cet individu sur l’axe factoriel k. Elle est définie par :

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR

Résultats relatifs aux individus

Qualités de la représentation des individus


La qualité de la représentation d’un individu i par la composante principale k est
définie par :

Géométriquement
Géométriquement, la qualité de la représentation d’un individu i par la composante
~ i , CP
principale k est égale à cos2 θ , où θ est l’angle (OM ~ k ). Elle mesure la
"déformation" due à la projection sur la composante principale CPk .

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR

Résultats relatifs aux individus

la qualité de représentation d’un individu par un plan


Les qualités de représentation sont additives. Par exemple, la qualité de représentation
d’un individu i par le plan (CP1 , CP2 ) est donnée par :

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR

Résultats relatifs aux variables

Saturations des variables


Les saturations des variables sont les coefficients de corrélation entre les
variables (centrées réduites) de départ et les variables factorielles :
SAT (Zj , CPk ) = ρ(Zj , CPk )
Les variables de départ sont centrées réduites, les variables principales sont
centrées, et de variances égales aux valeurs propres correspondantes. On peut
donc retrouver les saturations à l’aide d’un calcul tel que :

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR

Résultats relatifs aux variables

Contributions des variables


Les contributions des variables à la formation des composantes principales sont
définies de la même façon que celles des individus :

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR

Résultats relatifs aux variables

Qualités de la représentation des variables


La qualité de la représentation d’une variable par une composante principale est définie de la
même façon que pour les individus :

Qualités de la représentation des variables

Comme les variables Zi sont normées, la qualité est simplement le carré de la saturation
de la variable par rapport à la composante principale.
Comme dans le cas des individus, les qualités des représentations d’une variable selon les
composantes principales s’additionnent
Graphiquement, la qualité de la représentation d’une variable dans le plan (CP1, CP2)
est le carré de la norme (longueur) du vecteur représentant cette variable (projection de
cette variable dans le plan).

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Plan du Chapitre
1 Introduction
Présentation de l’analyse de données
Analyse des données
Principales méthodes d[Pleaseinsertintopreamble]analyse des données
Analyse en composantes principales
2 Rappels mathématiques, notations et données
Vision statistique
Vision matricielle
Vision géométrique
Inerties
3 Ajustement du nuage des individus dans l’espace des variables
Ajustement du nuage des individus
Décomposition de l’inertie
4 Méthode de l’ACP
Détermination des axes principaux
Composantes principales
Qualité et contribution d’un individu
Qualités de la représentation des variables
5 Exemple d’ACP
Résultats relatifs Pr.
aux individus
Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

ACP et FactoMineR
Installation du logiciel R et RStudio

Liens d’installation du logiciel R et RStudio


Installation du logiciel R sous Windows
Installation du logiciel R sous Mac OS X
Installation de RStudio

Les données du Décastar


On va utiliser une partie du jeu de données décathlon
(inclus dans le package FactoMineR).

library(FactoMineR)
data(decatlon)

A l’origine le jeu de données comporte les résultats de 13 athlètes aux 10 épreuves du


décathlon, et ce pour deux compétitions, le Décastar et les jeux olympiques.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Decathlon

Il s’agit donc d’un jeu de données qui comprend les résultats pour différentes épreuves
du Décathlon (en colonnes) de plusieurs athlètes (en lignes).

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

ACP Decathlon

Fonction PCA
resultat=PCA(decathlon[,1 :10], graph=FALSE)

Ce résultat comprend 3 éléments principaux :


eig : des infos sur les eigenvalues (ou “valeurs propres”), qui vont nous permettre
d’évaluer la qualité de l’ACP. J’y reviendrai dans la partie suivante.
ind : des infos sur les individus (lignes du tableau initial)
var : des infos sur les variables (colonnes du tableau initial)
=⇒ ind et var contiennent tous deux des éléments d’information
correspondant à
coord les coordonnées des individus ou variables sur les axes principaux
cos2 qui permet d’évaluer si un individu ou une variable en particulier est bien
représenté sur les axes principaux
contrib qui permet d’évaluer le “poids” d’un individu ou d’une variable particuliers
dans le calcul des axes.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

ACP Decathlon

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des variables


Cercle de corrélation

Code
La représentation des variables dans le plan factoriel, aussi appelé cercle des
corrélations, permet d’évaluer la liaison entre les variables :
plot.PCA(resultat, choix="var")

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des variables


Cercle de corrélation

Code
La représentation des variables dans le plan factoriel, aussi appelé cercle des
corrélations, permet d’évaluer la liaison entre les variables :
plot.PCA(resultat, choix="var")
PCA graph of variables
Dim 2 (17.37%)

1.0

Discus
400m
Shot.put
0.5 1500m

High.jump
110m.hurdle Javeline

100m

0.0

Pole.vault

Long.jump
-0.5

-1.0

-1.0 -0.5 0.0 0.5 1.0


Dim 1 (32.72%)

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des variables


Cercle de corrélation

Corrélation
Soit θ l’angle entre deux variables
θ ≈ 0 =⇒ la corrélation est proche de 1
θ ≈ 90 =⇒ la corrélation est proche de 0
θ ≈ 180 =⇒ la corrélation est proche de -1

Exemple d’interprétation
Les performances des sportifs semblent corrélées positivement pour les disciplines
de "force" Discus,Shot.put,High.jump.
Les disciplines de "vitesse" 400m, 110m.hurdle 100m sont aussi positivement
corrélées les unes aux autres.
La performance en Long.jump est inversement corrélée aux résultats de vitesse

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des variables


Cercle de corrélation

Corrélation
Soit θ l’angle entre deux variables
θ ≈ 0 =⇒ la corrélation est proche de 1
θ ≈ 90 =⇒ la corrélation est proche de 0
θ ≈ 180 =⇒ la corrélation est proche de -1

Exemple d’interprétation
Les performances des sportifs semblent corrélées positivement pour les disciplines
de "force" Discus,Shot.put,High.jump.
Les disciplines de "vitesse" 400m, 110m.hurdle 100m sont aussi positivement
corrélées les unes aux autres.
La performance en Long.jump est inversement corrélée aux résultats de vitesse

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des variables


Cercle de corrélation

Corrélation
Soit θ l’angle entre deux variables
θ ≈ 0 =⇒ la corrélation est proche de 1
θ ≈ 90 =⇒ la corrélation est proche de 0
θ ≈ 180 =⇒ la corrélation est proche de -1

Exemple d’interprétation
Les performances des sportifs semblent corrélées positivement pour les disciplines
de "force" Discus,Shot.put,High.jump.
Les disciplines de "vitesse" 400m, 110m.hurdle 100m sont aussi positivement
corrélées les unes aux autres.
La performance en Long.jump est inversement corrélée aux résultats de vitesse

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des variables


Cercle de corrélation

Corrélation
Soit θ l’angle entre deux variables
θ ≈ 0 =⇒ la corrélation est proche de 1
θ ≈ 90 =⇒ la corrélation est proche de 0
θ ≈ 180 =⇒ la corrélation est proche de -1

Exemple d’interprétation
Les performances des sportifs semblent corrélées positivement pour les disciplines
de "force" Discus,Shot.put,High.jump.
Les disciplines de "vitesse" 400m, 110m.hurdle 100m sont aussi positivement
corrélées les unes aux autres.
La performance en Long.jump est inversement corrélée aux résultats de vitesse

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des variables


Qualité de représentation d’une variable

Qualité de représentation
La qualité de représentation d’une variable par un axe peut être évaluée à travers
le cosinus carré de l’angle entre la variable et l’axe considéré.
La qualité de représentation sur les deux axes (i.e. la somme des cosinus carrés)
correspond à la longueur de la flèche
Plus la pointe de la flèche est proche du cercle, plus la représentation de la
variable dans le plan factoriel est "de qualité ".

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des variables


Qualité de représentation d’une variable

Qualité de représentation
La qualité de représentation d’une variable par un axe peut être évaluée à travers
le cosinus carré de l’angle entre la variable et l’axe considéré.
La qualité de représentation sur les deux axes (i.e. la somme des cosinus carrés)
correspond à la longueur de la flèche
Plus la pointe de la flèche est proche du cercle, plus la représentation de la
variable dans le plan factoriel est "de qualité ".

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des variables


Qualité de représentation d’une variable

Qualité de représentation
La qualité de représentation d’une variable par un axe peut être évaluée à travers
le cosinus carré de l’angle entre la variable et l’axe considéré.
La qualité de représentation sur les deux axes (i.e. la somme des cosinus carrés)
correspond à la longueur de la flèche
Plus la pointe de la flèche est proche du cercle, plus la représentation de la
variable dans le plan factoriel est "de qualité ".

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des variables


Qualité de représentation d’une variable

Qualité de représentation
La qualité de représentation d’une variable par un axe peut être évaluée à travers
le cosinus carré de l’angle entre la variable et l’axe considéré.
La qualité de représentation sur les deux axes (i.e. la somme des cosinus carrés)
correspond à la longueur de la flèche
Plus la pointe de la flèche est proche du cercle, plus la représentation de la
variable dans le plan factoriel est "de qualité ".

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des individus

Code
Pour représenter Le graphique des individus,on utilise la ligne de code suivante :
plot.PCA(resultat, choix="ind")

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des individus

Code
Pour représenter Le graphique des individus,on utilise la ligne de code suivante :
plot.PCA(resultat, choix="ind")

PCA graph of individuals


Dim 2 (17.37%)

Casarsa

2.5
Parkhomenko YURKOV
Korkizoglou
Sebrle
Zsivoczky Macey
HERNU Terek Smith SEBRLE
MARTINEAU Turi Pogorelov CLAY Clay
Barras McMULLEN KARPOV Karpov
0.0 BOURGUIGNON Uldal BARRAS
Qi Schoenbeck Bernard
Karlivans BERNARD Ojaniemi Hernu
Smirnov
ZSIVOCZKY
Lorenzo Gomez Averyanov
NOOL Schwarzl
Nool Warners
-2.5 WARNERS
Drews

-3 0 3
Dim 1 (32.72%)

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des individus

Ressemblances entre individus


Plus les individus sont proches, plus leurs "profils" de performance sont
vraisemblablement similaires.
Parkhomenko et Korkizoglou, en haut à gauche, ou Karpov, Sebrle et Clay à
droite.
Les coordonnées des individus peuvent servir de base pour définir des classes
d’individus

Qualité de représentation
Les individus les mieux représentés par le plan factoriel sont ceux les plus éloignés
du centre.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des individus

Ressemblances entre individus


Plus les individus sont proches, plus leurs "profils" de performance sont
vraisemblablement similaires.
Parkhomenko et Korkizoglou, en haut à gauche, ou Karpov, Sebrle et Clay à
droite.
Les coordonnées des individus peuvent servir de base pour définir des classes
d’individus

Qualité de représentation
Les individus les mieux représentés par le plan factoriel sont ceux les plus éloignés
du centre.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des individus

Ressemblances entre individus


Plus les individus sont proches, plus leurs "profils" de performance sont
vraisemblablement similaires.
Parkhomenko et Korkizoglou, en haut à gauche, ou Karpov, Sebrle et Clay à
droite.
Les coordonnées des individus peuvent servir de base pour définir des classes
d’individus

Qualité de représentation
Les individus les mieux représentés par le plan factoriel sont ceux les plus éloignés
du centre.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des individus

Ressemblances entre individus


Plus les individus sont proches, plus leurs "profils" de performance sont
vraisemblablement similaires.
Parkhomenko et Korkizoglou, en haut à gauche, ou Karpov, Sebrle et Clay à
droite.
Les coordonnées des individus peuvent servir de base pour définir des classes
d’individus

Qualité de représentation
Les individus les mieux représentés par le plan factoriel sont ceux les plus éloignés
du centre.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Position des individus

Ressemblances entre individus


Plus les individus sont proches, plus leurs "profils" de performance sont
vraisemblablement similaires.
Parkhomenko et Korkizoglou, en haut à gauche, ou Karpov, Sebrle et Clay à
droite.
Les coordonnées des individus peuvent servir de base pour définir des classes
d’individus

Qualité de représentation
Les individus les mieux représentés par le plan factoriel sont ceux les plus éloignés
du centre.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR

Pratique de l’ACP

Pratique de l’ACP
1 Choisir de réduire ou non les variables.
2 Réaliser l’ACP.
3 Choisir le nombre de dimensions à interpréter.
4 Interpréter simultanément le graphe des individus et celui des variables.
5 Utiliser les indicateurs pour enrichir l’interprétation.
6 Revenir aux données brutes pour interpréter.

Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos

Vous aimerez peut-être aussi