Cours Acp Master
Cours Acp Master
17 décembre 2024
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR
Plan du Chapitre
1 Introduction
Présentation de l’analyse de données
Analyse des données
Principales méthodes d[Pleaseinsertintopreamble]analyse des données
Analyse en composantes principales
2 Rappels mathématiques, notations et données
Vision statistique
Vision matricielle
Vision géométrique
Inerties
3 Ajustement du nuage des individus dans l’espace des variables
Ajustement du nuage des individus
Décomposition de l’inertie
4 Méthode de l’ACP
Détermination des axes principaux
Composantes principales
Qualité et contribution d’un individu
Qualités de la représentation des variables
5 Exemple d’ACP
Résultats relatifs Pr.
aux individus
Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR
Méthodes de classification
Réduire la taille de l’ensemble des individus en formant des groupes homogènes
Méthodes factorielles
Réduire le nombre de variables en les résumant par un petit nombre de
composantes synthétiques.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR
Motivation
Motivation
I L’Analyse en Composantes Principales (ACP) est la méthode de base en
statistique exploratoire multidimensionnelle (ou analyse des données)
Multidimensionnelle : l’analyse porte sur plusieurs variables
Exploratoire : descriptive (par opposition à inférentielle)
I Il s’agit de résumer l’information portant sur plusieurs variables en
Faisant émerger des liaisons entre variables.
Formant des groupes d’individus qui se ressemblent.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR
Motivation
Motivation
I L’Analyse en Composantes Principales (ACP) est la méthode de base en
statistique exploratoire multidimensionnelle (ou analyse des données)
Multidimensionnelle : l’analyse porte sur plusieurs variables
Exploratoire : descriptive (par opposition à inférentielle)
I Il s’agit de résumer l’information portant sur plusieurs variables en
Faisant émerger des liaisons entre variables.
Formant des groupes d’individus qui se ressemblent.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR
Motivation
Motivation
I L’Analyse en Composantes Principales (ACP) est la méthode de base en
statistique exploratoire multidimensionnelle (ou analyse des données)
Multidimensionnelle : l’analyse porte sur plusieurs variables
Exploratoire : descriptive (par opposition à inférentielle)
I Il s’agit de résumer l’information portant sur plusieurs variables en
Faisant émerger des liaisons entre variables.
Formant des groupes d’individus qui se ressemblent.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR
Motivation
Motivation
I L’Analyse en Composantes Principales (ACP) est la méthode de base en
statistique exploratoire multidimensionnelle (ou analyse des données)
Multidimensionnelle : l’analyse porte sur plusieurs variables
Exploratoire : descriptive (par opposition à inférentielle)
I Il s’agit de résumer l’information portant sur plusieurs variables en
Faisant émerger des liaisons entre variables.
Formant des groupes d’individus qui se ressemblent.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Analyse des données
Ajustement du nuage des individus dans l’espace des variables
Principales méthodes d’analyse des données
Méthode de l’ACP
Analyse en composantes principales
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Plan du Chapitre
1 Introduction
Présentation de l’analyse de données
Analyse des données
Principales méthodes d[Pleaseinsertintopreamble]analyse des données
Analyse en composantes principales
2 Rappels mathématiques, notations et données
Vision statistique
Vision matricielle
Vision géométrique
Inerties
3 Ajustement du nuage des individus dans l’espace des variables
Ajustement du nuage des individus
Décomposition de l’inertie
4 Méthode de l’ACP
Détermination des axes principaux
Composantes principales
Qualité et contribution d’un individu
Qualités de la représentation des variables
5 Exemple d’ACP
Résultats relatifs Pr.
aux individus
Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Variable
On appelle "variable" un vecteur x de taille n. Chaque coordonnée xi correspond à la valeur
prise par l’un individu i. On s’intéresse ici à des valeurs numériques.
Poids
Chaque individu peut avoir un poids pi, tel que p1 + ... + pn = 1, notamment quand les
individus n’ont pas la même importance (échantillons redressés, données regroupées,...). On a
souvent p = 1/n.
Moyenne arithmétique
Pn
On note : x̄ = i=1 pi xi = p1 x1 + ... + pn xn .
Variance et écart-type
2 Pn
La variance de x est définie par : var(x) = σx = i=1 pi (xi − x̄)2 . L’écart-type σx est la
racine carrée de la variance.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Covariance
La covariance observée
P entre deux variables x et Pyn est définie par :
cov(x, y) = σxy = n i=1 pi (xi − x̄)(yi − ȳ) = i=1 pi xi yi − x̄ȳ..
Coefficient de corrélation
Le Coefficient corrélation est donné par :
σxy cov(x, y)
cor(x, y) = rxy = = p p
σx σy var(x) var(y)
.
−1 ≤ cor(x, y) ≤ 1
|cor(x, y)| = 1 =⇒ Variables liées
cor(x, y) = 0 =⇒ Variables décorrélées.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Tableau de données
Matrice
On note xji la valeur de la variable xj pour le ie individu. X = (x1 , ..., xn ) est
une matrice rectangulaire à n lignes et p colonnes.
x1 x21 ... xp1
1
1 2 p
j
x1 x1 x2 ... x2
.. .. .. ..
xj2 . . . .
xj = . , X =
x1i ... xj ...
.. i
. .. .. ..
xjn .. . . .
x1n ... ... xpn
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
p 0
1
..
.
Dp =
pi
..
.
0 pn
Symétrie
La matrice Dp est diagonale donc symétrique : D0p = Dp
Cas uniforme
Tous les individus ont le même poids pi = 1/n et Dp = 1/nIn
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Point moyen
C’est le vecteur g des moyennes arithmétiques de chaque variable :
n
X
g0 = (x̄1 , ..., x̄p ) = pi e0i .
i=1
Tableau centré
En centrant les variables autour de leur moyenne, on obtient : yij = xji − x̄j ,
sous forme matricielle
Y = X − In g0
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Matrice de variance-covariance
Matrice de variance-covariance
C’est une matrice carrée de dimension p.
Où σjl représente la covariance des variables xj et xl . σj2 est la variance de la
variable xj .
Forme matricielle : V = X0 Dp X − gg0 = Y0 Dp Y.
σ12
σ12 ... σ1p
σ21
V= .
.. ..
.
σp1 σp2
Symétrie
Comme σjl = σlj la matrice V est symétrique : V0 = V .
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Matrice de corrélation
Matrice de corrélation
C’est une matrice de dimension p × p, avec rjl = σσjl
j σl
est le coefficient de
corrélation.
Symétrie : Comme rjl = rlj , la matrice R est symétrique : R0 = R.
Forme matricielle : R = D1/σ VD1/σ .
1 r12 ... r1p
r21
R= .
.. ..
.
rp1 1
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Nuage de points
Nuage de points
Chaque individu est considéré comme un point d’un espace vectoriel F de
dimension p. Ses coordonnées dans F sont (x1i , ..., xpi ).
L’ensemble des individus est un nuage de points dans F et g est son centre de
gravité. ( )
X n
p
N = (xi , pi )|xi ∈ R , pi > 0 et pi = 1
i=1
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Motivation
Afin de pouvoir considérer la structure du nuage des individus, il faut définir une distance, qui
induira une géométrie.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Métrique
Métrique
Une métrique est une matrice permettant de définir un produit scalaire et donc des
distances entre individus ou entre variables. La métrique que l’on utilise de manière
naturelle pour mesurer les proximités entre variables est celle définie par la matrice Dp
qui est la métrique de la covariance quand les variables sont centrées :
Espace métrique
Soit M = diag(mj ), où m1 , ..., mp sont des réels strictement positifs.
L’espace Rp est muni d’un produit scalaire grâce à une matrice M symétrique et
définie positive :
Xp
hu, viM = mj uj vj = u0 Mv
j=1
p
X
hu, uiM = mj u2j = u0 Mu = kuk2M .
j=1
d2M (u, v) = ku − vk2M
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Métrique
Orthogonalité
On dit que u et v sont M-orthogonaux si hu, viM = 0
Métrique usuelle
Si m1 , ..., mp = 1, alors M = Ip et on note hu, vi = hu, viI .
Métrique réduite
Diviser les variables par σj est équivalent à prendre mj = 1/σ 2 . On D1/σ2 = D1/σ D1/σ et
donc
0 0
hD1/σ u, D1/σ vi = u D1/σ D1/σ v = u D1/σ2 v = hu, viD 2 1/σ
Il est équivalent de travailler avec la métrique D1/σ2 sur le tableau X, ou avec la métrique
euclidienne I sur le tableau centré réduit Z composé des données :
j xji − x̄j
zi =
σj
Le tableau de données centré réduit Z se calcule matriciellement ainsi :
>
Z = YD1/σ = (X − 1m )D1/σ
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Inerties
Inertie en un point
L’inertie du nuage de points {x1 , ..., xn } en un point quelconque v est donnée par :
n n n
0
X 2
X X 2
Iv = pi kxi − vkM = pi (xi − v) M(xi − v) = pi dM (xi , v)
i=1 i=1 i=1
Inertie totale
La plus petite inertie possible est Ig , donnée par :
n n n
0
X 2
X X 2
Ig = pi kxi − gkM = pi (xi − g) M(xi − g) = pi dM (xi , g),
i=1 i=1 i=1
Conséquence : Iv = Ig + kv − gk2M = Ig + d2M (v, g).
Interprétation : L’inertie totale mesure l’étalement du nuage de points
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Calcul de l’inertie
Forme matricielle
L’inertie totale est aussi donnée par la trace de la matrice VM (ou MV)
Ig = T r(VM) = T r(MV)
Métrique usuelle
M = Ip correspond au produit scalaire usuel et
p
X 2
Ig = T r(V) = σi
j=1
Métrique réduite
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Où d2M (xi , ∆) = d2M (xi , xˆi ) en notant xˆi le projeté orthogonal de xi sur ∆.
Cette inertie quantifie la dispersion du nuage des individus autour de ∆
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Vision statistique
Ajustement du nuage des individus dans l’espace des variables Vision matricielle
Méthode de l’ACP Vision géométrique
Exemple d’ACP Inerties
ACP et FactoMineR
Où d2M (xi , F) = d2M (xi , xˆi ) en notant xˆi le projeté orthogonal de xi sur F.
Cette inertie quantifie la dispersion du nuage des individus dans F.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR
Plan du Chapitre
1 Introduction
Présentation de l’analyse de données
Analyse des données
Principales méthodes d[Pleaseinsertintopreamble]analyse des données
Analyse en composantes principales
2 Rappels mathématiques, notations et données
Vision statistique
Vision matricielle
Vision géométrique
Inerties
3 Ajustement du nuage des individus dans l’espace des variables
Ajustement du nuage des individus
Décomposition de l’inertie
4 Méthode de l’ACP
Détermination des axes principaux
Composantes principales
Qualité et contribution d’un individu
Qualités de la représentation des variables
5 Exemple d’ACP
Résultats relatifs Pr.
aux individus
Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR
Décomposition de l’inertie
Principe
L’ACP consiste en fait en une décomposition de cette inertie dans des directions privilégiées
des espaces propres aux représentations des individus et des variables.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR
Décomposition de l’inertie
Principe
L’ACP consiste en fait en une décomposition de cette inertie dans des directions privilégiées
des espaces propres aux représentations des individus et des variables.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR
Décomposition de l’inertie
Principe
L’ACP consiste en fait en une décomposition de cette inertie dans des directions privilégiées
des espaces propres aux représentations des individus et des variables.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Ajustement du nuage des individus
Méthode de l’ACP Décomposition de l’inertie
Exemple d’ACP
ACP et FactoMineR
Décomposition de l’inertie
Principe
L’ACP consiste en fait en une décomposition de cette inertie dans des directions privilégiées
des espaces propres aux représentations des individus et des variables.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR
Plan du Chapitre
1 Introduction
Présentation de l’analyse de données
Analyse des données
Principales méthodes d[Pleaseinsertintopreamble]analyse des données
Analyse en composantes principales
2 Rappels mathématiques, notations et données
Vision statistique
Vision matricielle
Vision géométrique
Inerties
3 Ajustement du nuage des individus dans l’espace des variables
Ajustement du nuage des individus
Décomposition de l’inertie
4 Méthode de l’ACP
Détermination des axes principaux
Composantes principales
Qualité et contribution d’un individu
Qualités de la représentation des variables
5 Exemple d’ACP
Résultats relatifs Pr.
aux individus
Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR
Principe
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR
Axes principaux
Les axes ∆(uk ) sont appelés axes factoriels ou axes principaux.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR
Critère du coude
Existence d’un coude dans le tracé de j 7→ λj =⇒ Conserver les axes associés
aux valeurs propres situées avant le coude (la cassure).
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR
Critère du coude
Existence d’un coude dans le tracé de j 7→ λj =⇒ Conserver les axes associés
aux valeurs propres situées avant le coude (la cassure).
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR
Critère du coude
Existence d’un coude dans le tracé de j 7→ λj =⇒ Conserver les axes associés
aux valeurs propres situées avant le coude (la cassure).
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR
Composantes principales
Composantes principales
Il s’agit des vecteurs ck des coordonnées des individus sur l’axe principal
∆(uk ), c’est à dire
ck = Zuk
c2ik
Qlt(zi , uk ) = cos2 (zi , uk ) = p
X 2
cil
l=1
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données Détermination des axes principaux
Ajustement du nuage des individus dans l’espace des variables Composantes principales
Méthode de l’ACP Qualité et contribution d’un individu
Exemple d’ACP Qualités de la représentation des variables
ACP et FactoMineR
On donne une signification aux composantes principales en reliant ces composantes aux
variables initiales.
Le plus simple est de calculer le coefficient de corrélation linéaire entre une composante
ck et une variable z i donné par
Pn k i
k i j=1 cj zj
cor(c , z ) = √
n λk
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR
Plan du Chapitre
1 Introduction
Présentation de l’analyse de données
Analyse des données
Principales méthodes d[Pleaseinsertintopreamble]analyse des données
Analyse en composantes principales
2 Rappels mathématiques, notations et données
Vision statistique
Vision matricielle
Vision géométrique
Inerties
3 Ajustement du nuage des individus dans l’espace des variables
Ajustement du nuage des individus
Décomposition de l’inertie
4 Méthode de l’ACP
Détermination des axes principaux
Composantes principales
Qualité et contribution d’un individu
Qualités de la représentation des variables
5 Exemple d’ACP
Résultats relatifs Pr.
aux individus
Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR
Données de l’exemple
Données
Ci-dessous, un tableau de notes attribuées à 9 sujets dans 5 matières.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR
Données de l’exemple
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR
Matrice de corrélation
Comme les variables sont centrées réduites, la corrélation entre la variable Zk
n
1X
et la variable Zl est simplement Zik Zil
n i=1
Corrélation
Dans notre exemple, toutes les variables sont corrélées positivement. La
corrélation est forte entre les 2 premières, et entre la 3è et la 4è. La cinquième
est faiblement corrélée aux autres variables.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR
Composantes principales
Les composantes principales CP 1, CP 2, ..., CPp sont des variables obtenues comme
combinaisons linéaires des variables de départ, et qui vérifient les propriétés suivantes :
CP1 représente la direction de plus grande dispersion du nuage de points.
CP2 représente la direction de plus grande dispersion des résidus, une fois l’effet
de CP1 pris en compte.
même chose pour CP3 , CP4 , etc
Valeurs propres
Les variables CPk ne sont en général pas réduites : la variance de la composante
principale CPk est égale à la k-ième valeur propre.
Il s’agit en fait des valeurs propres de la matrice des corrélations.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR
Géométriquement
Géométriquement, la qualité de la représentation d’un individu i par la composante
~ i , CP
principale k est égale à cos2 θ , où θ est l’angle (OM ~ k ). Elle mesure la
"déformation" due à la projection sur la composante principale CPk .
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Résultats relatifs aux individus
Méthode de l’ACP Résultats relatifs aux variables
Exemple d’ACP
ACP et FactoMineR
Comme les variables Zi sont normées, la qualité est simplement le carré de la saturation
de la variable par rapport à la composante principale.
Comme dans le cas des individus, les qualités des représentations d’une variable selon les
composantes principales s’additionnent
Graphiquement, la qualité de la représentation d’une variable dans le plan (CP1, CP2)
est le carré de la norme (longueur) du vecteur représentant cette variable (projection de
cette variable dans le plan).
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Plan du Chapitre
1 Introduction
Présentation de l’analyse de données
Analyse des données
Principales méthodes d[Pleaseinsertintopreamble]analyse des données
Analyse en composantes principales
2 Rappels mathématiques, notations et données
Vision statistique
Vision matricielle
Vision géométrique
Inerties
3 Ajustement du nuage des individus dans l’espace des variables
Ajustement du nuage des individus
Décomposition de l’inertie
4 Méthode de l’ACP
Détermination des axes principaux
Composantes principales
Qualité et contribution d’un individu
Qualités de la représentation des variables
5 Exemple d’ACP
Résultats relatifs Pr.
aux individus
Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
ACP et FactoMineR
Installation du logiciel R et RStudio
library(FactoMineR)
data(decatlon)
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Decathlon
Il s’agit donc d’un jeu de données qui comprend les résultats pour différentes épreuves
du Décathlon (en colonnes) de plusieurs athlètes (en lignes).
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
ACP Decathlon
Fonction PCA
resultat=PCA(decathlon[,1 :10], graph=FALSE)
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
ACP Decathlon
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Code
La représentation des variables dans le plan factoriel, aussi appelé cercle des
corrélations, permet d’évaluer la liaison entre les variables :
plot.PCA(resultat, choix="var")
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Code
La représentation des variables dans le plan factoriel, aussi appelé cercle des
corrélations, permet d’évaluer la liaison entre les variables :
plot.PCA(resultat, choix="var")
PCA graph of variables
Dim 2 (17.37%)
1.0
Discus
400m
Shot.put
0.5 1500m
High.jump
110m.hurdle Javeline
100m
0.0
Pole.vault
Long.jump
-0.5
-1.0
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Corrélation
Soit θ l’angle entre deux variables
θ ≈ 0 =⇒ la corrélation est proche de 1
θ ≈ 90 =⇒ la corrélation est proche de 0
θ ≈ 180 =⇒ la corrélation est proche de -1
Exemple d’interprétation
Les performances des sportifs semblent corrélées positivement pour les disciplines
de "force" Discus,Shot.put,High.jump.
Les disciplines de "vitesse" 400m, 110m.hurdle 100m sont aussi positivement
corrélées les unes aux autres.
La performance en Long.jump est inversement corrélée aux résultats de vitesse
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Corrélation
Soit θ l’angle entre deux variables
θ ≈ 0 =⇒ la corrélation est proche de 1
θ ≈ 90 =⇒ la corrélation est proche de 0
θ ≈ 180 =⇒ la corrélation est proche de -1
Exemple d’interprétation
Les performances des sportifs semblent corrélées positivement pour les disciplines
de "force" Discus,Shot.put,High.jump.
Les disciplines de "vitesse" 400m, 110m.hurdle 100m sont aussi positivement
corrélées les unes aux autres.
La performance en Long.jump est inversement corrélée aux résultats de vitesse
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Corrélation
Soit θ l’angle entre deux variables
θ ≈ 0 =⇒ la corrélation est proche de 1
θ ≈ 90 =⇒ la corrélation est proche de 0
θ ≈ 180 =⇒ la corrélation est proche de -1
Exemple d’interprétation
Les performances des sportifs semblent corrélées positivement pour les disciplines
de "force" Discus,Shot.put,High.jump.
Les disciplines de "vitesse" 400m, 110m.hurdle 100m sont aussi positivement
corrélées les unes aux autres.
La performance en Long.jump est inversement corrélée aux résultats de vitesse
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Corrélation
Soit θ l’angle entre deux variables
θ ≈ 0 =⇒ la corrélation est proche de 1
θ ≈ 90 =⇒ la corrélation est proche de 0
θ ≈ 180 =⇒ la corrélation est proche de -1
Exemple d’interprétation
Les performances des sportifs semblent corrélées positivement pour les disciplines
de "force" Discus,Shot.put,High.jump.
Les disciplines de "vitesse" 400m, 110m.hurdle 100m sont aussi positivement
corrélées les unes aux autres.
La performance en Long.jump est inversement corrélée aux résultats de vitesse
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Qualité de représentation
La qualité de représentation d’une variable par un axe peut être évaluée à travers
le cosinus carré de l’angle entre la variable et l’axe considéré.
La qualité de représentation sur les deux axes (i.e. la somme des cosinus carrés)
correspond à la longueur de la flèche
Plus la pointe de la flèche est proche du cercle, plus la représentation de la
variable dans le plan factoriel est "de qualité ".
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Qualité de représentation
La qualité de représentation d’une variable par un axe peut être évaluée à travers
le cosinus carré de l’angle entre la variable et l’axe considéré.
La qualité de représentation sur les deux axes (i.e. la somme des cosinus carrés)
correspond à la longueur de la flèche
Plus la pointe de la flèche est proche du cercle, plus la représentation de la
variable dans le plan factoriel est "de qualité ".
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Qualité de représentation
La qualité de représentation d’une variable par un axe peut être évaluée à travers
le cosinus carré de l’angle entre la variable et l’axe considéré.
La qualité de représentation sur les deux axes (i.e. la somme des cosinus carrés)
correspond à la longueur de la flèche
Plus la pointe de la flèche est proche du cercle, plus la représentation de la
variable dans le plan factoriel est "de qualité ".
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Qualité de représentation
La qualité de représentation d’une variable par un axe peut être évaluée à travers
le cosinus carré de l’angle entre la variable et l’axe considéré.
La qualité de représentation sur les deux axes (i.e. la somme des cosinus carrés)
correspond à la longueur de la flèche
Plus la pointe de la flèche est proche du cercle, plus la représentation de la
variable dans le plan factoriel est "de qualité ".
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Code
Pour représenter Le graphique des individus,on utilise la ligne de code suivante :
plot.PCA(resultat, choix="ind")
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Code
Pour représenter Le graphique des individus,on utilise la ligne de code suivante :
plot.PCA(resultat, choix="ind")
Casarsa
2.5
Parkhomenko YURKOV
Korkizoglou
Sebrle
Zsivoczky Macey
HERNU Terek Smith SEBRLE
MARTINEAU Turi Pogorelov CLAY Clay
Barras McMULLEN KARPOV Karpov
0.0 BOURGUIGNON Uldal BARRAS
Qi Schoenbeck Bernard
Karlivans BERNARD Ojaniemi Hernu
Smirnov
ZSIVOCZKY
Lorenzo Gomez Averyanov
NOOL Schwarzl
Nool Warners
-2.5 WARNERS
Drews
-3 0 3
Dim 1 (32.72%)
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Qualité de représentation
Les individus les mieux représentés par le plan factoriel sont ceux les plus éloignés
du centre.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Qualité de représentation
Les individus les mieux représentés par le plan factoriel sont ceux les plus éloignés
du centre.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Qualité de représentation
Les individus les mieux représentés par le plan factoriel sont ceux les plus éloignés
du centre.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Qualité de représentation
Les individus les mieux représentés par le plan factoriel sont ceux les plus éloignés
du centre.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Qualité de représentation
Les individus les mieux représentés par le plan factoriel sont ceux les plus éloignés
du centre.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos
Introduction
Rappels mathématiques, notations et données
Ajustement du nuage des individus dans l’espace des variables Package FactoMineR
Méthode de l’ACP Pratique de l’ACP
Exemple d’ACP
ACP et FactoMineR
Pratique de l’ACP
Pratique de l’ACP
1 Choisir de réduire ou non les variables.
2 Réaliser l’ACP.
3 Choisir le nombre de dimensions à interpréter.
4 Interpréter simultanément le graphe des individus et celui des variables.
5 Utiliser les indicateurs pour enrichir l’interprétation.
6 Revenir aux données brutes pour interpréter.
Pr. Abdelaziz Assadouq Cours: Analyse de Données (Master :IA & SD) Analyse par compos