Département MIDO
Module Analyse de Données
2015 / 2016
Travaux Dirigés no 6 : ACP
Objectifs : comprendre l’ACP.
Exercice 1
Considérons le tableau de données suivant :
Noam
Jean
Li
Lisa
Mina
Math
0
1
2
3
4
Info
4
3
2
1
0
Gestion
0
1
3
1
0
où les lignes représentent les individus (noms de quelques étudiants de L3
informatique)
et les colonnes les variables (notes en mathématiques, informatique et gestion). Ce
tableau de données peut être représenté par la matrice X de données brutes :
0 4 0
1 3 1
2
2
3
X=
3 1 1
4 0 0
1. Calculer la matrice Y des données centrées et la matrice Z de données centrées
et réduites.
2. Calculer la matrice RX des corrélations de X et la matrice VZ des variances et
covariances de Z. Commentez.
3. Vérifier que les vecteurs unitaires
1
√ [−1, 1, 0]
2
= [0, 0, 1]
ut1 =
ut2
sont les vecteurs propres de RX (ou, équiv., de RZ ) associés à des valeurs propres
non nulles. Trouvez-les.
4. Peut-on représenter parfaitement le nuage des individus à 2 dimensions ? Si oui,
représentez les individus de Z sur le plan défini par la base S = {u1 , u2 }
(Indication : calculer la projection de chacun des points - par rapport au produit
scalaire usuel - dans le plan engendré par les deux vecteurs propres).
Travaux Dirigés no 6
ACP
2/3
Exercice 2
On considère la matrice de données suivante :
1 0
0 0
0 1
A=
2 2
1 0
2 3
0
1
2
1
0
2
1. Calculer g (le centre de gravité), Y (la matrice des données centrées) et V (la
matrice de covariances).
1
1
2. Vérifier que −1 et 0 sont vecteurs propres de V , en indiquant les
1
−1
valeurs propres associées. En déduire le troisième vecteur propre de V et la valeur
propre correspondante.
3. À partir des résultats précédents, déterminer les deux axes factoriels non
triviaux
de l’ACP du nuage N (I) des individus associé au tableau X. Pour chacun de ces
axes, préciser l’inertie du nuage projeté sur l’axe considéré, et la part d’inertie
qu’il explique.
4. Calculer les composantes principales pour chaque individu.
5. Représenter graphiquement le nuage N (I) sur le plan factoriel défini par les
deux
premiers axes factoriels. Que peut-on dire de cette représentation graphique ?
6. Quel est l’individu qui contribue le plus à l’inertie du premier axe factoriel ?
Calculer sa qualité de représentation sur chacun des deux axes factoriels non
triviaux.
7. Représenter graphiquement le nuage des variables N (V ) sur le plan factoriel
défini par les deux premiers axes factoriels. Que peut-on dire de cette
représentation
graphique ?
8. Quelle est la variable qui contribue le plus à l’inertie du premier axe
factoriel ?
Calculer sa qualité de représentation sur chacun des deux axes factoriels non
triviaux.
Exercice 3
On considère la matrice de données suivante :
1 0
0 1
0 1
A=
2 1
1 0
2 3
0
1
2
1
0
2
et la métrique définie par :
Université Paris Dauphine – Département MIDO 2015 / 2016
Module Analyse de Données
Travaux Dirigés no 6
ACP
M =
3/3
1
Var(a1 )
0
0
1
Var(a2 )
0
0
1
Var(a3 )
1. Calculer g (le centre de gravité), Y (la matrice des données centrées) et V (la
matrice de covariances).
2. Donner une interprétation à la matrice V M ?
1
1
3. Vérifier que 2 et 0 sont vecteurs propres de V M , en indiquant les
1
−1
valeurs propres associées. En déduire le troisième vecteur propre de V M et la
valeur propre correspondante.
4. À partir des résultats précédents, déterminer les deux axes factoriels non
triviaux
de l’ACP du nuage N (I) des individus associé au tableau X. Pour chacun de ces
axes, préciser l’inertie du nuage projeté sur l’axe considéré, et la part d’inertie
qu’il explique.
5. Calculer les composantes principales pour chaque individu.
6. Représenter graphiquement le nuage N (I) sur le plan factoriel défini par les
deux
premiers axes factoriels. Que peut-on dire de cette représentation graphique ?
7. Quel est l’individu qui contribue le plus à l’inertie du premier axe factoriel ?
Calculer sa qualité de représentation sur chacun des deux axes factoriels non
triviaux.
8. Représenter graphiquement le nuage des variables N (V ) sur le plan factoriel
défini par les deux premiers axes factoriels. Que peut-on dire de cette
représentation
graphique ?
9. Quelle est la variable qui contribue le plus à l’inertie du premier axe
factoriel ?
Calculer sa qualité de représentation sur chacun des deux axes factoriels non
triviaux.
Université Paris Dauphine – Département MIDO 2015 / 2016
Module Analyse de Données