Département MIDO
Module Analyse de Données
2015 / 2016
Travaux Dirigés no 6 : ACP
Objectifs : comprendre l’ACP.
1 Exercice 1
Considérons le tableau de données suivant :
Math Info Gestion
Noam 0 4 0
Jean 1 3 1
Li 2 2 3
Lisa 3 1 1
Mina 4 0 0
où les lignes représentent les individus (noms de quelques étudiants de L3 informatique)
et les colonnes les variables (notes en mathématiques, informatique et gestion). Ce
tableau de données peut être représenté par la matrice X de données brutes :
0 4 0
1 3 1
X= 2 2 3
3 1 1
4 0 0
1. Calculer la matrice Y des données centrées et la matrice Z de données centrées
et réduites.
2. Calculer la matrice RX des corrélations de X et la matrice VZ des variances et
covariances de Z. Commentez.
3. Vérifier que les vecteurs unitaires
1
ut1 = √ [−1, 1, 0]
2
ut2 = [0, 0, 1]
sont les vecteurs propres de RX (ou, équiv., de RZ ) associés à des valeurs propres
non nulles. Trouvez-les.
4. Peut-on représenter parfaitement le nuage des individus à 2 dimensions ? Si oui,
représentez les individus de Z sur le plan défini par la base S = {u1 , u2 } (In-
dication : calculer la projection de chacun des points - par rapport au produit
scalaire usuel - dans le plan engendré par les deux vecteurs propres).
Travaux Dirigés no 6 ACP 2/3
2 Exercice 2
On considère la matrice de données suivante :
1 0 0
0 0 1
0 1 2
A= 2
2 1
1 0 0
2 3 2
1. Calculer g (le centre de gravité), Y (la matrice des données centrées) et V (la
matrice de covariances).
1 1
2. Vérifier que −1 et 0 sont vecteurs propres de V , en indiquant les
1 −1
valeurs propres associées. En déduire le troisième vecteur propre de V et la valeur
propre correspondante.
3. À partir des résultats précédents, déterminer les deux axes factoriels non triviaux
de l’ACP du nuage N (I) des individus associé au tableau X. Pour chacun de ces
axes, préciser l’inertie du nuage projeté sur l’axe considéré, et la part d’inertie
qu’il explique.
4. Calculer les composantes principales pour chaque individu.
5. Représenter graphiquement le nuage N (I) sur le plan factoriel défini par les deux
premiers axes factoriels. Que peut-on dire de cette représentation graphique ?
6. Quel est l’individu qui contribue le plus à l’inertie du premier axe factoriel ?
Calculer sa qualité de représentation sur chacun des deux axes factoriels non
triviaux.
7. Représenter graphiquement le nuage des variables N (V ) sur le plan factoriel dé-
fini par les deux premiers axes factoriels. Que peut-on dire de cette représentation
graphique ?
8. Quelle est la variable qui contribue le plus à l’inertie du premier axe factoriel ?
Calculer sa qualité de représentation sur chacun des deux axes factoriels non
triviaux.
3 Exercice 3
On considère la matrice de données suivante :
1 0 0
0 1 1
0 1 2
A= 2
1 1
1 0 0
2 3 2
et la métrique définie par :
Université Paris Dauphine – Département MIDO 2015 / 2016 Module Analyse de Données
Travaux Dirigés no 6 ACP 3/3
1
Var(a1 )
0 0
1
M =
0 Var(a2 )
0
1
0 0 Var(a3 )
1. Calculer g (le centre de gravité), Y (la matrice des données centrées) et V (la
matrice de covariances).
2. Donner une interprétation à la matrice V M ?
1 1
3. Vérifier que 2 et 0 sont vecteurs propres de V M , en indiquant les
1 −1
valeurs propres associées. En déduire le troisième vecteur propre de V M et la
valeur propre correspondante.
4. À partir des résultats précédents, déterminer les deux axes factoriels non triviaux
de l’ACP du nuage N (I) des individus associé au tableau X. Pour chacun de ces
axes, préciser l’inertie du nuage projeté sur l’axe considéré, et la part d’inertie
qu’il explique.
5. Calculer les composantes principales pour chaque individu.
6. Représenter graphiquement le nuage N (I) sur le plan factoriel défini par les deux
premiers axes factoriels. Que peut-on dire de cette représentation graphique ?
7. Quel est l’individu qui contribue le plus à l’inertie du premier axe factoriel ?
Calculer sa qualité de représentation sur chacun des deux axes factoriels non
triviaux.
8. Représenter graphiquement le nuage des variables N (V ) sur le plan factoriel dé-
fini par les deux premiers axes factoriels. Que peut-on dire de cette représentation
graphique ?
9. Quelle est la variable qui contribue le plus à l’inertie du premier axe factoriel ?
Calculer sa qualité de représentation sur chacun des deux axes factoriels non
triviaux.
Université Paris Dauphine – Département MIDO 2015 / 2016 Module Analyse de Données