100% ont trouvé ce document utile (1 vote)
330 vues7 pages

ACP : Analyse et Représentation Graphique

Le document présente trois exercices sur l'analyse en composantes principales (ACP). Les exercices portent sur le calcul de matrices et de vecteurs propres à partir de tableaux de données, ainsi que sur l'interprétation graphique des résultats.

Transféré par

Rachida Gzl
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats TXT, PDF, TXT ou lisez en ligne sur Scribd
100% ont trouvé ce document utile (1 vote)
330 vues7 pages

ACP : Analyse et Représentation Graphique

Le document présente trois exercices sur l'analyse en composantes principales (ACP). Les exercices portent sur le calcul de matrices et de vecteurs propres à partir de tableaux de données, ainsi que sur l'interprétation graphique des résultats.

Transféré par

Rachida Gzl
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats TXT, PDF, TXT ou lisez en ligne sur Scribd

Département MIDO

Module Analyse de Données


2015 / 2016
Travaux Dirigés no 6 : ACP

Objectifs : comprendre l’ACP.

Exercice 1

Considérons le tableau de données suivant :


Noam
Jean
Li
Lisa
Mina

Math
0
1
2
3
4

Info
4
3
2
1
0

Gestion
0
1
3
1
0

où les lignes représentent les individus (noms de quelques étudiants de L3


informatique)
et les colonnes les variables (notes en mathématiques, informatique et gestion). Ce
tableau de données peut être représenté par la matrice X de données brutes :


0 4 0
 1 3 1 



2
2
3
X=


 3 1 1 
4 0 0
1. Calculer la matrice Y des données centrées et la matrice Z de données centrées
et réduites.
2. Calculer la matrice RX des corrélations de X et la matrice VZ des variances et
covariances de Z. Commentez.
3. Vérifier que les vecteurs unitaires
1
√ [−1, 1, 0]
2
= [0, 0, 1]

ut1 =
ut2

sont les vecteurs propres de RX (ou, équiv., de RZ ) associés à des valeurs propres
non nulles. Trouvez-les.
4. Peut-on représenter parfaitement le nuage des individus à 2 dimensions ? Si oui,
représentez les individus de Z sur le plan défini par la base S = {u1 , u2 }
(Indication : calculer la projection de chacun des points - par rapport au produit
scalaire usuel - dans le plan engendré par les deux vecteurs propres).
Travaux Dirigés no 6

ACP

2/3

Exercice 2

On considère la matrice de données suivante :



1 0
 0 0

 0 1
A=
 2 2

 1 0
2 3


0
1 

2 

1 

0 
2

1. Calculer g (le centre de gravité), Y (la matrice des données centrées) et V (la
matrice de covariances).




1
1
2. Vérifier que  −1  et  0  sont vecteurs propres de V , en indiquant les
1
−1
valeurs propres associées. En déduire le troisième vecteur propre de V et la valeur
propre correspondante.
3. À partir des résultats précédents, déterminer les deux axes factoriels non
triviaux
de l’ACP du nuage N (I) des individus associé au tableau X. Pour chacun de ces
axes, préciser l’inertie du nuage projeté sur l’axe considéré, et la part d’inertie
qu’il explique.
4. Calculer les composantes principales pour chaque individu.
5. Représenter graphiquement le nuage N (I) sur le plan factoriel défini par les
deux
premiers axes factoriels. Que peut-on dire de cette représentation graphique ?
6. Quel est l’individu qui contribue le plus à l’inertie du premier axe factoriel ?
Calculer sa qualité de représentation sur chacun des deux axes factoriels non
triviaux.
7. Représenter graphiquement le nuage des variables N (V ) sur le plan factoriel
défini par les deux premiers axes factoriels. Que peut-on dire de cette
représentation
graphique ?
8. Quelle est la variable qui contribue le plus à l’inertie du premier axe
factoriel ?
Calculer sa qualité de représentation sur chacun des deux axes factoriels non
triviaux.

Exercice 3

On considère la matrice de données suivante :



1 0
 0 1

 0 1
A=
 2 1

 1 0
2 3


0
1 

2 

1 

0 
2

et la métrique définie par :

Université Paris Dauphine – Département MIDO 2015 / 2016

Module Analyse de Données


Travaux Dirigés no 6

ACP



M =

3/3

1
Var(a1 )

0
0

1
Var(a2 )

0
0

1
Var(a3 )



1. Calculer g (le centre de gravité), Y (la matrice des données centrées) et V (la
matrice de covariances).
2. Donner une interprétation à la matrice V M ?
 


1
1
3. Vérifier que  2  et  0  sont vecteurs propres de V M , en indiquant les
1
−1
valeurs propres associées. En déduire le troisième vecteur propre de V M et la
valeur propre correspondante.
4. À partir des résultats précédents, déterminer les deux axes factoriels non
triviaux
de l’ACP du nuage N (I) des individus associé au tableau X. Pour chacun de ces
axes, préciser l’inertie du nuage projeté sur l’axe considéré, et la part d’inertie
qu’il explique.
5. Calculer les composantes principales pour chaque individu.
6. Représenter graphiquement le nuage N (I) sur le plan factoriel défini par les
deux
premiers axes factoriels. Que peut-on dire de cette représentation graphique ?
7. Quel est l’individu qui contribue le plus à l’inertie du premier axe factoriel ?
Calculer sa qualité de représentation sur chacun des deux axes factoriels non
triviaux.
8. Représenter graphiquement le nuage des variables N (V ) sur le plan factoriel
défini par les deux premiers axes factoriels. Que peut-on dire de cette
représentation
graphique ?
9. Quelle est la variable qui contribue le plus à l’inertie du premier axe
factoriel ?
Calculer sa qualité de représentation sur chacun des deux axes factoriels non
triviaux.

Université Paris Dauphine – Département MIDO 2015 / 2016

Module Analyse de Données

Vous aimerez peut-être aussi