0% ont trouvé ce document utile (0 vote)
596 vues3 pages

ACP: Analyse de Données MIDO 2015/16

Le document présente trois exercices sur l'analyse en composantes principales (ACP). Les exercices portent sur le calcul de matrices de données centrées et réduites, de corrélations, de variances et covariances, ainsi que sur la détermination des axes et composantes principales.

Transféré par

Hamza Dhaker
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
596 vues3 pages

ACP: Analyse de Données MIDO 2015/16

Le document présente trois exercices sur l'analyse en composantes principales (ACP). Les exercices portent sur le calcul de matrices de données centrées et réduites, de corrélations, de variances et covariances, ainsi que sur la détermination des axes et composantes principales.

Transféré par

Hamza Dhaker
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Département MIDO

Module Analyse de Données


2015 / 2016

Travaux Dirigés no 6 : ACP

Objectifs : comprendre l’ACP.

1 Exercice 1
Considérons le tableau de données suivant :
Math Info Gestion
Noam 0 4 0
Jean 1 3 1
Li 2 2 3
Lisa 3 1 1
Mina 4 0 0

où les lignes représentent les individus (noms de quelques étudiants de L3 informatique)


et les colonnes les variables (notes en mathématiques, informatique et gestion). Ce
tableau de données peut être représenté par la matrice X de données brutes :
 
0 4 0
 1 3 1 
 
X=  2 2 3 

 3 1 1 
4 0 0

1. Calculer la matrice Y des données centrées et la matrice Z de données centrées


et réduites.
2. Calculer la matrice RX des corrélations de X et la matrice VZ des variances et
covariances de Z. Commentez.
3. Vérifier que les vecteurs unitaires
1
ut1 = √ [−1, 1, 0]
2
ut2 = [0, 0, 1]

sont les vecteurs propres de RX (ou, équiv., de RZ ) associés à des valeurs propres
non nulles. Trouvez-les.
4. Peut-on représenter parfaitement le nuage des individus à 2 dimensions ? Si oui,
représentez les individus de Z sur le plan défini par la base S = {u1 , u2 } (In-
dication : calculer la projection de chacun des points - par rapport au produit
scalaire usuel - dans le plan engendré par les deux vecteurs propres).
Travaux Dirigés no 6 ACP 2/3

2 Exercice 2
On considère la matrice de données suivante :
 
1 0 0
 0 0 1 
 
 0 1 2 
A=  2

 2 1 

 1 0 0 
2 3 2
1. Calculer g (le centre de gravité), Y (la matrice des données centrées) et V (la
matrice de covariances).
   
1 1
2. Vérifier que  −1  et  0  sont vecteurs propres de V , en indiquant les
1 −1
valeurs propres associées. En déduire le troisième vecteur propre de V et la valeur
propre correspondante.
3. À partir des résultats précédents, déterminer les deux axes factoriels non triviaux
de l’ACP du nuage N (I) des individus associé au tableau X. Pour chacun de ces
axes, préciser l’inertie du nuage projeté sur l’axe considéré, et la part d’inertie
qu’il explique.
4. Calculer les composantes principales pour chaque individu.
5. Représenter graphiquement le nuage N (I) sur le plan factoriel défini par les deux
premiers axes factoriels. Que peut-on dire de cette représentation graphique ?
6. Quel est l’individu qui contribue le plus à l’inertie du premier axe factoriel ?
Calculer sa qualité de représentation sur chacun des deux axes factoriels non
triviaux.
7. Représenter graphiquement le nuage des variables N (V ) sur le plan factoriel dé-
fini par les deux premiers axes factoriels. Que peut-on dire de cette représentation
graphique ?
8. Quelle est la variable qui contribue le plus à l’inertie du premier axe factoriel ?
Calculer sa qualité de représentation sur chacun des deux axes factoriels non
triviaux.

3 Exercice 3
On considère la matrice de données suivante :
 
1 0 0
 0 1 1 
 
 0 1 2 
A=  2

 1 1 

 1 0 0 
2 3 2
et la métrique définie par :

Université Paris Dauphine – Département MIDO 2015 / 2016 Module Analyse de Données
Travaux Dirigés no 6 ACP 3/3

1
 
Var(a1 )
0 0
1
M =
 0 Var(a2 )
0 

1
0 0 Var(a3 )

1. Calculer g (le centre de gravité), Y (la matrice des données centrées) et V (la
matrice de covariances).
2. Donner une interprétation à la matrice V M ?
   
1 1
3. Vérifier que  2  et  0  sont vecteurs propres de V M , en indiquant les
1 −1
valeurs propres associées. En déduire le troisième vecteur propre de V M et la
valeur propre correspondante.
4. À partir des résultats précédents, déterminer les deux axes factoriels non triviaux
de l’ACP du nuage N (I) des individus associé au tableau X. Pour chacun de ces
axes, préciser l’inertie du nuage projeté sur l’axe considéré, et la part d’inertie
qu’il explique.
5. Calculer les composantes principales pour chaque individu.
6. Représenter graphiquement le nuage N (I) sur le plan factoriel défini par les deux
premiers axes factoriels. Que peut-on dire de cette représentation graphique ?
7. Quel est l’individu qui contribue le plus à l’inertie du premier axe factoriel ?
Calculer sa qualité de représentation sur chacun des deux axes factoriels non
triviaux.
8. Représenter graphiquement le nuage des variables N (V ) sur le plan factoriel dé-
fini par les deux premiers axes factoriels. Que peut-on dire de cette représentation
graphique ?
9. Quelle est la variable qui contribue le plus à l’inertie du premier axe factoriel ?
Calculer sa qualité de représentation sur chacun des deux axes factoriels non
triviaux.

Université Paris Dauphine – Département MIDO 2015 / 2016 Module Analyse de Données

Vous aimerez peut-être aussi