0% ont trouvé ce document utile (0 vote)
33 vues3 pages

TD Matieres

Transféré par

nadim.gaied11
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
33 vues3 pages

TD Matieres

Transféré par

nadim.gaied11
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TD Analyse en Composantes Principales RT3 S.

Toumi

Le tableau de données suivant regroupe 10 étudiants sur lesquels on a observé la note sur 20 de quatre modules :
le module de Statistique, le module d'Informatique, le module de Mathématiques et le module d'Anglais.
identiant Statistique Informatique Mathématiques Anglais
1 14.97 12.4 11.55 8.24
2 13.15 12.55 11.4 13.64
3 12.7 9.75 16.95 10.94
4 14.48 7.45 16.35 8.58
5 11.76 13.5 8.55 11.88
6 7.88 9.25 15.05 10.8
7 15.56 11 11.9 7.76
8 12.33 9.3 10.65 9.32
9 13.9 12.1 10.9 9.08
10 10.15 10.85 11.55 8.76

On souhaite réaliser une Analyse en Composantes Principales Normée (ACPN) sur ce tableau de données an
d'en traire une information
1. Indiquer dans quel espace doit être représenté le nuage des individus? Justier votre réponse.
2. Indiquer dans quel espace doit être représenté le nuage des variables? Justier votre réponse.
3. Compléter le tableau suivant :
Variables Moyennes Ecarts types Minimum Maximum
Statistique 12.688 2.2113 · 15.56
Informatique · 1.7782 7.45 ·
Mathematiques · · · 13.64
Anglais 9.90 · ·

Commenter succinctement dans le contexte les valeurs numériques obtenues.


Déterminer le barycentre du nuage des individus.
5. Déterminer la matrice des écarts-types.
6. Quel est le rôle du barycentre et de la matrice des écarts-types en ACP ?
7. Dans le cadre de l'ACP normée, il convient de diagonaliser une matrice. Laquelle? Justier à l'aide d'un
produit matriciel votre réponse (pas de valeurs numériques).
8. L'utilisation d'un logiciel a permis d'obtenir la matrice des corrélations suivantes :

 
1.0000 0.1513 −0.0863 −0.3743
 0.1513 1.0000 −0.7679 0.3340 
∆ := 
 −0.0863

−0.7679 1.0000 −0.0829 
−0.3743 0.3340 −0.0829 1.0000
Commenter brièvement dans le contexte ces coecients.
9. La réalisation de l'ACP a donné les valeurs propres suivantes :

λ1 = 1.8721 λ2 = 1.3656 λ3 = 0.6013 λ4 = ..


Calculer la dernière valeur propre.

1
10. Calculer l'inertie associée à chacun des axes.
11. Quelle est la propriété qui permet sans calcul de déterminer l'inertie totale? Combien vaut-elle dans le cas
présent?
12. En déduire pour chacun des axes les pourcentages d'inertie, puis les pourcentages d'inertie cumulés.
13. Selon le critère de la moyenne combien d'axes doit-on conserver? Justier votre réponse.
14. Représenter le diagramme des valeurs propres. Ce diagramme conrme-t-il la réponse fournie à la question
précédente? Justier votre réponse.
15. Les composantes principales issues de l'analyse sont les suivantes:
identiant Comp.1 Comp.2 Comp.3 Comp.4
1 -0.6250 -1.4957 0.0011 -0.4976
2 -1.6100 1.0861 1.3466 0.2721
3 1.3616 0.7184 1.0829 -0.4238
4 2.4754 -0.6950 0.5518 0.3769
5 -2.3618 0.6727 -0.1164 0.1093
6 1.2207 2.1638 -0.7192 -0.2610
7 0.0798 -1.7913 -0.0071 -0.0514
8 0.2400 -0.1581 -0.7010 0.8919
9 -0.7903 -0.8614 -0.1427 -0.1775
10 0.0097 0.3605 -1.2960 -0.2389
A partir de ce tableau, identier les deux premières composantes principales : Ψ1 et Ψ2 . Que représentent-elles?
16. Ces composantes principales vérient deux propriétés statistiques. Indiquer ces deux propriétés puis vérier
que ces dernières sont bien satisfaites.
17. Comment à partir de la représentation graphique des individus dans le plan factoriel principal (et donc sans
calcul) peut-on identier (sous réserve dune bonne qualité de representation) les individus qui contribuent
fortement à la formaiton de chacun des axes.
18. On souhaite déterminer la contribution des individus à la formation de chacun des axes. Dans ce but, rappeler
la formule qui permet de réaliser ces calculs puis comlépter le tableau de la page suivante. A partir de ces
valeurs numériques, déterminer explicitement les individus qui contribuent fortement à la formation des deux
premiers axes (on peut distinguer les individus à coordonnées positives/négatives sur les axes )

individus Cr1 (i)(%) Cr2 (i)(%)


1 2.09 ·
2 13.85 8.64
3 9.90 3.78
4 32.73 3.54
5 · ·
6 · 34.29
7 0.03 23.50
8 0.31 0.18
9 3.34 5.43
10 0.00 0.95
19. On souhaite maintenant déterminer les qualités de représentation des individus sur chacun des axes puis sur le
plan principal. Dans ce but, rappeler les formules permettant de réaliser ces calculs, puis compléter le tableau
suivant

2
individus Quali (1)(%) Quali (2)(%) Quali (1 × 2)(%)
1 13.59 77.80
0 20.84
3 49.81 13.87 63.68
4 86.83 6.84 93.67
5 92.11 7.47 99.58
6 22.05 69.29 91.34
7
8 4.21 1.82
9 44.03 52.31 96.34
10 0.00 6.96 6.96
Note : on pourra s'aider de la matrice suivante
 
1.0320 0.8913 −0.3637 −0.9400

 0.2089 0.9757 −0.4221 2.1178 


 0.0054 −0.5989 1.7369 0.5889 


 0.8104 −1.8924 1.5035 −0.7475 

 −0.4200 1.5099 −1.5307 1.1212 
Z= 

 −2.1743 −0.8801 0.9978 0.5096 


 1.2988 0.10404 −0.2276 −1.2118 


 −0.1619 −0.85198 −0.7138 −0.3284 

 0.5481 0.72264 −0.6166 −0.4643 
−1.1478 0.01968 −0.3637 −0.6455

20. Quels sont les individus qui sont bien et très bien représentés dans le plan principal?
21. On possède les deux premiers vecteurs propres correspondant au nuage des individus

   
−0.0540 −0.7359
 −0.6963   −0.0691 
u1 = 
 0.6474 
 et u2 = 
 0.1712 

−0.3051 0.6514
En déduire les coordonnées des variables sur les deux premiers axes. Vos calculs sont-ils en accord avec la
représentation du nuage des variables dans le premier plan factoriel
22. A quoi mesure-t-on la qualité de représentation des variables dans le plan principal? En déduire les variables
bien ou très bien représentées.
23. A quoi mesure-t-on la corrélation entre une variable et un axe ou entre deux variables. Quelle condition doit
être satistate ar que cetce mesure soit able?
24. Identier les variables corrélées avec chacun des axes (on précisera si la corrélation est positive ou négative,
et l'on s'aidera des valeurs numériques des coecients associés.
25. Caractériser les deux axes factoriels.
26. En déduire une interprétation de la position des individus dans le plan factoriel principal.

Vous aimerez peut-être aussi