0% ont trouvé ce document utile (0 vote)

86 vues13 pages

Interprétation ACP et K-Means en TD2

Le document présente des exercices sur l'analyse en composantes principales (ACP), le regroupement hiérarchique et l'algorithme K-Means. Les élèves sont évalués sur leur performance dans différentes matières, et les résultats des analyses sont interprétés pour déterminer les corrélations et les regroupements. Les exercices incluent des calculs détaillés et des interprétations des résultats obtenus à partir des données fournies.

Transféré par

Imene Ben Salem

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

86 vues13 pages

Interprétation ACP et K-Means en TD2

Transféré par

Imene Ben Salem

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Corrigé de TD2

Exercice 1 : Interprétation ACP

Un échantillon contient 14 élèves d'une classe de lycée, chacun d'eux étant caractérisé par
sa note obtenue aux examens dans des matières telles que : philosophie, physique,
mathématiques, français, etc. Ils sont notés sur une échelle de 0 à 20, 20 étant la meilleure
note.

Après avoir calculé l'ACP, voici le cercle des corrélations ainsi que la projection des individus
sur le premier plan factoriel.

Seules 4 matières sont représentées sur le cercle. Par souci de simplicité, les matières non
représentées ne sont ni des matières littéraires ni des matières scientifiques.

Questions

1. Que représente l’axe F1 et l’axe F2 ?

Réponse
L'axe F1 mesure la performance dans les matières littéraires et F2 la performance dans
les matières scientifiques : les projections de Français et Philosophie sur F1 sont
grandes mais petites sur F2 ; c'est l'inverse pour Mathématiques et Physique.
2. En se basant sur les deux graphiques, cochez les propositions correctes
a. Marta est parmi les meilleurs élèves dans les matières scientifiques.
b. Marta est parmi les moins bons élèves dans les matières scientifiques.
c. Marta est parmi les moins bons élèves dans les matières littéraires.
d. Marta est parmi les meilleurs élèves dans les matières littéraires.
e. Max est parmi les meilleurs élèves dans les matières scientifiques.
f. Max est parmi les moins bons élèves dans les matières scientifiques.
g. Max est parmi les meilleurs élèves dans les matières littéraires.
h. Max est parmi les moins bons élèves dans les matières littéraires.
i. Malika est parmi les meilleurs élèves dans les 4 matières à la fois.

Réponse

Les réponses correctes sont :

 Marta est parmi les meilleurs élèves dans les matières scientifiques. (a)
 Marta est parmi les moins bons élèves dans les matières littéraires. (b)
 Max est parmi les moins bons élèves dans les matières scientifiques. (f)
 Max est parmi les meilleurs élèves dans les matières littéraires. (g)
 Malika est parmi les meilleurs élèves dans les 4 matières à la fois. (i)

Exercice 2 : Interprétation ACP

Soit à interpréter les deux graphes suivants:
Questions
1. Quelles sont les variables les plus corrélées à F1 et les variables les plus corrélées à
F2 ? Que représentent alors F1 et F2 ?
Réponse
Les variables les plus corrélées à F1 sont :
 la durée ;
 le nombre de chapitres (nbChapitres) ;
 le nombre d’évaluations du cours (nbEvaluations).
Elles sont corrélées positivement à F1, mais on a aussi la variable progression qui est
corrélée négativement à F1. Ce qui est intéressant ici, c’est d’interpréter l’axe F1. Ici,
il se trouve que toutes ces variables ont une notion qui les unit qui est la longueur du
cours.

Explications :
Intuitivement, on comprend que PLUS un cours est long, moins on le finit rapidement,
ou moins on a de chances de le finir, d’où la corrélation négative avec la variable
Progression.
Les variables plus corrélées à F2 sont :
 la difficulté (avec une corrélation négative) ;
 la moyenne de classe ;
 la proportion de quiz par rapport au nombre total d’évaluations.
On peut donc interpréter F2 comme la facilité du cours.

Explications :
C’est évident pour la variable difficulté, qui lui est anti-corrélée. C’est également
compréhensible pour la variable moyenne de classe : plus un cours est facile,
meilleures seront les notes des étudiants.
Pour le ratio quiz/évaluation : plus la proportion de quiz est importante, plus simple
est le cours !
2. Que peut-on déduire concernant la longueur et la difficulté de 4 cours représentés dans
le graphe d’individus ?
Réponse
Intitulé du cours Interprétation
Développez votre site web avec le Cours Long
framework Symfony
Découvrez les librairies Python pour la Un cours court
Data Science
Explorez vos données avec des Un cours difficile
algorithmes non supervisés
Apprenez à programmer en Python Cours long et difficile

Exercice 3 : Regroupement hiérarchique

Soit un ensemble de formes représentées par les points suivants dans un repère euclidien :
A(1,1), B(1,2), C(3,4), D(6,3), E(6,5)

Appliquer l’algorithme du regroupement hiérarchique en utilisant d’abord le saut minimal

(simple link), ensuite le diamètre maximal (complete link) comme distance entre les groupes.

Réponse

Méthode de Simple Link

Itération1
A(1,1) B(1,2) C(3,4) D(6,3) E(6,5)

A(1,1) 0

B(1,2) √1 = 1 0

C(3,4) √13 √8 0

D(6,3) √29 √26 √10 0

E(6,5) √41 √34 √10 √4 = 2 0

On regroupe A et B (la distance la plus faible =1)

Itération2

(A, B) C D E

(A, B) 0

C √8 0

D √26 √10 0

E √34 √10 √4 = 2 0
d((A,B), C) = min (d(A,C), d(B,C))

=min(√13 , √8 )

= √8

d((A,B), D) = min (d(A,D), d(B,D))

=min(√29 , √26 )

= √26

d((A,B), E) = min (d(A,E), d(B,E))

=min(√41 , √34 )

= √34

On regroupe D et E (la distance la plus faible =2)

Itération 3

(A, B) C (D, E)

(A, B) 0

C √8 0

(D, E) √26 √10 0

d((D,E), C) = min (d(D,C), d(E,C))

=min(√10 , √10 )

= √10

d((D,E), (A,B)) = min (d(D, (A,B)), d(E, (A,B)))

=min(√26 , √34 )

= √26
On regroupe (A, B) et C (la distance la plus faible =√𝟖 )

Itération 4

((A, B), C) (D, E)

((A, B),C) 0

(D, E) √10 0

d (((A,B), C), (D,E)) = min (d( (A,B), (D,E)), d(C, (D,E))

=min(√26 , √10 )

= √10

On regroupe ((A, B) ,C) et (D,E) (la distance la plus faible =√𝟖 )

Résultat final
Méthode de Complete Link
Itération1
A(1,1) B(1,2) C(3,4) D(6,3) E(6,5)

A(1,1) 0

B(1,2) √1 = 1 0

C(3,4) √13 √8 0

D(6,3) √29 √26 √10 0

E(6,5) √41 √34 √10 √4 = 2 0

On regroupe A et B (la distance la plus faible =1)

Itération2

(A, B) C D E

(A, B) 0

C √13 0

D √29 √10 0

E √41 √10 √4 = 2 0

d((A,B), C) = max (d(A,C), d(B,C))

=max(√13 , √8 )

= √13

d((A,B), D) = max (d(A,D), d(B,D))

=max(√29 , √26 )

= √29

d((A,B), E) = max (d(A,E), d(B,E))

=max(√41 , √34 )

= √41

On regroupe D et E (la distance la plus faible =2)

Itération 3

(A, B) C (D, E)

(A, B) 0

C √13 0

(D, E) √34 √10 0

d((D,E), C) = max (d(D,C), d(E,C))

=max(√10 , √10 )

= √10

d((D,E), (A,B)) = max (d(D, (A,B)), d(E, (A,B)))

=max(√26 , √34 )

= √34

On regroupe (D, E) et C (la distance la plus faible =√𝟏𝟎 )

Itération 4

(A, B) ((D, E), C)

(A, B) 0

((D, E), C) √10 0

d ((A,B), ( (D,E),C)) = max (d( (A,B), (D,E)), d( (A,B), C)

=max(√34 , √13 ) = √34

On regroupe ((A, B) et ((D,E), C) (la distance la plus faible =√𝟑𝟒 )

Résultat final

Exercice 4 : Algorithme K-Means

Soit l'ensemble D des entiers suivants : D= { 2, 5, 8, 10, 11, 17, 20 }. On veut répartir les
données de D en trois (3) clusters, en utilisant l'algorithme Kmeans. La distance d entre deux
nombres a et b est calculée ainsi : d(a , b) = |a - b|

Travail à faire :

1/ Appliquez Kmeans en choisissant comme centres initiaux des 3 clusters respectivement :

8, 10 et 11. Montrez toutes les étapes de calcul.

2/ Donnez le résultat final et précisez le nombre d'itérations qui ont été nécessaires.

3/ Peut-on avoir un nombre d'itérations inférieur pour ce problème ? Discutez

Réponse

1/ Appliquez Kmeans en choisissant comme centres initiaux des 3 clusters respectivement :

8, 10 et 11. Montrez toutes les étapes de calcul.

Iteration1

U1 =8 U2= 10 U3=11 Affecté A

2 6 8 9 G1
5 3 5 6 G1
8 0 2 3 G1
10 2 0 1 G2
11 3 1 0 G3
17 9 7 6 G3
20 12 10 9 G3
G1 ={2,5, 8}

G2 = {10}

G3 = {11,17,20}
Iteration2

On calcule les 3 centres

U1 = (2+5+8)/3 = 5

U2 =10

U3 = (11 + 17 +20)/3 = 16

U1 =5 U2= 10 U3=16 Affecté A

2 3 8 14 G1
5 0 5 11 G1
8 3 2 8 G2
10 5 0 6 G2
11 6 1 5 G2
17 12 7 1 G3
20 15 10 4 G3
G1 ={2,5}

G2 = {8,10, 11}

G3 = {17,20}
Iteration3

On calcule les 3 centres

U1 = (2+5)/2 = 2,5

U2 =(8 +10 + 11)/3 = 9,66

U3 = (17 +20)/2 = 18,5

U1 =2.5 U2= 9.66 U3=18.5 Affecté A

2 0.5 7.66 16.5 G1
5 2.5 4.66 13.5 G1
8 5.5 1.66 10.5 G2
10 7.5 0.33 8.5 G2
11 8.5 1.33 7.5 G2
17 14.5 7.33 1.5 G3
20 17.5 10.33 1.5 G3

Pas de changement dans l’affectation aux groupes, on arrête les itérations avec la dernière
configuration

2/ Donnez le résultat final et précisez le nombre d'itérations qui ont été nécessaires.

3 itérations ont été nécessaires pour avoir le résultat final.

3/ Peut-on avoir un nombre d'itérations inférieur pour ce problème ? Discutez

Oui si on choisit correctement les centres initiaux (exemple 1 au début, 1 au milieu et 1 à la

fin).

Exemple : Si on choisit, U1= 2 , U2= 10, U3 = 20

Itération 1

U1 =2 U2= 10 U3=20 Affecté A

2 0 8 18 G1
5 3 5 15 G1
8 6 2 12 G2
10 8 0 10 G2
11 9 1 9 G2
17 15 7 3 G3
20 18 10 0 G3
G1 ={2,5}

G2 = {8,10, 11}

G3 = {17,20}
Iteration2

U1 = (2+5)/2 = 2,5

U2 =(8 +10 + 11)/3 = 9,66

U3 = (17 +20)/2 = 18,5

U1 =2.5 U2= 9.66 U3=18.5 Affecté A

2 0.5 7.66 16.5 G1
5 2.5 4.66 13.5 G1
8 5.5 1.66 10.5 G2
10 7.5 0.33 8.5 G2
11 8.5 1.33 7.5 G2
17 14.5 7.33 1.5 G3
20 17.5 10.33 1.5 G3

Pas de changement dans l’affectation aux groupes, on arrête les itérations avec la dernière
configuration
Donc 2 itérations ont été suffisantes pour aboutir au même résultat, on peut conclure que le
résultat de la classification et le nombre des itérations dépendent du choix initial des
centres.

Vous aimerez peut-être aussi

TD 2 Analyse
Pas encore d'évaluation
TD 2 Analyse
3 pages
Méthodes de Classification : K-means, CHA, KNN
Pas encore d'évaluation
Méthodes de Classification : K-means, CHA, KNN
10 pages
Série Dexercices Corrigée 14
Pas encore d'évaluation
Série Dexercices Corrigée 14
16 pages
Analyse de données pour étudiants
100% (2)
Analyse de données pour étudiants
10 pages
K-Means et Analyse de Données Élèves
Pas encore d'évaluation
K-Means et Analyse de Données Élèves
9 pages
Second Degre Statistiques Corrige
Pas encore d'évaluation
Second Degre Statistiques Corrige
3 pages
Classification et Inertie des Partitions
Pas encore d'évaluation
Classification et Inertie des Partitions
10 pages
Méthodes de Classification des Données
Pas encore d'évaluation
Méthodes de Classification des Données
22 pages
Travaux Dirige-et-corriges-Apprentissage Non Supervisee-Analyse Factorielle-Arbre de Decision-27 Mai 2022 12h15
100% (2)
Travaux Dirige-et-corriges-Apprentissage Non Supervisee-Analyse Factorielle-Arbre de Decision-27 Mai 2022 12h15
37 pages
Classico
Pas encore d'évaluation
Classico
6 pages
Solution Exercice 03 Et 4 - Clustering
Pas encore d'évaluation
Solution Exercice 03 Et 4 - Clustering
4 pages
Notes de Cours - CH 1 À 5 MAT2080
Pas encore d'évaluation
Notes de Cours - CH 1 À 5 MAT2080
23 pages
Analyse en Composantes Principales
Pas encore d'évaluation
Analyse en Composantes Principales
20 pages
INF1421-Corrige-Module6-V3 - Copie
Pas encore d'évaluation
INF1421-Corrige-Module6-V3 - Copie
4 pages
Datamining : Exercices et Méthodes
50% (2)
Datamining : Exercices et Méthodes
5 pages
Méthodes d'Analyse Multidimensionnelle
Pas encore d'évaluation
Méthodes d'Analyse Multidimensionnelle
25 pages
Statistiques : Analyse et Représentation
Pas encore d'évaluation
Statistiques : Analyse et Représentation
8 pages
CRDS-2025 - CORRIGE TYPE - MATHS Tle A4
Pas encore d'évaluation
CRDS-2025 - CORRIGE TYPE - MATHS Tle A4
5 pages
Solutions aux exercices de probabilités
Pas encore d'évaluation
Solutions aux exercices de probabilités
13 pages
Examen Master 1 MIM : Analyse des données
Pas encore d'évaluation
Examen Master 1 MIM : Analyse des données
6 pages
Analyse ACP et AFD Étudiants
Pas encore d'évaluation
Analyse ACP et AFD Étudiants
6 pages
Corrigé d'exercices sur les caractères statistiques
Pas encore d'évaluation
Corrigé d'exercices sur les caractères statistiques
20 pages
Méthodes d'Apprentissage Non-Supervisées
Pas encore d'évaluation
Méthodes d'Apprentissage Non-Supervisées
65 pages
Cours de Statistiques pour 3ème Collège
100% (2)
Cours de Statistiques pour 3ème Collège
7 pages
Corrige Des Exercices Sur Les Statistiques en 2de Corriges 20336
Pas encore d'évaluation
Corrige Des Exercices Sur Les Statistiques en 2de Corriges 20336
5 pages
Chapitre 3:: Les Caractéristiques de Dispersion
Pas encore d'évaluation
Chapitre 3:: Les Caractéristiques de Dispersion
29 pages
Corrigé Examen 24 25 PDF
Pas encore d'évaluation
Corrigé Examen 24 25 PDF
6 pages
Correction de l'examen de Math 310
Pas encore d'évaluation
Correction de l'examen de Math 310
5 pages
Corrigé de Maths BAC Blanc Première A4
Pas encore d'évaluation
Corrigé de Maths BAC Blanc Première A4
8 pages
Classification hiérarchique SPSS
Pas encore d'évaluation
Classification hiérarchique SPSS
25 pages
Projet Test2
Pas encore d'évaluation
Projet Test2
12 pages
Solution TD2 S1 23 24
Pas encore d'évaluation
Solution TD2 S1 23 24
8 pages
Statistiques et Comparaisons de Données
Pas encore d'évaluation
Statistiques et Comparaisons de Données
5 pages
Analyse en Composantes Principales (ACP)
Pas encore d'évaluation
Analyse en Composantes Principales (ACP)
74 pages
Introduction à l'apprentissage non supervisé
Pas encore d'évaluation
Introduction à l'apprentissage non supervisé
16 pages
TD Behi
Pas encore d'évaluation
TD Behi
4 pages
Correction épreuves concours statistique
Pas encore d'évaluation
Correction épreuves concours statistique
7 pages
DM10 Cor
Pas encore d'évaluation
DM10 Cor
6 pages
DS, Commun, 0708
Pas encore d'évaluation
DS, Commun, 0708
7 pages
Révision DS2 : Fonctions Affines et Statistiques
Pas encore d'évaluation
Révision DS2 : Fonctions Affines et Statistiques
2 pages
Graphes Et Optimisation
100% (1)
Graphes Et Optimisation
59 pages
Méthodes d'analyse de données
Pas encore d'évaluation
Méthodes d'analyse de données
39 pages
Devoir de Mathématiques pour Secondes
Pas encore d'évaluation
Devoir de Mathématiques pour Secondes
3 pages
Classification Hiérarchique en Statistiques
Pas encore d'évaluation
Classification Hiérarchique en Statistiques
16 pages
Exam Fouille Extraction Datamining Donnees 2017 2018corrige
100% (1)
Exam Fouille Extraction Datamining Donnees 2017 2018corrige
9 pages
TD 4 Statistiques Corrigé
Pas encore d'évaluation
TD 4 Statistiques Corrigé
8 pages
Statistiques et Probabilités : Exercices Corrigés
Pas encore d'évaluation
Statistiques et Probabilités : Exercices Corrigés
62 pages
Analyse des Variables Statistiques et Corrélations
Pas encore d'évaluation
Analyse des Variables Statistiques et Corrélations
4 pages
Stat Mercier
Pas encore d'évaluation
Stat Mercier
413 pages
I40-Partie 1
Pas encore d'évaluation
I40-Partie 1
47 pages
Inbound 8549638629637578844
Pas encore d'évaluation
Inbound 8549638629637578844
5 pages
Cours Hygiène
Pas encore d'évaluation
Cours Hygiène
7 pages
Rapport Qualité-Prix
Pas encore d'évaluation
Rapport Qualité-Prix
5 pages
Atelier Cloud Computing sur Azure
Pas encore d'évaluation
Atelier Cloud Computing sur Azure
4 pages
Inbound 3859366739397083127
Pas encore d'évaluation
Inbound 3859366739397083127
239 pages
Inbound 5212059126761625256
Pas encore d'évaluation
Inbound 5212059126761625256
33 pages
Devoir
Pas encore d'évaluation
Devoir
7 pages
Analyse des Données et Statistiques Descriptives
Pas encore d'évaluation
Analyse des Données et Statistiques Descriptives
8 pages
Chapitre2 Introduction Aux Systèmes Temps Réel
Pas encore d'évaluation
Chapitre2 Introduction Aux Systèmes Temps Réel
20 pages
Chapitre 3
Pas encore d'évaluation
Chapitre 3
31 pages
Réalisation du Sprint 2 : Interface Étudiant
Pas encore d'évaluation
Réalisation du Sprint 2 : Interface Étudiant
6 pages
Bouyguestelecom Facture 20251020
Pas encore d'évaluation
Bouyguestelecom Facture 20251020
3 pages
Journal de Bord Stage Virtuel Num Â Rique 2nde
Pas encore d'évaluation
Journal de Bord Stage Virtuel Num Â Rique 2nde
55 pages
11 Techniques D'expression2
Pas encore d'évaluation
11 Techniques D'expression2
15 pages
Jeu de mots et phrases interactif
Pas encore d'évaluation
Jeu de mots et phrases interactif
3 pages
Diagramme de séquences UML expliqué
Pas encore d'évaluation
Diagramme de séquences UML expliqué
9 pages
Doctorat SOUTENANCE UN0502 DOC DEMANANDE 192583
Pas encore d'évaluation
Doctorat SOUTENANCE UN0502 DOC DEMANANDE 192583
86 pages
Hamid
Pas encore d'évaluation
Hamid
22 pages
Bdcours2 Mea
Pas encore d'évaluation
Bdcours2 Mea
29 pages
Essai 1
Pas encore d'évaluation
Essai 1
1 page
Introduction à 3Ds Max
Pas encore d'évaluation
Introduction à 3Ds Max
18 pages
Cahier des Charges Réseau GlobalLogistics
Pas encore d'évaluation
Cahier des Charges Réseau GlobalLogistics
14 pages
Introduction aux réseaux de neurones
Pas encore d'évaluation
Introduction aux réseaux de neurones
14 pages
Nombres Et Calculs CE2 Litchi
Pas encore d'évaluation
Nombres Et Calculs CE2 Litchi
3 pages
TP Initiation Arduino
Pas encore d'évaluation
TP Initiation Arduino
8 pages
Offre de Service SARL ETS
Pas encore d'évaluation
Offre de Service SARL ETS
12 pages
Guide d'utilisation FreeStyle Libre 2
Pas encore d'évaluation
Guide d'utilisation FreeStyle Libre 2
28 pages
Management des compétences en entreprise
Pas encore d'évaluation
Management des compétences en entreprise
11 pages
Sûreté de fonctionnement des SAP
Pas encore d'évaluation
Sûreté de fonctionnement des SAP
8 pages
Curseurs PL/SQL : Types et Utilisation
Pas encore d'évaluation
Curseurs PL/SQL : Types et Utilisation
11 pages
Tux Paint
Pas encore d'évaluation
Tux Paint
3 pages
Comprendre le Mobile Money et ses enjeux
Pas encore d'évaluation
Comprendre le Mobile Money et ses enjeux
5 pages
Amélioration de l'organisation comptable BR SARL
Pas encore d'évaluation
Amélioration de l'organisation comptable BR SARL
4 pages
Arithmétique - Concepts de Base
Pas encore d'évaluation
Arithmétique - Concepts de Base
3 pages
Cahier Activites 7 Ème (2024-2025)
Pas encore d'évaluation
Cahier Activites 7 Ème (2024-2025)
20 pages
Annale SES
Pas encore d'évaluation
Annale SES
80 pages
Chatgpt
Pas encore d'évaluation
Chatgpt
10 pages
DOCS324256578I
Pas encore d'évaluation
DOCS324256578I
1 page
Programmation C : TP sur tubes et mails
Pas encore d'évaluation
Programmation C : TP sur tubes et mails
4 pages
Demande d'Assistance Post-Inondations
Pas encore d'évaluation
Demande d'Assistance Post-Inondations
10 pages
Budget
Pas encore d'évaluation
Budget
2 pages