TP 5

Ce document présente un TP sur la comparaison des modèles de classification non supervisée, en se concentrant sur les algorithmes K-Means et DBSCAN. Les étudiants doivent charger et analyser le dataset des clients d'un centre commercial, appliquer les algorithmes de clustering, et comparer les résultats avec un troisième algorithme. Le rapport final doit inclure une explication des étapes, du code, des visualisations et des réponses aux questions posées.

Transféré par

Wiame Naim

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

54 vues3 pages

TP 5

Transféré par

Wiame Naim

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TP 5 : Comparaison des Modèles de

Classification non supervisée (Clustering)

Objectifs :
• Découvrir les méthodes de classification non supervisée
• Comprendre et appliquer les algorithmes K-Means et DBSCAN
• Visualiser les résultats du clustering et interpréter les groupes

1. Chargement des données

Nous allons travailler sur le jeu de données "Mall Customers Dataset". Il contient des
informations sur les clients d'un centre commercial (genre, âge, revenu annuel, score de
dépenses).

• Charger le dataset Mall Customers Dataset.

• Afficher les 5 premières lignes.
• Analyser la structure du dataset.
• Vérifier les valeurs manquantes et les traiter.
• Convertir les variables catégoriques en variables numériques si nécessaire.

Questions :

1. Combien de clients sont présents dans le dataset ?

2. Quelles sont les variables quantitatives que l'on pourrait utiliser pour faire du
clustering ?
2. Clustering avec K-Means
Nous allons appliquer K-Means sur les deux variables : Annual Income et Spending Score.
C’est un algorithme qui permet de regrouper les points en k clusters.

A partir du graphe, nous choisirons un k optimal pour éviter la sous-segmentation et la

sursegmentation des groupes

Questions :

3. Quelles observations pouvez-vous faire sur la répartition des groupes ?

3. Clustering avec DBSCAN
Nous testons ensuite DBSCAN.

Questions :

4. Quelle est la différence entre K-Means et DBSCAN ?

5. Pourquoi K-Means peut-il être plus efficace pour détecter des anomalies ?

4. Autres modèles
Choisissez un troisième algorithme de clustering (ex : Agglomerative Clustering ou Birch),
appliquez-le au même jeu de données, et comparez les résultats avec ceux de K-Means et
DBSCAN.

Questions :

6. Quel algorithme produit les groupes les plus cohérents selon vous ?

7. Quels sont les avantages et inconvénients de chacun ?

5. Synthèse et Interprétation

Travail à rendre :

À la fin du TP, vous devez produire un rapport incluant :

• Une explication des étapes suivies.

• Un notebook contenant le code, les visualisations et les réponses aux questions

Vous aimerez peut-être aussi

Objectif Du TP: TP 2: Comparaison Des Modèles de Classification Supervisée Et Non Supervisée
Pas encore d'évaluation
Objectif Du TP: TP 2: Comparaison Des Modèles de Classification Supervisée Et Non Supervisée
6 pages
TP - 5 - Énoncé - Version 1
Pas encore d'évaluation
TP - 5 - Énoncé - Version 1
4 pages
CR2 Théotime LAGUENS
Pas encore d'évaluation
CR2 Théotime LAGUENS
9 pages
TP 2: Les Méthodes de Structuration Et de Classification en Apprentissage Non Supervisé
Pas encore d'évaluation
TP 2: Les Méthodes de Structuration Et de Classification en Apprentissage Non Supervisé
4 pages
Compte Rendu TP1 AI M1ESE
Pas encore d'évaluation
Compte Rendu TP1 AI M1ESE
4 pages
Apprentissage Non Supervisé avec K-Means
Pas encore d'évaluation
Apprentissage Non Supervisé avec K-Means
4 pages
Algorithmes K-Means et DBSCAN
100% (2)
Algorithmes K-Means et DBSCAN
31 pages
Deep Learning Clustering
Pas encore d'évaluation
Deep Learning Clustering
14 pages
Introduction au Clustering et Méthodes
Pas encore d'évaluation
Introduction au Clustering et Méthodes
11 pages
ML 1
Pas encore d'évaluation
ML 1
41 pages
TP Clusterng
Pas encore d'évaluation
TP Clusterng
1 page
TD DM Clustering
Pas encore d'évaluation
TD DM Clustering
1 page
Travaux Pratique de Dataminig1 - TP2
Pas encore d'évaluation
Travaux Pratique de Dataminig1 - TP2
9 pages
Non Supervisé Clustring
Pas encore d'évaluation
Non Supervisé Clustring
10 pages
Compte Rendu TP CluStering Zeynabou Ba M1 GLSI JOUR
Pas encore d'évaluation
Compte Rendu TP CluStering Zeynabou Ba M1 GLSI JOUR
9 pages
Uber
Pas encore d'évaluation
Uber
22 pages
Travaux Dirige-et-corriges-Apprentissage Non Supervisee-Analyse Factorielle-Arbre de Decision-27 Mai 2022 12h15
100% (2)
Travaux Dirige-et-corriges-Apprentissage Non Supervisee-Analyse Factorielle-Arbre de Decision-27 Mai 2022 12h15
37 pages
TP #6 - Clustering
Pas encore d'évaluation
TP #6 - Clustering
8 pages
DM TP2
Pas encore d'évaluation
DM TP2
4 pages
TP 8
Pas encore d'évaluation
TP 8
4 pages
TP 2 Clustering
Pas encore d'évaluation
TP 2 Clustering
2 pages
Examen Controle 23-24
Pas encore d'évaluation
Examen Controle 23-24
2 pages
CM4 M1 Isd 2023
Pas encore d'évaluation
CM4 M1 Isd 2023
51 pages
Clustering 1
Pas encore d'évaluation
Clustering 1
8 pages
Travaux Pratiques-Analyse Factorielle-Et-Cah-Machine Learning-27 Mai 2022 12h15
Pas encore d'évaluation
Travaux Pratiques-Analyse Factorielle-Et-Cah-Machine Learning-27 Mai 2022 12h15
3 pages
Segmentation Client avec DBSCAN en Data Mining
Pas encore d'évaluation
Segmentation Client avec DBSCAN en Data Mining
2 pages
Clustering TP
Pas encore d'évaluation
Clustering TP
10 pages
Exam Modeles Pour Le Datamining 2015 2016cor
Pas encore d'évaluation
Exam Modeles Pour Le Datamining 2015 2016cor
4 pages
Rapport de Projet - BDM
Pas encore d'évaluation
Rapport de Projet - BDM
26 pages
TD 05 Clustering - Solution
Pas encore d'évaluation
TD 05 Clustering - Solution
3 pages
Bennamia Gharbi
Pas encore d'évaluation
Bennamia Gharbi
38 pages
Compte-Rendu TP
100% (1)
Compte-Rendu TP
2 pages
TP Modelisation
Pas encore d'évaluation
TP Modelisation
2 pages
Image Mining Clustering
Pas encore d'évaluation
Image Mining Clustering
33 pages
Rapport Du TP
Pas encore d'évaluation
Rapport Du TP
13 pages
Atelier Recap Abdelkader
Pas encore d'évaluation
Atelier Recap Abdelkader
17 pages
Clustering K-MEANS : Guide Complet
Pas encore d'évaluation
Clustering K-MEANS : Guide Complet
37 pages
Présentation Cours CA
Pas encore d'évaluation
Présentation Cours CA
50 pages
Tp8 K-meansHaoop
Pas encore d'évaluation
Tp8 K-meansHaoop
11 pages
Clustering et Analyse de Données en TD
100% (2)
Clustering et Analyse de Données en TD
1 page
Kmeans
Pas encore d'évaluation
Kmeans
3 pages
Méthodologie Des Nomophob01
Pas encore d'évaluation
Méthodologie Des Nomophob01
5 pages
Chapitre 3 Clustering Et Classification
Pas encore d'évaluation
Chapitre 3 Clustering Et Classification
11 pages
Classification Non Hierarchique
Pas encore d'évaluation
Classification Non Hierarchique
14 pages
Clustering
100% (1)
Clustering
114 pages
"K-Means : Guide pour Data Scientists"
100% (1)
"K-Means : Guide pour Data Scientists"
10 pages
Classification Tege2
Pas encore d'évaluation
Classification Tege2
19 pages
Chap2 Clustering Final
Pas encore d'évaluation
Chap2 Clustering Final
50 pages
TP3 IngSI
100% (1)
TP3 IngSI
5 pages
Techniques de Data Mining Essentielles
Pas encore d'évaluation
Techniques de Data Mining Essentielles
20 pages
TP3 DM
Pas encore d'évaluation
TP3 DM
1 page
Optimisation K-Means : Codage et Tests
Pas encore d'évaluation
Optimisation K-Means : Codage et Tests
2 pages
TD Data Mining - Seance 8
Pas encore d'évaluation
TD Data Mining - Seance 8
4 pages
Kmeans Practice
Pas encore d'évaluation
Kmeans Practice
3 pages
Algorithme K-MEANS en Clustering
100% (1)
Algorithme K-MEANS en Clustering
37 pages
Clustering
Pas encore d'évaluation
Clustering
50 pages
Clustering
Pas encore d'évaluation
Clustering
79 pages
Classification 1
Pas encore d'évaluation
Classification 1
29 pages
Coonnexion A Rosetta Stone
Pas encore d'évaluation
Coonnexion A Rosetta Stone
1 page
Séparation gravimétrique par table à secousse
100% (1)
Séparation gravimétrique par table à secousse
6 pages
Situations de Conflits
Pas encore d'évaluation
Situations de Conflits
4 pages
Lecture de la norme ISO 9001:2015
Pas encore d'évaluation
Lecture de la norme ISO 9001:2015
100 pages
Examen 2025-1
Pas encore d'évaluation
Examen 2025-1
1 page
Support Analyse Environnementale
Pas encore d'évaluation
Support Analyse Environnementale
96 pages
Cours Et TD Propriètés Electriques
100% (1)
Cours Et TD Propriètés Electriques
61 pages
Cours RAMAN
Pas encore d'évaluation
Cours RAMAN
35 pages
Rapport PFE 2021 GRE - Anne-Marie
Pas encore d'évaluation
Rapport PFE 2021 GRE - Anne-Marie
41 pages
Broyage et types de broyeurs de minerais
100% (1)
Broyage et types de broyeurs de minerais
62 pages
Fluorescence X : Analyse Élémentaire
Pas encore d'évaluation
Fluorescence X : Analyse Élémentaire
40 pages
Bilan de Matière en Chimie Industrielle
100% (1)
Bilan de Matière en Chimie Industrielle
31 pages
Rapport - de - Visite - Jbal Sour
Pas encore d'évaluation
Rapport - de - Visite - Jbal Sour
7 pages
Roches Magmatiques et Métamorphiques
Pas encore d'évaluation
Roches Magmatiques et Métamorphiques
33 pages
TD Diagrammes binaires Cu-Ni, Sn-Bi, Mg-Cu
Pas encore d'évaluation
TD Diagrammes binaires Cu-Ni, Sn-Bi, Mg-Cu
3 pages
TP
Pas encore d'évaluation
TP
6 pages
Chapitre 6 Etudes Cas H2SO4 21 22
Pas encore d'évaluation
Chapitre 6 Etudes Cas H2SO4 21 22
17 pages
Propriétés Diélectriques Des Matériaux
Pas encore d'évaluation
Propriétés Diélectriques Des Matériaux
34 pages
Contrôle RMV.2020.II
Pas encore d'évaluation
Contrôle RMV.2020.II
4 pages
Cours Gîtologie
100% (1)
Cours Gîtologie
47 pages
Cours de Metrologie Chimique: Suite Chapitre I: Notions de
100% (1)
Cours de Metrologie Chimique: Suite Chapitre I: Notions de
66 pages
TP R2MV S4 2023
Pas encore d'évaluation
TP R2MV S4 2023
2 pages
Rapport sur la mine Guemassa au Maroc
Pas encore d'évaluation
Rapport sur la mine Guemassa au Maroc
8 pages
TD Dielectrique 2023 R2MV
Pas encore d'évaluation
TD Dielectrique 2023 R2MV
2 pages
Rapport de La Visite Chez CMG-GUEMASSA: Mohamed Hanouni Wiame Naim
Pas encore d'évaluation
Rapport de La Visite Chez CMG-GUEMASSA: Mohamed Hanouni Wiame Naim
11 pages
Serie 3lpr2mv
Pas encore d'évaluation
Serie 3lpr2mv
1 page
Rapport sur la géologie d'Ait Ourir
0% (1)
Rapport sur la géologie d'Ait Ourir
7 pages
Compte Rendue TP Chimie
100% (2)
Compte Rendue TP Chimie
6 pages