0% ont trouvé ce document utile (0 vote)

35 vues19 pages

FD 7

Le document présente l'apprentissage non supervisé, en se concentrant sur l'algorithme K-Means, qui est utilisé pour regrouper des données non étiquetées en clusters. Il décrit le fonctionnement de l'algorithme, ses étapes, ainsi que des exemples d'application et d'utilisation avec Scikit-learn. Enfin, il aborde les défis liés à la détermination du nombre optimal de clusters et à l'initialisation des centroïdes.

Transféré par

helmi hamdi

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

35 vues19 pages

FD 7

Transféré par

helmi hamdi

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Faculté des Sciences de Tunis

Leila Ben Othman

Année universitaire: 2022 - 2023
Apprentissage non supervisé
K-Means
Plan

1 Introduction

2 L'algorithme K-Means

3 K-Means avec Scikit-learn

Introduction

L'apprentissage non supervisé (Unsupervised Learning)

Principe (Apprentissage non supervisé)

L'apprentissage non supervisé désigne la situation d'apprentissage
automatique où les données ne sont pas étiquetées. Il s'agit donc de
découvrir les structures sous-jacentes à ces données non étiquetées.

• Dataset: des observations/exemples/un échantillon X

• Features: des variables xi (i = 1, ..., n)
• Target: Pas d'étiquettes.

NB:
• Données avec étiquettes: coûteuse à obtenir sur des grands volumes
de données.

• Données sans étiquettes: plus faciles à obtenir mais souvent plus

compliqué à exploiter.

Leila Ben Othman, FST 2022-2023 4 / 19

Introduction

Jeux de données - Iris dataset

Iris Datset Iris Datset

4.5
setosa 2.5 setosa
versicolor versicolor
4.0 virginica virginica
2.0
sepal_width_in_cm

petal_width_in_cm
3.5
1.5
3.0
1.0
2.5
0.5
2.0
0.0
4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 1 2 3 4 5 6 7
sepal_length_in_cm petal_length_in_cm

Figure: Exemple 1 Figure: Exemple 2

Leila Ben Othman, FST 2022-2023 5 / 19

Introduction

Jeux de données - Iris dataset (non étiquetées)

4.5
2.5

4.0
2.0
sepal_width_in_cm

petal_width_in_cm
3.5
1.5

3.0
1.0

2.5
0.5

2.0
0.0
4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 1 2 3 4 5 6 7
sepal_length_in_cm petal_length_in_cm

Figure: Exemple 1 Figure: Exemple 2

Leila Ben Othman, FST 2022-2023 6 / 19
Introduction

Regroupement - Clustering

• Le regroupement (Clustering) est une techniques d'apprentissage

non supervisé qui consiste à séparer ou à diviser un ensemble de
données en un certain nombre de groupes (cluster).

• Principe:
• Regrouper tout ce qui se ressemble
• Éloigner tout ce qui est diérent
=⇒ Former des clusters.

Un cluster est un regroupement de

données tel que:

• les données au sein d'un même

cluster sont similaires.

• les données appartenant à des

clusters diérents dissemblables.

Leila Ben Othman, FST 2022-2023 7 / 19

Introduction

Applications

• Segmentation des clients

• Système de recommandation

• Détection d'anomalies (données aberrantes)

Leila Ben Othman, FST 2022-2023 8 / 19

L'algorithme K-Means

K-Means

• K-Means est un algorithme non supervisé de clustering non

hiérarchique.

• C'est l'un des algorithmes de clustering les plus répandus. Il permet

d'analyser un jeu de données caractérisées par un ensemble de
descripteurs, an de regrouper les données similaires en groupes
(clusters).

Leila Ben Othman, FST 2022-2023 9 / 19

L'algorithme K-Means

Algorithme K-Means

Figure: Clustering - k=3

Leila Ben Othman, FST 2022-2023 10 / 19

L'algorithme K-Means

K-Means - Démarche

1 La première étape consiste à dénir k centroïdes aléatoirement.

2 Pour chaque observation, calculer la distance aux k centroïdes et

l'associer au centroïde le plus proche. Nous obtenons ainsi k cluster.

3 Recalculer les k nouveaux centroïdes qui seront les centres de

gravité des k cluster.

4 On répète les étapes (2) et (3) jusqu'à ce que les nouveaux

centroïdes restent stables.

NB: Les coordonnées de chaque centroide est la moyenne des

coordonnées des points faisant partie du cluster associé au centroide,
d'où le nom de l'algorithme K-Means ou K-Moyennes.

Leila Ben Othman, FST 2022-2023 11 / 19

L'algorithme K-Means

Algorithme K-Means - Notion de similarité

L'algorithme K-Means utilise la distance euclidienne qui permet d'évaluer

la distance entre chaque point et les centroïdes de chaque cluster:

• La distance Euclidienne entre deux points A(xA , yA ) et B (xB , yB ):

d= (xB − xA )2 + ( yB − yA ) 2
p

• De façon générale, la distance Euclidienne entre deux points A et B

(n coordonnées):

d= n (x − x )2
qP
i =1 iB iA

Leila Ben Othman, FST 2022-2023 12 / 19

L'algorithme K-Means

Exemple

• Étape 1: Pour k=2, soient c1 = (5,3) et c2 = (10,15) les centroides

des deux clusters.

• Étape 2: Pour chaque observation, on calcule la distance euclidienne

avec chacun des centroïdes puis on associe l'observation au
centroïde le plus proche.

Observation Distance euclidienne Distance euclidienne Résultat

du Centroid c1 du centroid c2
c1 = (5,3) c2 = (10,15)

(15,12) 13.453 5.830 c2

(5,4) 1.0 12.083 c1
(20,3) 15.0 15.620 c1
(2,2) 3.162 15.264 c1
(2,10) 7.615 9.433 c1
(3,12) 9.219 7.615 c2

Leila Ben Othman, FST 2022-2023 13 / 19

L'algorithme K-Means

Exemple

• Étape 3

Observation Distance euclidienne Distance euclidienne résultat

du Centroid c1 du centroid c2
c1 = (5,3) c2 = (10,15)

(15,12) 13.453 5.830 c2

(5,4) 1.0 12.083 c1
(20,3) 15.0 15.620 c1
(2,2) 3.162 15.264 c1
(2,10) 7.615 9.433 c1
(3,12) 9.219 7.615 c2

Les nouveaux centroides c1=(7.25, 4.75) et c2=(9.0, 12.0)

Leila Ben Othman, FST 2022-2023 14 / 19

L'algorithme K-Means

Algorithme K-Means
Entrée:
• Jeu de données

• k le nombre de cluster à former

Résultat:
• Une répartition des observations en k cluster

DEBUT
• Choisir aléatoirement k points. Ces points sont les centres des
clusters (centroïdes).

RÉPÉTER
• Pour chaque observation, calculer la distance aux k centroïdes

• Aecter chaque observation au cluster le plus proche

• Pour chaque cluster, calculer les nouveaux centres (centroides)

JUSQU`A CONVERGENCE

FIN ALGORITHME
Leila Ben Othman, FST 2022-2023 15 / 19
L'algorithme K-Means

Exemple

80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 10

20 30 40 50 60 20 30 40 50 60

Figure: Données initiales Figure: k=3

Leila Ben Othman, FST 2022-2023 16 / 19

L'algorithme K-Means

Exemple

80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 10

20 30 40 50 60 20 30 40 50 60

Figure: k=4 Figure: k=5

Leila Ben Othman, FST 2022-2023 17 / 19

L'algorithme K-Means

K-Means - Discussion

1 La bonne valeur de k?
• un k grand: partitionnement trop fragmenté des données: ceci nous
empêchera de découvrir des patterns intéressants dans les données.
• un k petit: des cluster trop généralistes contenant beaucoup de
données.
2 La convergence de l'algorithme K-Means peut être l'une des
conditions suivantes :
• Un nombre d'itérations xé à l'avance, dans ce cas, K-means
eectuera les itérations et s'arrêtera peu importe la forme de clusters
composés.
• Stabilisation des centres de clusters (les centroides ne bougent plus
lors des itérations).
3 L'initialisation des centroides
• initialisation aléatoire: on obtient pas le même partionnement.
4 Evaluation d'un clustering?

Leila Ben Othman, FST 2022-2023 18 / 19

K-Means avec Scikit-learn

• L'import: from sklearn.cluster import KMeans

• Dénition du modèle: kmeans = KMeans(n_clusters=5) - par

défaut, c'est 8.

• Clustering sur des données data: kmeans.t(data)

• Les centroides: kmeans.cluster_centers_

• Les labels des diérents cluster: kmeans.labels_

• Prédiction pour un nouveau cas x: kmeans.predict([x])

Leila Ben Othman, FST 2022-2023 19 / 19

Vous aimerez peut-être aussi

K Means
Pas encore d'évaluation
K Means
34 pages
Cours Appr Non Superv Kmeans
Pas encore d'évaluation
Cours Appr Non Superv Kmeans
14 pages
K-Means et méthode du coude
Pas encore d'évaluation
K-Means et méthode du coude
47 pages
Kmeans
Pas encore d'évaluation
Kmeans
40 pages
Chapitre 4 Apprentissage Non Supervisé ADG
Pas encore d'évaluation
Chapitre 4 Apprentissage Non Supervisé ADG
29 pages
Algorithme K-Means : Formation de Clusters
Pas encore d'évaluation
Algorithme K-Means : Formation de Clusters
15 pages
Approche de Classification À Base de K-Moyennes - V2-4
Pas encore d'évaluation
Approche de Classification À Base de K-Moyennes - V2-4
15 pages
Algorithme K - Means AZ
Pas encore d'évaluation
Algorithme K - Means AZ
7 pages
Introduction au Clustering K-means
Pas encore d'évaluation
Introduction au Clustering K-means
25 pages
Algorithme K-MEANS en Clustering
100% (1)
Algorithme K-MEANS en Clustering
37 pages
Kmeans
100% (2)
Kmeans
23 pages
Classification Tege2
Pas encore d'évaluation
Classification Tege2
19 pages
Clustering K-MEANS : Guide Complet
Pas encore d'évaluation
Clustering K-MEANS : Guide Complet
37 pages
Chapitre 7. Le Clustering
Pas encore d'évaluation
Chapitre 7. Le Clustering
14 pages
Tpe Sia 417
Pas encore d'évaluation
Tpe Sia 417
10 pages
TD N°1 Apprentissage M1-IA 2022-2023 CORR
Pas encore d'évaluation
TD N°1 Apprentissage M1-IA 2022-2023 CORR
7 pages
Algorithmes K-Means et DBSCAN
100% (2)
Algorithmes K-Means et DBSCAN
31 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
8 pages
K-Means Et Maths
Pas encore d'évaluation
K-Means Et Maths
10 pages
Introduction au Clustering K-means
Pas encore d'évaluation
Introduction au Clustering K-means
26 pages
Cfoaf
Pas encore d'évaluation
Cfoaf
10 pages
KNN : Classification et Régression en IA
Pas encore d'évaluation
KNN : Classification et Régression en IA
2 pages
K-Mas K-Myne 250202 143544
Pas encore d'évaluation
K-Mas K-Myne 250202 143544
22 pages
La Segmentation: Clustering
Pas encore d'évaluation
La Segmentation: Clustering
54 pages
ML NonSupervise
Pas encore d'évaluation
ML NonSupervise
30 pages
Cours5 Kmeans KMedoids
Pas encore d'évaluation
Cours5 Kmeans KMedoids
22 pages
Solution d'initialisation pour K-means
Pas encore d'évaluation
Solution d'initialisation pour K-means
10 pages
"K-Means : Guide pour Data Scientists"
100% (1)
"K-Means : Guide pour Data Scientists"
10 pages
DATA MINING - Chap2. SEGMENTATION (K-Means, CAH)
Pas encore d'évaluation
DATA MINING - Chap2. SEGMENTATION (K-Means, CAH)
48 pages
Clustering et Algorithmes de Classification
Pas encore d'évaluation
Clustering et Algorithmes de Classification
74 pages
Chp3 Les Techniques de Clustering
Pas encore d'évaluation
Chp3 Les Techniques de Clustering
40 pages
Chapitre - 5
Pas encore d'évaluation
Chapitre - 5
9 pages
DataMining Chapter 5 Clustering
Pas encore d'évaluation
DataMining Chapter 5 Clustering
63 pages
Algorithme K-means en Clustering Non Supervisé
Pas encore d'évaluation
Algorithme K-means en Clustering Non Supervisé
1 page
Techniques de Clustering Avancées
Pas encore d'évaluation
Techniques de Clustering Avancées
6 pages
Classification Non Hierarchique
Pas encore d'évaluation
Classification Non Hierarchique
14 pages
Clustering et Méthodes de Partitionnement
Pas encore d'évaluation
Clustering et Méthodes de Partitionnement
20 pages
Apprentissage Non Supervis e - Clustering: UP: Math Ematiques
Pas encore d'évaluation
Apprentissage Non Supervis e - Clustering: UP: Math Ematiques
81 pages
Introduction au Clustering en Machine Learning
Pas encore d'évaluation
Introduction au Clustering en Machine Learning
29 pages
Introduction au k-means pour débutants
Pas encore d'évaluation
Introduction au k-means pour débutants
1 page
1-Objectif Du Chapitre
Pas encore d'évaluation
1-Objectif Du Chapitre
1 page
DATA MINING - Chap2. SEGMENTATION (K-Means, CAH)
Pas encore d'évaluation
DATA MINING - Chap2. SEGMENTATION (K-Means, CAH)
59 pages
ch3 ML - 221126 - 094552
Pas encore d'évaluation
ch3 ML - 221126 - 094552
41 pages
Chap2 Clustering Final
Pas encore d'évaluation
Chap2 Clustering Final
50 pages
Recherche Sur Les Algorithmes de Machine Learning
Pas encore d'évaluation
Recherche Sur Les Algorithmes de Machine Learning
5 pages
MID RDF 06
Pas encore d'évaluation
MID RDF 06
107 pages
Clustering K-modes pour données catégoriques
Pas encore d'évaluation
Clustering K-modes pour données catégoriques
25 pages
K Means
Pas encore d'évaluation
K Means
9 pages
Chapitre 3-Apprentissage Non Supervisé
Pas encore d'évaluation
Chapitre 3-Apprentissage Non Supervisé
85 pages
Clustering
Pas encore d'évaluation
Clustering
32 pages
Supplementaire Cluseing
Pas encore d'évaluation
Supplementaire Cluseing
7 pages
Techniques de Clustering en Apprentissage Non Supervisé
Pas encore d'évaluation
Techniques de Clustering en Apprentissage Non Supervisé
38 pages
Introduction au Clustering et K-Means
Pas encore d'évaluation
Introduction au Clustering et K-Means
61 pages
4 Clustering
Pas encore d'évaluation
4 Clustering
35 pages
K plus proches voisins : Guide complet
Pas encore d'évaluation
K plus proches voisins : Guide complet
29 pages
Clustering par K-moyennes simplifié
Pas encore d'évaluation
Clustering par K-moyennes simplifié
13 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
91 pages
Vhdo
Pas encore d'évaluation
Vhdo
4 pages
3.T Cours Espace
Pas encore d'évaluation
3.T Cours Espace
16 pages
Codes Participants - Caméra
Pas encore d'évaluation
Codes Participants - Caméra
1 page
Travaux Dirigés Corriger: Exercice 1)
Pas encore d'évaluation
Travaux Dirigés Corriger: Exercice 1)
14 pages
TD chp2
Pas encore d'évaluation
TD chp2
4 pages
FD 2
Pas encore d'évaluation
FD 2
74 pages
FD 5
Pas encore d'évaluation
FD 5
18 pages
Fiche Data Engineer
Pas encore d'évaluation
Fiche Data Engineer
2 pages
TD chp1
Pas encore d'évaluation
TD chp1
5 pages
Architecture Des Ordinateurs - IF4 TD 2: Synthèse VHDL: Exercice 1)
Pas encore d'évaluation
Architecture Des Ordinateurs - IF4 TD 2: Synthèse VHDL: Exercice 1)
4 pages
Parcours SOCANALYST
Pas encore d'évaluation
Parcours SOCANALYST
1 page
Rip TD2
Pas encore d'évaluation
Rip TD2
1 page
Test Chebh Logique
Pas encore d'évaluation
Test Chebh Logique
1 page
Questions Data Engineering
Pas encore d'évaluation
Questions Data Engineering
2 pages
Rapport PFE Hayet
Pas encore d'évaluation
Rapport PFE Hayet
79 pages
Lettre Motivation Hamdi ESPRIT
Pas encore d'évaluation
Lettre Motivation Hamdi ESPRIT
2 pages
Rapport NOSQL
Pas encore d'évaluation
Rapport NOSQL
33 pages
Recu Cotisation
Pas encore d'évaluation
Recu Cotisation
1 page
Questions OOP PHP
Pas encore d'évaluation
Questions OOP PHP
3 pages
Formation Backend Programme
Pas encore d'évaluation
Formation Backend Programme
3 pages
Plan de sondage et définition du sondage
Pas encore d'évaluation
Plan de sondage et définition du sondage
23 pages
Circuit de Demarrage
Pas encore d'évaluation
Circuit de Demarrage
6 pages
Corrige Devoir 10 3 PDF
Pas encore d'évaluation
Corrige Devoir 10 3 PDF
4 pages
Résumé Procedures Et Fonctions Algo - 250427 - 125446
Pas encore d'évaluation
Résumé Procedures Et Fonctions Algo - 250427 - 125446
4 pages
Cours
Pas encore d'évaluation
Cours
67 pages
Baccalauréat ES 2002 : Sujets et Corrigés Avril-Novembre
Pas encore d'évaluation
Baccalauréat ES 2002 : Sujets et Corrigés Avril-Novembre
56 pages
La Pragmatique
Pas encore d'évaluation
La Pragmatique
106 pages
Commandes de base pour naviguer et gérer les fichiers
Pas encore d'évaluation
Commandes de base pour naviguer et gérer les fichiers
47 pages
Leçon 5
Pas encore d'évaluation
Leçon 5
4 pages
CHap1 2022-1
Pas encore d'évaluation
CHap1 2022-1
42 pages
Projet Eclairage
Pas encore d'évaluation
Projet Eclairage
4 pages
Choix Du Materiaux Pour Un Block Moteur
Pas encore d'évaluation
Choix Du Materiaux Pour Un Block Moteur
2 pages
Fractions Rationnelles
Pas encore d'évaluation
Fractions Rationnelles
76 pages
Cours de Beton Arme Module 1
Pas encore d'évaluation
Cours de Beton Arme Module 1
46 pages
0 - L1S1StrFondCours 2
Pas encore d'évaluation
0 - L1S1StrFondCours 2
105 pages
LES Angiospermes
Pas encore d'évaluation
LES Angiospermes
25 pages
Devoir d'analyse : convergence et séries
Pas encore d'évaluation
Devoir d'analyse : convergence et séries
6 pages
Nombres Complexes 7D 2022 2023
Pas encore d'évaluation
Nombres Complexes 7D 2022 2023
20 pages
Cours Excel
Pas encore d'évaluation
Cours Excel
12 pages
TD N°2
Pas encore d'évaluation
TD N°2
4 pages
Fiche TD Enzymologie Réactions Enzymatiques - Copie
Pas encore d'évaluation
Fiche TD Enzymologie Réactions Enzymatiques - Copie
2 pages
Polycopié GC 2024 2025
Pas encore d'évaluation
Polycopié GC 2024 2025
5 pages
Chapitre IV ML Apprentissage Supervise
Pas encore d'évaluation
Chapitre IV ML Apprentissage Supervise
29 pages
FICHE DE PREVISION DE Hyperfréquences IV - 111646
Pas encore d'évaluation
FICHE DE PREVISION DE Hyperfréquences IV - 111646
3 pages
Can & Cna
Pas encore d'évaluation
Can & Cna
19 pages
Production Antigone Expressions
Pas encore d'évaluation
Production Antigone Expressions
7 pages
Introduction au Champ Électromagnétique
Pas encore d'évaluation
Introduction au Champ Électromagnétique
2 pages
Moteur Generatrice
Pas encore d'évaluation
Moteur Generatrice
4 pages
TP MDC
50% (6)
TP MDC
17 pages
4e - Écritures Fractionnaires - Cours
Pas encore d'évaluation
4e - Écritures Fractionnaires - Cours
12 pages

FD 7

Transféré par

FD 7

Transféré par

Faculté des Sciences de Tunis

Leila Ben Othman

3 K-Means avec Scikit-learn

L'apprentissage non supervisé (Unsupervised Learning)

Principe (Apprentissage non supervisé)

• Dataset: des observations/exemples/un échantillon X

• Données sans étiquettes: plus faciles à obtenir mais souvent plus

Leila Ben Othman, FST 2022-2023 4 / 19

Jeux de données - Iris dataset

Iris Datset Iris Datset

Figure: Exemple 1 Figure: Exemple 2

Leila Ben Othman, FST 2022-2023 5 / 19

Jeux de données - Iris dataset (non étiquetées)

Figure: Exemple 1 Figure: Exemple 2

• Le regroupement (Clustering) est une techniques d'apprentissage

Un cluster est un regroupement de

• les données au sein d'un même

• les données appartenant à des

Leila Ben Othman, FST 2022-2023 7 / 19

• Segmentation des clients

• Détection d'anomalies (données aberrantes)

Leila Ben Othman, FST 2022-2023 8 / 19

• K-Means est un algorithme non supervisé de clustering non

• C'est l'un des algorithmes de clustering les plus répandus. Il permet

Leila Ben Othman, FST 2022-2023 9 / 19

Figure: Clustering - k=3

Leila Ben Othman, FST 2022-2023 10 / 19

1 La première étape consiste à dénir k centroïdes aléatoirement.

2 Pour chaque observation, calculer la distance aux k centroïdes et

3 Recalculer les k nouveaux centroïdes qui seront les centres de

4 On répète les étapes (2) et (3) jusqu'à ce que les nouveaux

NB: Les coordonnées de chaque centroide est la moyenne des

Leila Ben Othman, FST 2022-2023 11 / 19

Algorithme K-Means - Notion de similarité

L'algorithme K-Means utilise la distance euclidienne qui permet d'évaluer

• La distance Euclidienne entre deux points A(xA , yA ) et B (xB , yB ):

• De façon générale, la distance Euclidienne entre deux points A et B

Leila Ben Othman, FST 2022-2023 12 / 19

• Étape 1: Pour k=2, soient c1 = (5,3) et c2 = (10,15) les centroides

• Étape 2: Pour chaque observation, on calcule la distance euclidienne

Observation Distance euclidienne Distance euclidienne Résultat

(15,12) 13.453 5.830 c2

Leila Ben Othman, FST 2022-2023 13 / 19

Observation Distance euclidienne Distance euclidienne résultat

(15,12) 13.453 5.830 c2

Les nouveaux centroides c1=(7.25, 4.75) et c2=(9.0, 12.0)

Leila Ben Othman, FST 2022-2023 14 / 19

• k le nombre de cluster à former

• Aecter chaque observation au cluster le plus proche

• Pour chaque cluster, calculer les nouveaux centres (centroides)

Figure: Données initiales Figure: k=3

Leila Ben Othman, FST 2022-2023 16 / 19

Figure: k=4 Figure: k=5

Leila Ben Othman, FST 2022-2023 17 / 19

Leila Ben Othman, FST 2022-2023 18 / 19

K-Means avec Scikit-learn

• L'import: from sklearn.cluster import KMeans

• Dénition du modèle: kmeans = KMeans(n_clusters=5) - par

• Clustering sur des données data: kmeans.t(data)

• Les centroides: kmeans.cluster_centers_

• Les labels des diérents cluster: kmeans.labels_

• Prédiction pour un nouveau cas x: kmeans.predict([x])

Leila Ben Othman, FST 2022-2023 19 / 19

Vous aimerez peut-être aussi

1 La première étape consiste à dénir k centroïdes aléatoirement.

• Aecter chaque observation au cluster le plus proche

• Dénition du modèle: kmeans = KMeans(n_clusters=5) - par

• Clustering sur des données data: kmeans.t(data)

• Les labels des diérents cluster: kmeans.labels_