0% ont trouvé ce document utile (0 vote)

42 vues29 pages

Clustering

Le clustering est une méthode d'analyse qui regroupe des objets similaires en clusters, sans classes prédéfinies, et est souvent utilisée pour mieux comprendre les données. Un bon clustering produit des groupes avec une forte similarité intra-classe et une faible similarité inter-classe, et sa qualité dépend des mesures de similarité. Les principales approches de clustering incluent le partitionnement, le clustering hiérarchique et les méthodes basées sur la densité.

Transféré par

fatna.elmendili

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

42 vues29 pages

Clustering

Transféré par

fatna.elmendili

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

1

Qu’est‐ce que le clustering ?

• analyse
l de
d clustering
l i
regroupement des objets en clusters
• un cluster : une collection d’objets
similaires au sein d’un même cluster
dissimilaires aux objets appartenant à d’autres clusters
• classification non supervisée : pas de classes prédéfinies
• Applications typiques
afin de mieux comprendre les données
comme prétraitement avant d’autres analyses
2
Qu’est‐ce qu’un bon clustering ?

• Une bonne méthode

é va produire des clusters dont
les éléments ont
une forte similarité intra‐classe
une faible similarité inter‐classe
• La
L qualité
lité d’un
d’ clustering
l t i dépend
dé d de
d la
l mesure de
d
similarité
• La qualité d’une méthode peut aussi être mesurée
par sa capacitéé à trouver quelques
l ou tous les
l
motifs intéressants
3
Caractéristiques des méthodes de clustering

• Mise à l’échelle
Mi l’é h ll
• Capacité à gérer différents types d’attributs
• Découverte de clusters avec des formes arbitraires
• Besoin minimum de connaissances du domaine pour
déterminer les paramètres
• Capacitéé à gérer
é le l bruit
b et les
l exceptions
• Indifférent à l’ordre des données en entrée
• Nombre de dimensions
• Incorporation de contraintes par ll’utilisateur
utilisateur
• Interprétabilité et utilisabilité
4
Structure de données

• Matrice de données ⎡ x 11 ... x 1f ... x 1p ⎤

⎢ ⎥
⎢ ... ... ... ... ... ⎥
⎢x ... x if ... x ip ⎥
⎢ i1 ⎥
⎢ ... ... ... ... ... ⎥
⎢x ... x nf ... x np ⎥⎥
⎢⎣ n1 ⎦
• M
Matrice
t i ded distance
di t
⎡ 0 ⎤
(ou dissimilarité) ⎢ d(2,1) 0 ⎥
⎢ ⎥
⎢ d(3,1 ) d ( 3,2 ) 0 ⎥
⎢ ⎥
⎢ : : : ⎥
⎣⎢ d ( n ,1) d ( n ,2 ) ... ... 0 ⎥⎦
5
Similarité et dissimilarité

• Mé
Métrique
i d
de similarité/dissimilarité
i il i é/di i il i é : exprimée
i é en termes
d’une fonction de distance, typiquement d(i,j)
• Fonction de distance dépend du type des données : binaires,
nominales, ordinales ou continues
• Pondération des dimensions selon l’application et la
sémantique des données
• Difficulté de définir « suffisamment similaires »
la réponse est très subjective
6
Types de données

• continue sur un intervalle

ex : poids,
poids taille
• binaire
• nominale
ex : couleur
• ordinale
• à échelle variable
ex : croissance optimale des bactéries, durée de
la radioactivité
• Mixte
7
Valeurs continues sur un intervalle, normalisation

• N
Normaliser
li les
l données
d é : s’affranchir
’ ff hi ddes unités
ié d de mesures
• écart absolu à la moyenne
s f = 1n (| x1 f − m f | + | x2 f − m f | +...+ | xnf − m f |)

• Calculer la mesure normalisée (z‐score)

xif − m f
zif = sf

• L’utilisation de l’écart absolu est plus robuste que celle de

ll’écart
écart type
8
Valeurs continues sur un intervalle, Fonction de distance

• Di t
Distance d
de Mi
Minkowski
k ki :
d (i, j) = q (| x − x |q + | x − x |q +...+ | x − x |q )
i1 j1 i2 j2 ip jp
avec i = (xi1, xi2, …, xip) et j = (xj1, xj2, …, xjp) deux objets à p dimensions, et q un
entier positif
• si q = 1 : distance de Manhattan
d(i, j) =| x − x | +| x − x | +...+| x − x |
i1 j1 i2 j2 ip jp
• si q = 2 :distance euclidienne
d (i, j) = (| x − x |2 + | x − x |2 +...+ | x − x |2 )
i1 j1 i2 j2 ip jp
• Propriétés
d(i,i)) = 0
d(
d(i,j) ≥ 0 (positive)
d(i,j) = d(j,i) (symétrique)
d(i,j) ≤ d(i,k) + d(k,j) (inégalité triangulaire)
9
Valeurs binaires

• table de contingence
Objet j

1 0

1 a b
Objet i
0 c d

• coefficient simple d’appariement (invariant, si la

variable est symétrique) b+c
d (i, j ) =
a+b+c+d

• coefficient de Jaccard (non invariant, si la variable

estt asymétrique)
ét i )
d (i, j ) = b+c
a+b+c
10
Dissimilarité de valeurs binaires

• Exemple
E l

N
Nom S
Sexe Fiè
Fièvre T
Tousse T t 1
Test-1 T t 2
Test-2 T t 3
Test-3 T t 4
Test-4
Jacques M O N P N N N
Marie F O N P N P N
Jean M O P N N N N

• sexe est symétrique

• les autres sont asymétriques
• soit O et P = 1, et N = 0

0 +1
d ( jacques , marie ) = = 0 . 33
2 + 0 +1
1+1
d ( jacques , jean ) = = 0 . 67
1+1+1
1+ 2
d ( jean , marie ) = = 0 . 75
1+1+ 2
11
Variables nominales

• généralisation
é é li ti d des valeurs
l bi
binaires
i : plus
l ded 2 états
ét t
• méthode 1 : appariement simple
m : nombre d’appariements, p : nombre total de
variables
i bl
d ( i , j ) = p −p m

• méthode 2 : utiliser un grand nombre de variables

binaires
création d’une variable binaire pour chacun des
ét t d’une
états d’ variable
i bl nominale
i l
12
Variable ordinale

• l’l’ordre
d estt iimportant
t t : rang
• peut être traitée comme une variable continue sur
un intervalle
remplace
l xif par son rang rif ∈ {1,..., M f }
transforme chaqueq variable sur [0,1]
[ , ] en
remplaçant le i‐ième objet de la f‐ième variable
r if − 1
z =
if M f − 1

calcule la dissimilarité en utilisant les méthodes

d valeurs
de l continues
ti sur un intervalle
i t ll
13
à échelle variable

• mesure positive
i i sur une ééchelle
h ll non linéaire,
li é i échelle
é h ll
exponentielle qui suit approximativement AeBT ou Ae‐BT
• Méthodes
les traiter comme des variables continues sur un intervalles : mauvais
choix
appliquer une transformation logarithmique puis les traiter comme
des variables continues sur un intervalle
yiff = log(xiff)

les traiter comme des variables ordinales en traitant leur rangg

14
Variables de type mixte

• Les objets peuvent être

ê décrits
é avec tous les types
de données
binaire symétrique, binaire asymétrique,
nominale, ordinale, …

• Utilisation d’une formule p

pondérée pour
p combiner
leurs effets

Σ p
δ ( f )
d ( f )
d (i, j ) = f = 1 ij ij
Σ p
f = 1
δ ( f )
ij
15
Principales approches

• partitionnement
ii
partitionne les objets et évalue les partitions
• hiérarchique
décomposition hiérarchique d’ensembles
d objets
d’objets
• densité
basée sur une fonction de densité ou de
connectivité
• grille
basée sur une structure de granularité à
plusieurs
l i niveaux
i
16
Partitionnement

• C
Construire
t i une partition
titi de
d la
l base
b de
d données
d é D contenant
t tn
objets en un ensemble de k clusters
• Etant
E donné
d é k,
k trouvéé une partition
i i en k clusters
l quii
optimisent le critère de partitionnement
Optimum
O i global
l b l : traiter
i toutes lesl partitions
ii exhaustivement
h i
Heuristique : k‐means ou k‐médoïdes
k‐means
k : chaque
h cluster
l t estt représenté
é té par son centre
t
k‐médoïdes ou PAM (partition around medoids) : chaque cluster est
représenté par un des objets du cluster
17
k‐means

• 4 étapes
é
1 Partitionne les objets en k ensembles non
1.
vides
2. Calcule le centroïde de chaque
partition/cluster
3. Assigne
g à chaqueq objet j le cluster dont le
centroïde est le plus proche
4. boucle
b l en 2, jusqu’à ’à ce les
l clusters
l soient
stables.
18
k‐means, exemple

10 10

9 9

8 8

7 7

6 6

5 5

4 4

3 3

2 2

1 1

0 0
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

10 10

9 9

8 8

7 7

6 6

5 5

4 4

3 3

2 2

1 1

0 0
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
19
k‐means. Remarques

• Avantages
Relativement efficace : O(tkn), avec n le nombre d’objets, t le nombre
d’itérations et en ggénéral t et k << n
Termine souvent sur un optimum local. L’optimum global peut être
atteint en utilisant des techniques telles que les algorithmes
génétiques
• Faiblesses
Utilisable seulement lorsque la moyenne est définie.
définie Que faire dans le
cas de données nominales ?
Besoin de spécifier k à l’avance
Ne gère pas le bruit et les exceptions
Ne trouve que des clusters de forme convexe
20
k‐médoïdes

• Trouve des représentants

représentants, appelés médoïdes,
médoïdes dans les
clusters
• PAM
médoïde : l’objet d’un cluster pour lequel la distance moyenne à tous
les autres objets du cluster est minimale
k
critère d’erreur :
E= ∑∑ d ( p, m ) 2
i
• Algorithme i =1 p∈Ci

1. Sélectionner k objets arbitrairement

2. Assigner le reste des objets au médoïde le plus proche
3. Sél ti
Sélectionner un objet
bj t non médoïde
éd ïd ett échanger
é h sii le
l critère
itè d’d’erreur
peut être réduit
4. Répéter
p 2 et 3 jusqu’à
j q ne plusp pouvoir
p réduire le critère d’erreur
21
PAM. Exemple

E’-E<0

E’-E>0

E’-E<0
22
Clustering hiérarchique

• Utilisation d’une matrice de distance : ne nécessite

é
pas de spécifier le nombre de clusters

Step 0 Step 1 Step 2 Step 3 Step 4

agglomerative
((AGNES))
a ab
b abcde
c
cde
d
de
e
sépatative
Step 4 Step 3 Step 2 Step 1 Step 0 (DIANA)
23
AGNES (Agglomerative Nesting)

• Utilise une matrice de dissimilaritéé

• Fusionne les nœuds les moins dissimilaires

10 10 10

9 9 9

8 8 8

7 7 7

6 6 6

5 5 5

4 4 4

3 3 3

2 2 2

1 1 1

0 0 0
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
24
Un dendrogramme illustre comment les clusters sont fusionnés hiérarchiquement

• Décompose
é les données
é en plusieurs niveaux
imbriqués de partitionnement
• Un clustering est obtenu en coupant le
dendogramme au niveau choisi
25
Mesures de similarité entre 2 clusters

• complete linkage
plus petite similarité/plus grande distance entre
toutes les paires de gènes entre 2 clusters
• average linkage
similarité
i il ité moyenne entre t les
l paires
i ded gènes
è

• single linkage
plus grande similarité/plus petite distance entre
2 gènes
è de
d 2 clusters
l t
26
Méthodes basées sur la densité

• Principales caractéristiques
Cluster de forme arbitraire
Gestion du bruit
B i d’un
Besoin d’ paramètre
è de d densité
d i é comme critère
iè
d’arrêt p
• 2 paramètres
Eps : rayon maximal de voisinage
q
MinPts : nombre minimal de points dans le voisinage
défini par Eps

• NEps(p) : { q ∈ D | dist(p,q) ≤ Eps} p

• un point p est directement atteignable d
d’un
un point q si
p appartient à NEps(q) p1
|NEps(q)| ≥ MinEps
q
• un point
i p est atteignable
i bl d’un
d’ point
i q sii
il existe une chaîne de points p1, …, pn telle que p1=q et
pn=p et que les pi+1 sont directement atteignables des pi
• un point p est connecté à un point q si p q
il existe un point o tel que p et q sont atteignables
depuis o
o
27
Méthodes basées sur une grille

• U
Utilisation
ili i d’une
d’ grille
ill à des
d résolutions
é l i multiples
l i l comme
structure de données
• L’espace est divisé en cellules rectangulaires
28
Méthodes basées sur une grille

• Chaque cellule de niveau i est divisée en un certain

nombre de cellules plus petites au niveau i+1
• Informations statistiques calculées et stockées à chaque
niveau
• Approche descendante
• Suppression des cellules non pertinentes pour les
ité ti
itérations suivantes
i t
• Répéter le processus jusqu’à atteindre le niveau le plus
bas
• Avantages
parallélisable, mise à jour incrémentale
O(k), où k est le nombre de cellule au p
plus bas niveau
• Faiblesse
les bords des clusters sont soit horizontaux soit
verticaux, pas de diagonale !
Salaary
(10,000)

τ=3
0 1 2 3 4 5 6 7

20
30
40
50

Vacatio
on
60
age

30
Vacaation
(weeek)
50

0 1 2 3 4 5 6 7
20
30
40

age
50
60
age
29

Vous aimerez peut-être aussi

Introduction au Clustering et Méthodes
Pas encore d'évaluation
Introduction au Clustering et Méthodes
29 pages
Introduction au Clustering et K-Means
Pas encore d'évaluation
Introduction au Clustering et K-Means
48 pages
Clustering et Similarité des Données
Pas encore d'évaluation
Clustering et Similarité des Données
57 pages
Clustering : Guide Essentiel et Applications
Pas encore d'évaluation
Clustering : Guide Essentiel et Applications
10 pages
Clu String
Pas encore d'évaluation
Clu String
32 pages
Cours DM 2 PDF
Pas encore d'évaluation
Cours DM 2 PDF
10 pages
Classification Non-Supervisée et Clustering
Pas encore d'évaluation
Classification Non-Supervisée et Clustering
29 pages
Cours 4 Clustering
Pas encore d'évaluation
Cours 4 Clustering
40 pages
Clustering
Pas encore d'évaluation
Clustering
51 pages
Techniques de Fouilles de Données
Pas encore d'évaluation
Techniques de Fouilles de Données
110 pages
4 Clustering
Pas encore d'évaluation
4 Clustering
35 pages
Donnes
Pas encore d'évaluation
Donnes
58 pages
Méthodes de Clustering en Apprentissage Automatique
Pas encore d'évaluation
Méthodes de Clustering en Apprentissage Automatique
35 pages
Clustering VF
Pas encore d'évaluation
Clustering VF
70 pages
2011-12 Cours Add
Pas encore d'évaluation
2011-12 Cours Add
12 pages
Méthodes de Clustering et Classification
Pas encore d'évaluation
Méthodes de Clustering et Classification
107 pages
Apprentissage Non Supervisé en Machine Learning
Pas encore d'évaluation
Apprentissage Non Supervisé en Machine Learning
101 pages
Cours Datamining P2
Pas encore d'évaluation
Cours Datamining P2
26 pages
Clustering
100% (1)
Clustering
114 pages
Techniques de Clustering et Algorithmes
Pas encore d'évaluation
Techniques de Clustering et Algorithmes
47 pages
ST M Intro ExploMultidim
Pas encore d'évaluation
ST M Intro ExploMultidim
3 pages
Clustering et K-means en Informatique
Pas encore d'évaluation
Clustering et K-means en Informatique
7 pages
Méthodes de Clustering et Distances
Pas encore d'évaluation
Méthodes de Clustering et Distances
64 pages
Techniques de Clustering
100% (2)
Techniques de Clustering
50 pages
Méthodes de Classification des Données
Pas encore d'évaluation
Méthodes de Classification des Données
40 pages
Structures de Donnees Similarites Dissimilarites
100% (1)
Structures de Donnees Similarites Dissimilarites
9 pages
Classification supervisée et non-supervisée
Pas encore d'évaluation
Classification supervisée et non-supervisée
46 pages
Cours d'Analyse des Données en Informatique
Pas encore d'évaluation
Cours d'Analyse des Données en Informatique
5 pages
Introduction à l'analyse de données
100% (1)
Introduction à l'analyse de données
21 pages
Préparation et Qualité des Données en Data Mining
Pas encore d'évaluation
Préparation et Qualité des Données en Data Mining
44 pages
Introduction à la Fouille de Données
Pas encore d'évaluation
Introduction à la Fouille de Données
12 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
43 pages
Analys
Pas encore d'évaluation
Analys
16 pages
Cours Segmentation
Pas encore d'évaluation
Cours Segmentation
63 pages
1 Slides
Pas encore d'évaluation
1 Slides
41 pages
Introduction au Clustering et Méthodes
Pas encore d'évaluation
Introduction au Clustering et Méthodes
11 pages
Cours de Data Mining 3-Modelisation-EPF 1
Pas encore d'évaluation
Cours de Data Mining 3-Modelisation-EPF 1
16 pages
Partie Moad
Pas encore d'évaluation
Partie Moad
10 pages
Analyse de Données : Méthodes et Outils
Pas encore d'évaluation
Analyse de Données : Méthodes et Outils
3 pages
Méthodes de Traitement Statistique
Pas encore d'évaluation
Méthodes de Traitement Statistique
48 pages
Analyse Discriminante v2
100% (1)
Analyse Discriminante v2
43 pages
Méthodes et Qualité du Clustering
Pas encore d'évaluation
Méthodes et Qualité du Clustering
56 pages
ch3 ML - 221126 - 094552
Pas encore d'évaluation
ch3 ML - 221126 - 094552
41 pages
Cours Data Mining
Pas encore d'évaluation
Cours Data Mining
60 pages
Tuffery - Master Rennes 2013-2014 - Data Mining - Presentation PDF
Pas encore d'évaluation
Tuffery - Master Rennes 2013-2014 - Data Mining - Presentation PDF
177 pages
Cours de Data Mining Tuffery
Pas encore d'évaluation
Cours de Data Mining Tuffery
177 pages
Introduction au Clustering
Pas encore d'évaluation
Introduction au Clustering
6 pages
Classification Hiérarchique en Clustering
Pas encore d'évaluation
Classification Hiérarchique en Clustering
64 pages
Cours - Data Science Intro+ACP
100% (2)
Cours - Data Science Intro+ACP
63 pages
Techniques de Clustering en Apprentissage Non Supervisé
Pas encore d'évaluation
Techniques de Clustering en Apprentissage Non Supervisé
38 pages
01introduction Au Data Mining
Pas encore d'évaluation
01introduction Au Data Mining
9 pages
Clustering
Pas encore d'évaluation
Clustering
50 pages
Processus de Data Mining et KDD
Pas encore d'évaluation
Processus de Data Mining et KDD
12 pages
Introduction à l'apprentissage non supervisé
Pas encore d'évaluation
Introduction à l'apprentissage non supervisé
50 pages
Cours ANAD 2022-2023
Pas encore d'évaluation
Cours ANAD 2022-2023
21 pages
Méthodes de Classification : K-means, CHA, KNN
Pas encore d'évaluation
Méthodes de Classification : K-means, CHA, KNN
10 pages
Profil de pensée novatrice FourSight
Pas encore d'évaluation
Profil de pensée novatrice FourSight
3 pages
Transfert d'énergie et thermodynamique
Pas encore d'évaluation
Transfert d'énergie et thermodynamique
15 pages
Test Cls 11
Pas encore d'évaluation
Test Cls 11
4 pages
CV Abdoul Hamid SY - Expert en Gestion et Audit
Pas encore d'évaluation
CV Abdoul Hamid SY - Expert en Gestion et Audit
5 pages
L1 HISTOIRE DE L'ART 23-24 Complet
Pas encore d'évaluation
L1 HISTOIRE DE L'ART 23-24 Complet
26 pages
Devoir Mathématiques Première S1
Pas encore d'évaluation
Devoir Mathématiques Première S1
2 pages
Introduction à la théorie des graphes
Pas encore d'évaluation
Introduction à la théorie des graphes
7 pages
Marketing RH : Attirer et Fidéliser les Talents
Pas encore d'évaluation
Marketing RH : Attirer et Fidéliser les Talents
2 pages
Introduction aux Architectures Logicielles
Pas encore d'évaluation
Introduction aux Architectures Logicielles
126 pages
Bulletin 2 Nutrition
Pas encore d'évaluation
Bulletin 2 Nutrition
1 page
Impact Environnemental Dépôt El Bokri
100% (2)
Impact Environnemental Dépôt El Bokri
50 pages
Tube Acier Galvanisé PDF
Pas encore d'évaluation
Tube Acier Galvanisé PDF
3 pages
Bulletin Scolaire 3ème Technique Telecoms
Pas encore d'évaluation
Bulletin Scolaire 3ème Technique Telecoms
1 page
Annexe 1 % Types de Plans
Pas encore d'évaluation
Annexe 1 % Types de Plans
7 pages
Vues et Index en Bases de Données
Pas encore d'évaluation
Vues et Index en Bases de Données
25 pages
Comptabilité de La Consommation Des Ressources
Pas encore d'évaluation
Comptabilité de La Consommation Des Ressources
5 pages
Analyse de la matrice A.D.L en stratégie
Pas encore d'évaluation
Analyse de la matrice A.D.L en stratégie
13 pages
Compo 1AS (2025)
Pas encore d'évaluation
Compo 1AS (2025)
2 pages
Chapitre VI-Etats-limites de Service (ELS) - 20
100% (1)
Chapitre VI-Etats-limites de Service (ELS) - 20
64 pages
Cours de Creativite Enguta
100% (1)
Cours de Creativite Enguta
132 pages
Numérisation et Accès aux Livres Publics
Pas encore d'évaluation
Numérisation et Accès aux Livres Publics
453 pages
ANTONYMIE
Pas encore d'évaluation
ANTONYMIE
8 pages
Bibliographie Relations Internationales 2011
Pas encore d'évaluation
Bibliographie Relations Internationales 2011
41 pages
Méthode Kanban : Historique et Application
100% (1)
Méthode Kanban : Historique et Application
23 pages
Exercice Stats 2 Variables 1004
Pas encore d'évaluation
Exercice Stats 2 Variables 1004
3 pages
Résolution d'équations différentielles par différences finies
Pas encore d'évaluation
Résolution d'équations différentielles par différences finies
7 pages
T1-Le Textament Hippies - 1 - Dyslexic - Full
Pas encore d'évaluation
T1-Le Textament Hippies - 1 - Dyslexic - Full
328 pages
Raccourcis Clavier Avec Ubuntu A535
Pas encore d'évaluation
Raccourcis Clavier Avec Ubuntu A535
4 pages
Plan de distribution RDC détaillé
Pas encore d'évaluation
Plan de distribution RDC détaillé
1 page
Examen 09 10
Pas encore d'évaluation
Examen 09 10
5 pages

Clustering

Transféré par

Clustering

Transféré par

1

Qu’est‐ce que le clustering ?

• Une bonne méthode

• Matrice de données ⎡ x 11 ... x 1f ... x 1p ⎤

• continue sur un intervalle

• Calculer la mesure normalisée (z‐score)

• L’utilisation de l’écart absolu est plus robuste que celle de

• coefficient simple d’appariement (invariant, si la

• coefficient de Jaccard (non invariant, si la variable

• sexe est symétrique

• méthode 2 : utiliser un grand nombre de variables

 calcule la dissimilarité en utilisant les méthodes

 les traiter comme des variables ordinales en traitant leur rangg

• Les objets peuvent être

• Utilisation d’une formule p

• Trouve des représentants

1. Sélectionner k objets arbitrairement

• Utilisation d’une matrice de distance : ne nécessite

Step 0 Step 1 Step 2 Step 3 Step 4

• Utilise une matrice de dissimilaritéé

• NEps(p) : { q ∈ D | dist(p,q) ≤ Eps} p

• Chaque cellule de niveau i est divisée en un certain

Vous aimerez peut-être aussi

calcule la dissimilarité en utilisant les méthodes

les traiter comme des variables ordinales en traitant leur rangg