0% ont trouvé ce document utile (0 vote)

45 vues79 pages

Clustering

La segmentation, ou clustering, est une méthode de classification non supervisée qui regroupe des objets de données similaires en clusters distincts. Le document aborde différentes approches de clustering, notamment les méthodes de partitionnement, hiérarchiques et basées sur la densité, ainsi que des exemples d'applications dans divers domaines. La qualité d'un clustering est évaluée par la similarité intra-classe et la dissimilarité inter-classe, influencées par la mesure de similarité utilisée.

Transféré par

safranus.dz

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

45 vues79 pages

Clustering

Transféré par

safranus.dz

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Segmentation (Clustering)

Introduction à la fouille de données

M. Ledmi
m_ledmi@[Link]
Département d’Informatique Khenchela

2020/2021

M. Ledmi Introduction à la fouille de données

Segmentation (Clustering)

Plan

1 Segmentation (Clustering)
Introduction
Problématique
Distance et Dissimilarité
Algorithme k-Means

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Vous êtes ici

1 Segmentation (Clustering)
Introduction
Problématique
Distance et Dissimilarité
Algorithme k-Means

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Segmentation( Clustering)

La segmentation se rapporte à la
catégorisation d’un ensemble d’objets de
données dans des clusters.
Elle est aussi appelée classification non
supervisée.
Un cluster est une collection d’objets de
données :
Similaires les uns aux autres dans le même
segment,
Différents des objets dans d’autres segments.

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Segmentation( Clustering)

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Segmentation( Clustering)

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Segmentation( Clustering)

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Approches de clustering

Méthode de partitionnement :
Créer un partitionnement initial.
Utiliser une stratégie de contrôle itérative
pour l’optimiser.

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Approches de clustering

Méthode de partitionnement :
Créer un partitionnement initial.
Utiliser une stratégie de contrôle itérative
pour l’optimiser.

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Approches de clustering

Méthode de partitionnement :
Créer un partitionnement initial.
Utiliser une stratégie de contrôle itérative
pour l’optimiser.

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Approches de clustering

Méthode de partitionnement :
Créer un partitionnement initial.
Utiliser une stratégie de contrôle itérative
pour l’optimiser.

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Approches de clustering

Méthode de partitionnement :
Créer un partitionnement initial.
Utiliser une stratégie de contrôle itérative
pour l’optimiser.

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Approches de clustering

Méthodes hiérarchiques :
Construire une hiérarchie de clusters (appelé
dendrogramme),
Non seulement un partitionnement unique
des objets.
Utiliser une condition de terminaison. (ex.
Nombre de clusters).
Méthodes basées sur la densité : utiliser les
fonctions de densité de voisinage.

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Approches de clustering

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Approches de clustering

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Approches de clustering

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Approches de clustering

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Exemples d’application de la segmentation

La reconnaissance de formes et le traitement d’images.

Analyse des données spatiales : créer des cartes thématiques dans les
systèmes d’information géographique (SIG).
Bioinformatique : la détermination des groupes de signatures à partir
d’une base de données de gènes.
Web : clustering des fichiers log pour découvrir des modèles d’accès
similaires.

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Exemples d’application de la segmentation

La reconnaissance de formes et le traitement d’images.

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Exemples d’application de la segmentation

La reconnaissance de formes et le traitement d’images.

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Exemples d’application de la segmentation

La reconnaissance de formes et le traitement d’images.

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Problèmatique
Problèmatique
Soit P une polpulation d’instances de données à N attributs, trouver un
partitionnement en K clusters (groupes) {C1 , C2, . . . CK } de P telque :
K
[
Ck = P
k=1

Où les clusters Ck soient :

1 Homogènes que possible (similaires au sein d’un même groupe).
2 Distincts que possible (dissimilaires quand ils appartiennent à des
groupes différents).

K peut être donné, ou “découvert”.

M. Ledmi Introduction à la fouille de données
Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Problèmatique
Problèmatique
Soit P une polpulation d’instances de données à N attributs, trouver un
partitionnement en K clusters (groupes) {C1 , C2, . . . CK } de P telque :
K
[
Ck = P
k=1

Où les clusters Ck soient :

1 Homogènes que possible (similaires au sein d’un même groupe).
2 Distincts que possible (dissimilaires quand ils appartiennent à des
groupes différents).

K peut être donné, ou “découvert”.

M. Ledmi Introduction à la fouille de données
Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Problèmatique
Problèmatique
Soit P une polpulation d’instances de données à N attributs, trouver un
partitionnement en K clusters (groupes) {C1 , C2, . . . CK } de P telque :
K
[
Ck = P
k=1

Où les clusters Ck soient :

1 Homogènes que possible (similaires au sein d’un même groupe).
2 Distincts que possible (dissimilaires quand ils appartiennent à des
groupes différents).

K peut être donné, ou “découvert”.

M. Ledmi Introduction à la fouille de données
Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Qualité d’un clustering

Une bonne méthode de clustering produira des clusters d’excellente

qualité avec :
Similarité intra-classe importante.
Similarité inter-classe faible.
La qualité d’un clustering dépend de :
La mesure de similarité utilisée.
L’implémentation de la mesure de similarité.
La qualité d’une méthode de clustering est évaluée par son abilité à
découvrir certains ou tous les “pattern” cachés.

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Qualité d’un clustering

Une bonne méthode de clustering produira des clusters d’excellente

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Qualité d’un clustering

Une bonne méthode de clustering produira des clusters d’excellente

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Qualité d’un clustering

Une bonne méthode de clustering produira des clusters d’excellente

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Qualité d’un clustering

Une bonne méthode de clustering produira des clusters d’excellente

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Qualité d’un clustering

Une bonne méthode de clustering produira des clusters d’excellente

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Qualité d’un clustering

Une bonne méthode de clustering produira des clusters d’excellente

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Distance et Dissimilarité

Distance
On appelle distance sur un ensemble E, une application d : E × E ← R+
telle que :

1 Séparation : ∀(x, y) ∈ E 2 : d(x, y) = 0 ssi x = y

2 Symétrie : ∀(x, y) ∈ E 2 : d(x, y) = d(y, x)
3 Inégalité triangulaire : ∀(x, y, z) ∈ E 3 : d(x, z) ≤ d(x, y) + d(y, z)

Une dissimilarité est une application qui a les propriétés de la distance

sauf éventuellement l’inégalité triangulaire.
M. Ledmi Introduction à la fouille de données
Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Distance et Dissimilarité

Distance
On appelle distance sur un ensemble E, une application d : E × E ← R+
telle que :

1 Séparation : ∀(x, y) ∈ E 2 : d(x, y) = 0 ssi x = y

2 Symétrie : ∀(x, y) ∈ E 2 : d(x, y) = d(y, x)
3 Inégalité triangulaire : ∀(x, y, z) ∈ E 3 : d(x, z) ≤ d(x, y) + d(y, z)

Une dissimilarité est une application qui a les propriétés de la distance

sauf éventuellement l’inégalité triangulaire.
M. Ledmi Introduction à la fouille de données
Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Distance et Dissimilarité

Distance
On appelle distance sur un ensemble E, une application d : E × E ← R+
telle que :

1 Séparation : ∀(x, y) ∈ E 2 : d(x, y) = 0 ssi x = y

2 Symétrie : ∀(x, y) ∈ E 2 : d(x, y) = d(y, x)
3 Inégalité triangulaire : ∀(x, y, z) ∈ E 3 : d(x, z) ≤ d(x, y) + d(y, z)

Une dissimilarité est une application qui a les propriétés de la distance

sauf éventuellement l’inégalité triangulaire.
M. Ledmi Introduction à la fouille de données
Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Distance et Dissimilarité

Distance
On appelle distance sur un ensemble E, une application d : E × E ← R+
telle que :

1 Séparation : ∀(x, y) ∈ E 2 : d(x, y) = 0 ssi x = y

2 Symétrie : ∀(x, y) ∈ E 2 : d(x, y) = d(y, x)
3 Inégalité triangulaire : ∀(x, y, z) ∈ E 3 : d(x, z) ≤ d(x, y) + d(y, z)

Une dissimilarité est une application qui a les propriétés de la distance

sauf éventuellement l’inégalité triangulaire.
M. Ledmi Introduction à la fouille de données
Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Distance et Dissimilarité

Distance
On appelle distance sur un ensemble E, une application d : E × E ← R+
telle que :

1 Séparation : ∀(x, y) ∈ E 2 : d(x, y) = 0 ssi x = y

2 Symétrie : ∀(x, y) ∈ E 2 : d(x, y) = d(y, x)
3 Inégalité triangulaire : ∀(x, y, z) ∈ E 3 : d(x, z) ≤ d(x, y) + d(y, z)

Une dissimilarité est une application qui a les propriétés de la distance

sauf éventuellement l’inégalité triangulaire.
M. Ledmi Introduction à la fouille de données
Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Choix d’une Distance

Définir une distance sur chacun des attributs :

Distance : d(x, y) = |x − y|,
|x−y|
Distance normalisée : d(x, y) = dmax

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Choix d’une Distance

Définir une distance sur chacun des attributs :

Distance : d(x, y) = |x − y|,
|x−y|
Distance normalisée : d(x, y) = dmax

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Choix d’une Distance

Définir une distance sur chacun des attributs :

Distance : d(x, y) = |x − y|,
|x−y|
Distance normalisée : d(x, y) = dmax
Exemple : Age, taille, poids.

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Choix d’une Distance

Attributs discrets :
Données binaires : d(0, 0) = d(1, 1) = 0, d(0, 1) = d(1, 0) = 1.
Données énumératives : distance nulle si les valeurs sont égales et 1 sinon.
Données énumératives ordonnées : On peut définir une distance utilisant la
relation d’ordre.
Données de types complexes : textes, images, données génétiques,
. . . etc.

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Choix d’une Distance

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Choix d’une Distance

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Choix d’une Distance

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Choix d’une Distance

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Distance : Données numériques

Standardiser les données

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Distance : Données numériques

Standardiser les données

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Distance : Données numériques

Standardiser les données

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Distance : Données numériques

Exemple :
Age Salaire
P1 50 11000
Calculer d(P1,P2), d(P1,P3) sans P2 70 11100
P3 60 11122
standardiser les données : P4 60 11074
Conclusion : P1 ressemble plus à P2
qu’à P3 d(P1,P2)=120 d(P1,P3)=132
Calculer d(P1,P2), d(P1,P3) après avoir Age Salaire
standardisé les données : P1 -2 -2
P2 2 0.7
Conclusion : P1 ressemble plus à P3 P3 0 1.3
P4 0 0
qu’à P2
d(P1,P2)=6.7 d(P1,P3)=4.3
M. Ledmi Introduction à la fouille de données
Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Distance : Données numériques

Distance : Données binaires

Coefficient de correspondance
simple : (similarité invariante, si la
variable binaire est symétrique) :
Objet J
b+c
d(i, j) = 1 0 Somme
a+b+c+d 1 a b a+b
Objet I
Coefficient de Jaccard : (similarité 0 c d c+d
Somme a+c b+d n
non invariante, si la variable binaire est
asymétrique) : Table – Table de dissimilarité

b+c
d(i, j) =
a+b+c

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Distance : Données binaires

b+c
d(i, j) =
a+b+c

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Distance : Données binaires

Exemple :
Nom Fièvre Toux Test-1 Test-2 Test-3 Test-4
Salim Oui N P N N N
Karima Oui N P N P N
Ali Oui P N N N N

Table – Table de patients

Calculer la distance entre patients, basée sur le coefficient de Jaccard.

0+1
d(Salim, Karima) = = 0.33
2+0+1
1+1
d(Salim, Ali) = = 0.67
1+1+1
2+1
d(Karima, Ali) = = 0.75
M. Ledmi 1Introduction
+ 2 +à la1fouille de données
Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Distance : Données binaires

Exemple :
Nom Fièvre Toux Test-1 Test-2 Test-3 Test-4
Salim Oui N P N N N
Karima Oui N P N P N
Ali Oui P N N N N

Table – Table de patients

Calculer la distance entre patients, basée sur le coefficient de Jaccard.

Distance : Données binaires

Exemple :
Nom Fièvre Toux Test-1 Test-2 Test-3 Test-4
Salim Oui N P N N N
Karima Oui N P N P N
Ali Oui P N N N N

Table – Table de patients

Calculer la distance entre patients, basée sur le coefficient de Jaccard.

Distance : Données binaires

Exemple :
Nom Fièvre Toux Test-1 Test-2 Test-3 Test-4
Salim Oui N P N N N
Karima Oui N P N P N
Ali Oui P N N N N

Table – Table de patients

Calculer la distance entre patients, basée sur le coefficient de Jaccard.

Distance : Données énumératives

Généralisation des variables binaires, avec plus de 2 états : rouge,

jaune, bleu, vert . . . etc.
Méthode 1 : Correpondance simple m : # de correspondances, p :
# total de variables
p−m
d(i, j) =
p
Méthode 2 : Utiliser un grand nombre de variables binaires :
Créer une variable binaire pour chaque modalité (ex : variable rouge qui prend
les valeurs vrai ou faux).

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Distance : Données énumératives

Généralisation des variables binaires, avec plus de 2 états : rouge,

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Distance : Données énumératives

Généralisation des variables binaires, avec plus de 2 états : rouge,

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Distance : Données énumératives

Généralisation des variables binaires, avec plus de 2 états : rouge,

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Algorithme k-Means (MacQueen’67) :

Entrées : un ensemble de m enregistrements

x1 , . . . , x m
1 Choisir k centres initiaux c1 , . . . , ck ;
2 Répartir chacun des m enregistrements dans le
groupe i dont le centre ci est le plus proche.;
3 Si aucun élément ne change de groupe alors arrêt et
sortir les groupes;
4 Calculer les nouveaux centres : pour tout i, ci est la
moyenne des éléments du groupe i.;
5 Aller en 2.;

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Algorithme k-Means (MacQueen’67) :

Entrées : un ensemble de m enregistrements

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Algorithme k-Means (MacQueen’67) :

Entrées : un ensemble de m enregistrements

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Algorithme k-Means (MacQueen’67) :

Entrées : un ensemble de m enregistrements

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Algorithme k-Means (MacQueen’67) :

Entrées : un ensemble de m enregistrements

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Algorithme k-Means (MacQueen’67) :

Entrées : un ensemble de m enregistrements

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Algorithme k-Means (MacQueen’67) :

Entrées : un ensemble de m enregistrements

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Algorithme k-Means (MacQueen’67) :

Entrées : un ensemble de m enregistrements

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Algorithme k-Means (MacQueen’67) :

Entrées : un ensemble de m enregistrements

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Algorithme k-Means (MacQueen’67) :

Entrées : un ensemble de m enregistrements

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Algorithme k-Means (MacQueen’67) :

Entrées : un ensemble de m enregistrements

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

Algorithme k-Means
Exemple :
8 points A, B, . . . , H de l’espace euclidien 2D. k = 2 (2 groupes)
Tire aléatoirement 2 centres : B et D choisi.
Point Centre Centre Centre
B(2,2) D(2,4) J(7/4,12/4)
D(2,4) I(27/7,17/7) K(22/4,9/4)
A(1,3) B D J
B(2,2) B D J
C(2,3) B D J
D(2,4) D D J
E(4,2) B I K
F(5,2) B I K
G(6,2) B I K
H(7,3) B I K

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

M. Ledmi Introduction à la fouille de données

Introduction
Problématique
Segmentation (Clustering)
Distance et Dissimilarité
Algorithme k-Means

M. Ledmi Introduction à la fouille de données

Vous aimerez peut-être aussi

Data Mining F
Pas encore d'évaluation
Data Mining F
37 pages
Techniques de Fouilles de Données
Pas encore d'évaluation
Techniques de Fouilles de Données
110 pages
Chapter 3 Clustering
Pas encore d'évaluation
Chapter 3 Clustering
7 pages
Cours Segmentation
Pas encore d'évaluation
Cours Segmentation
43 pages
Introduction au Data Mining et Clustering
Pas encore d'évaluation
Introduction au Data Mining et Clustering
4 pages
Cours Segmentation
Pas encore d'évaluation
Cours Segmentation
63 pages
Chap6 Clustering
Pas encore d'évaluation
Chap6 Clustering
30 pages
DataMining Chapter 5 Clustering
Pas encore d'évaluation
DataMining Chapter 5 Clustering
63 pages
Clustering 1
Pas encore d'évaluation
Clustering 1
8 pages
Cours LEDMI Makhlouf
Pas encore d'évaluation
Cours LEDMI Makhlouf
75 pages
Clustering
100% (1)
Clustering
114 pages
MID RDF 06
Pas encore d'évaluation
MID RDF 06
107 pages
Introduction à la Fouille de Données
Pas encore d'évaluation
Introduction à la Fouille de Données
12 pages
Introduction au Clustering et Méthodes
Pas encore d'évaluation
Introduction au Clustering et Méthodes
11 pages
Méthodes de segmentation en clustering
Pas encore d'évaluation
Méthodes de segmentation en clustering
18 pages
Image Mining Clustering
Pas encore d'évaluation
Image Mining Clustering
33 pages
Fouilles de Données Part1 Concepts D Base
Pas encore d'évaluation
Fouilles de Données Part1 Concepts D Base
16 pages
Clustering
Pas encore d'évaluation
Clustering
50 pages
Clustering
Pas encore d'évaluation
Clustering
32 pages
Cours Segmentation Diapos
Pas encore d'évaluation
Cours Segmentation Diapos
5 pages
CM4 M1 Isd 2023
Pas encore d'évaluation
CM4 M1 Isd 2023
51 pages
Introduction au Data Mining
Pas encore d'évaluation
Introduction au Data Mining
47 pages
Chapitre5 Clustring
Pas encore d'évaluation
Chapitre5 Clustring
59 pages
Cours 4 Clustering
Pas encore d'évaluation
Cours 4 Clustering
40 pages
4 Clustering
Pas encore d'évaluation
4 Clustering
35 pages
Chapitre II
Pas encore d'évaluation
Chapitre II
6 pages
DM Ch3
Pas encore d'évaluation
DM Ch3
35 pages
Classification Non Supervisée en IA
Pas encore d'évaluation
Classification Non Supervisée en IA
32 pages
TP 2: Les Méthodes de Structuration Et de Classification en Apprentissage Non Supervisé
Pas encore d'évaluation
TP 2: Les Méthodes de Structuration Et de Classification en Apprentissage Non Supervisé
4 pages
Cours - Fouille de Données Avancée - Abdelhamid DJEFFAL (Université de Biskra, 2015)
Pas encore d'évaluation
Cours - Fouille de Données Avancée - Abdelhamid DJEFFAL (Université de Biskra, 2015)
13 pages
CH4 1 Ti
Pas encore d'évaluation
CH4 1 Ti
17 pages
Cours Fouille de DonnÃes L2 BI 2024
Pas encore d'évaluation
Cours Fouille de DonnÃes L2 BI 2024
31 pages
Méthodologie Des Nomophob01
Pas encore d'évaluation
Méthodologie Des Nomophob01
5 pages
"K-Means : Guide pour Data Scientists"
100% (1)
"K-Means : Guide pour Data Scientists"
10 pages
Techniques de Clustering et Algorithmes
Pas encore d'évaluation
Techniques de Clustering et Algorithmes
47 pages
Cours Datamining: Techniques et Processus
100% (1)
Cours Datamining: Techniques et Processus
49 pages
FD - Chap 1 - Intro
Pas encore d'évaluation
FD - Chap 1 - Intro
31 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
43 pages
Cours1 Intro À La Fouille de Données
Pas encore d'évaluation
Cours1 Intro À La Fouille de Données
29 pages
FDD Cours PDF
Pas encore d'évaluation
FDD Cours PDF
94 pages
Clustering : Guide Essentiel et Applications
Pas encore d'évaluation
Clustering : Guide Essentiel et Applications
10 pages
Chap2 Clustering Final
Pas encore d'évaluation
Chap2 Clustering Final
50 pages
DATA MINING - Chap2. SEGMENTATION (K-Means, CAH)
Pas encore d'évaluation
DATA MINING - Chap2. SEGMENTATION (K-Means, CAH)
48 pages
Algorithmes KMEANS et SVM en ML
Pas encore d'évaluation
Algorithmes KMEANS et SVM en ML
59 pages
KNN 1
Pas encore d'évaluation
KNN 1
15 pages
Cours de Fouille de Données Avancée
Pas encore d'évaluation
Cours de Fouille de Données Avancée
96 pages
Clustering et Méthodes de Partitionnement
Pas encore d'évaluation
Clustering et Méthodes de Partitionnement
20 pages
Cours DM - Classification
Pas encore d'évaluation
Cours DM - Classification
23 pages
Algorithmes KMEANS et SVM en ML
Pas encore d'évaluation
Algorithmes KMEANS et SVM en ML
57 pages
Clustering K-MEANS : Guide Complet
Pas encore d'évaluation
Clustering K-MEANS : Guide Complet
37 pages
Azizi Cour FD
Pas encore d'évaluation
Azizi Cour FD
48 pages
Algorithmes K-Means et DBSCAN
100% (2)
Algorithmes K-Means et DBSCAN
31 pages
Introduction à Crisp-DM et Clustering
Pas encore d'évaluation
Introduction à Crisp-DM et Clustering
23 pages
Introduction au Clustering et K-Means
Pas encore d'évaluation
Introduction au Clustering et K-Means
61 pages
Chap1-Introduction Au DataMining Sahbi
Pas encore d'évaluation
Chap1-Introduction Au DataMining Sahbi
47 pages
Data Mining
Pas encore d'évaluation
Data Mining
29 pages
Cours
Pas encore d'évaluation
Cours
58 pages
Introduction Au Data Mining
Pas encore d'évaluation
Introduction Au Data Mining
102 pages
IA et Droit d'Auteur : Un Défi Juridique
Pas encore d'évaluation
IA et Droit d'Auteur : Un Défi Juridique
11 pages
Nouveau Document Microsoft Word
Pas encore d'évaluation
Nouveau Document Microsoft Word
13 pages
Intelligence Artificielle
100% (1)
Intelligence Artificielle
43 pages
Expert en Business Intelligence
Pas encore d'évaluation
Expert en Business Intelligence
4 pages
Sujet TP - Orange
Pas encore d'évaluation
Sujet TP - Orange
5 pages
Leçon 1.5 - Les Trois Piliers de La Révolution IA - MD
Pas encore d'évaluation
Leçon 1.5 - Les Trois Piliers de La Révolution IA - MD
5 pages
SVM 2
Pas encore d'évaluation
SVM 2
31 pages
Chap5 - Le Transfer Learning
Pas encore d'évaluation
Chap5 - Le Transfer Learning
16 pages
IA & ML - Chap5 - RN
Pas encore d'évaluation
IA & ML - Chap5 - RN
21 pages
Sujets PFE Innovants 2017-2018
Pas encore d'évaluation
Sujets PFE Innovants 2017-2018
8 pages
Applied Data Science and Artificial Intelligence
Pas encore d'évaluation
Applied Data Science and Artificial Intelligence
10 pages
Structure Union-Find en C et Python
Pas encore d'évaluation
Structure Union-Find en C et Python
117 pages
TD4 - MLPreparation Des Données
Pas encore d'évaluation
TD4 - MLPreparation Des Données
5 pages
Feuilletage
Pas encore d'évaluation
Feuilletage
30 pages
030489-Plan de Cours
Pas encore d'évaluation
030489-Plan de Cours
20 pages
IA et 5G : Optimisation des Réseaux Mobiles
Pas encore d'évaluation
IA et 5G : Optimisation des Réseaux Mobiles
3 pages
Rapport Sur: L'application Des Réseaux Neuronaux
Pas encore d'évaluation
Rapport Sur: L'application Des Réseaux Neuronaux
28 pages
Interprétation des Ratios Financiers
Pas encore d'évaluation
Interprétation des Ratios Financiers
9 pages
"Albert School : Leaders de Demain"
Pas encore d'évaluation
"Albert School : Leaders de Demain"
48 pages
Algorithme Random Forest
Pas encore d'évaluation
Algorithme Random Forest
32 pages
Lecture1 Intelligence Artificielle
Pas encore d'évaluation
Lecture1 Intelligence Artificielle
38 pages
Offre de Stage
Pas encore d'évaluation
Offre de Stage
3 pages
Filtrage collaboratif : méthodes et approches
Pas encore d'évaluation
Filtrage collaboratif : méthodes et approches
9 pages
Brochure Programme Grande Ecole 13 11 23
Pas encore d'évaluation
Brochure Programme Grande Ecole 13 11 23
16 pages
Guide Rsca 2021
Pas encore d'évaluation
Guide Rsca 2021
12 pages
ACP - Analyse en Composantes Principales Avec R - L'Essentiel - Articles - STHDA
Pas encore d'évaluation
ACP - Analyse en Composantes Principales Avec R - L'Essentiel - Articles - STHDA
45 pages
Introduction au Deep Learning
Pas encore d'évaluation
Introduction au Deep Learning
121 pages
Les Impacts Juridiques Et Règlementaires de L'intelligence Artificielle en Matière Bancaire, Financière Et Des Assurances
Pas encore d'évaluation
Les Impacts Juridiques Et Règlementaires de L'intelligence Artificielle en Matière Bancaire, Financière Et Des Assurances
93 pages
Optimisation des stocks de médicaments
Pas encore d'évaluation
Optimisation des stocks de médicaments
30 pages