ECOLE SUPERIEURE MULTINATIONALE DES TELECOMMUNICATIONS
MASTER 2 RESEAUX ET MULTIMEDIA
Cours de Traitement d’image
Chap. 3 : Segmentation d’image par approche régions
Dr Seynabou TOURE LY
Segmenter une image?
La segmentation peut être définie comme une partition d'une image
I en une ou plusieurs régions R1, ...,Rn telles que :
I = ⋃'$%& R $
Ri ∩ Rj = ∅ p o u r to ut i ≠ j
Le partitionnement de l’image produit des zones homogènes selon
un critère déterminé: couleur, texture, niveau de gris, indice,…
Il existent différentes méthodes de segmentation:
§ Seuillage
§ Classification
§ Region growing
§ LPE
§ Split and Merge
§ Etc.
Seuillage: technique de segmentation simple et rapide
But: isoler les pixels dont les valeurs sont comprises entre deux bornes
fixes
=> Créer une image binaire à partir de l’image d’origine:
• Isoler une partie de l’image (masquage)
• Effectuer des transformations morphologiques
Types de seuillage
§ Global
§ Local
§ Adaptatif
Seuillage global: une seule valeur de seuil pour toute l’image.
Utiliser l’histogramme pour déterminer la valeur du seuil
Segmentation en 2 régions:
L0
L1
• région 1 , I(x,y) < seuil
• région 2 , I(x,y) ³ seuil
h(x)
L0 Seuil L1 x
Seuil = 120
région 1 blanc, I(x,y) <seuil
région 2 noir, (x,y) ³ seuil
255
0
120
Un seuillage global est en général facile à implémenter, mais il donne
des résultats un peu grossiers.
Le seuillage globale par histogramme n’est satisfaisant que pour des
images clairement bimodales, avec un fond et un objet bien
différenciés.
Pour les images bruitées, il n’est pas facile de détecter le seuil. Un
filtrage permet de réduire le bruit, mais ne permet pas toujours de
trouver un seuil.
Multi-seuillage (histogramme multimodal) ou seuillage par hystérésis
Utilisation de deux seuils (Image à 3 vallées ): T1 et T2
Binarisation de l’image:
§ 0 si I(x,y)<T1
§ 1 si T1<=I(x,y)<=T2
§ 0 si I(x,y)>T2.
Histogramme avec deux modes complètement séparés:
=>Le choix du seuil peut se faire sur une plage de valeurs
Histogramme avec deux modes pas séparés:
=>On essaye tous les seuils jusqu'à trouver le meilleur
=>Algorithme de seuillage optimal de Otsu
Objectif: minimiser la variance interclasse = maximiser la variance
intra-classe
La méthode d’Otsu n’est applicable que lorsque l’image est bimodale.
A partir de cette méthode, nous arrivons à créer les deux grandes
régions de l’image.
Cependant, il existe de petites régions isolées qui peuvent être
corrigées par des opérations de morphologie mathématique
Dans le cas d’un seuillage local, les seuils ne dépendent que d'une
mesure locale calculée sur une fenêtre et intégrée sur toute l'image.
Pour réaliser cette mesure locale, les techniques utilisent une fenêtre
d’étude centrée sur le pixel à étudier.
Seuillage adaptatif : la valeur du seuil varie avec un critère c(x,y)
calculé dans le voisinage du pixel en question
Classification
La segmentation peut être vue comme un problème de classification :
Les régions sont étiquetées
Comment trouver l’étiquette d’un pixel ?
Différentes techniques :
Non supervisée (sans apprentissage) : k-means
Supervisée (avec apprentissage) : réseau de neurones
Application : segmentation multimodale
Clustering (k-means)
K = nombre de régions (cluster) à trouver
Principe de base
Il organise les données d'une image en K classes. Une classe est
représentée par son centre de gravité (μK).
L’algorithme renvoie une partition des données, dans laquelle les
objets à l'intérieur de chaque cluster sont aussi proches que possible
les uns des autres et aussi loin que possible des objets des autres
clusters.
L’algorithme k-means est en 4 étapes :
• Etape1: Choisir k objets formant ainsi k clusters
• Etape 2: (Re)affecter chaque objet O au cluster Ci de centre Mi tel
que la distance OMi est minimal
• Etape 3: Recalculer Mi de chaque cluster (le barycentre)
• Etape 4: Aller à l’étape 2 si on vient de faire une affectation
Classification par réseaux de neurones
Dans les applications de classification et de segmentation d’image, les
performances des réseaux de neurones artificiels ne sont plus à
démontrer.
L’utilisation de ces réseaux nécessite cependant l’extraction d’attributs
(features) de chaque image du jeu de données, puisqu’ils ne
prennent en entrée qu’un vecteur d’attributs.
Les attributs peuvent être liés à la couleur, à la texture, etc.
Le taux de classification dépend donc, en partie, de la qualité des
attributs préalablement trouvés.
En utilisant une méthode d’extraction d’attributs plus adaptée au jeu
de données ou en utilisant un meilleur classifieur, on parvient ainsi à
améliorer le résultat.
Croissance de région (Region Growing)
Ø Méthode par amorce
Définition d’un critère d’homogénéité : couleur, texture
• On part d’un point amorce (seed)
• on étend la région en ajoutant les pixels de la périphérie qui
satisfont le critère d’homogénéité
amorce croissance région finale
Ø Méthode par amorce
Le point amorce peut être choisi de façon:
• Manuelle
• Automatique, en évitant les zones de fort contraste
Ø Méthode linéaire
Elle s’applique lorsque le critère d’homogénéité est local
=>comparaison de la valeur du pixel candidat et du pixel de la
frontière
• Performance très dépendante de l’initialisation (germes)
• Dépend souvent de l’ordre de traitement : L’ordre dans lequel
sont ajoutés les pixels dans une région a une influence sur le
résultat
• Implémentation relativement simple
• Méthodes rapides
Split & Merge
Plutôt que de regrouper des pixels comme le « region growing » la
«décomposition fusion» regroupe des zones homogènes pré-
calculées sur l’image.
SPLIT: Créer les zones homogènes
MERGE: les regrouper
SPLIT:
L’image est stockée dans un arbre.
Initialement, arbre racine = image complète
Récursivement, chaque feuille F est subdivisée en quatre si elle n’est
pas assez homogène, et les quatre sous images sont ajoutée en tant
que feuilles de F.
L’algorithme poursuit tant qu’il reste des feuilles non homogènes à
diviser.
=> Quad-Tree: arbre quaternaire (arbre Q), structure de
données de type arbre dans laquelle chaque nœud a quatre fils.
Homogénéité = critère sur la variance
Image initiale
Split 1
Split 2
Split 3
•La géométrie du découpage a une influence directe sur le résultat de
la segmentation
•La méthode quad-tree fait apparaitre des régions carrées
•Il existe d’autres types de partage (triangle, pyramide)
•Le choix du type de partage se fait en fonction des formes que l’on
souhaite segmenter
Connecte les régions adjacentes
Arrêt = mesures de différence d’homogénéité́
Morphologie mathématique
Définition de la morphologie mathématique
La morphologie mathématique est une théorie de traitement non
linéaire apparue dans les années 60.
Contrairement au traitement linéaire, la morphologie mathématique
ne s’appuie pas sur le traitement du signal, mais repose sur la
théorie des ensembles.
Idée de base de la morphologie mathématique : comparer
l’ensemble à analyser avec un ensemble de géométrie connue
appelée l’élément structurant.
Elément structurant
Un élément structurant est un ensemble qui a les caractéristiques
suivantes :
• il possède une forme (géométrie connue),
• cette forme a une taille,
• cet élément est repéré par son origine appartenant à l’élément
structurant.
Elément structurant
Types de transformations
Une transformation en tout ou rien d’un ensemble A par un élément
structurant B est définie en déplaçant sur l’ensemble des points .
Pour chaque position, on pose une question relative à l’union,
l’intersection ou l’inclusion de B avec X . Chaque réponse positive
fournit un nouvel ensemble qui donne l’image transformée.
Les transformations en tout ou rien les plus simples sont :
L’érosion qui est une transformation, en tout ou rien, relative à
l’inclusion.
La dilatation qui est relative à un test d’intersection.
Il existe des transformations en tout ou rien plus complexes utilisant
des éléments structurants bi-colorés.
Operations logiques
Les principales opérations logiques sont AND, OR, NOT (ET, OU,
NON)
Opérations faites pixel par pixel, entre les pixels correspondants de
deux ou plusieurs images
D’autres opérations logiques :
XOR (ou exclusif) : les pixels appartenant à une région ou l’autre mais
pas aux deux
NOT-AND : les pixels qui n’appartiennent pas à une région et
appartiennent à l’autre
Erosion
Soient A et B deux ensembles
L’érosion de A par B est l’ensemble des points z tels que B, translate de
z, est inclus dans A.
L’élément structurant B, repéré par son centre, est déplacé pour
occuper successivement toutes les positions de l’espace.
Pour chaque position, on pose la question : B est-il complètement inclus
dans A?
=>les réponses positives forment l’ensemble érodée
L’ érosion est l’opération duale de la dilatation
L’érosion peut être considérée comme un “rétrécissement” de l’image
d’origine : l’ensemble érodé est contenu dans l’ensemble d’origine
=>operateur anti-extensif
Dilatation
Soient A et B deux ensembles
La dilatation de A par B est l’ensemble des déplacements z de telle
sorte que B et A se recouvrent d’au moins un élément.
L’élément structurant B, repéré par son centre, est déplacé pour
occuper successivement toutes les positions de l’espace.
Pour chaque position, on pose la question : B intersecte-t-il A?
=>les réponses positives forment l’ensemble dilatée.
La dilatation d’un ensemble A par un élément structurant donne comme
résultat un ensemble qui nécessairement contient A
=> operateur extensif
Ouverture/ Fermeture
Ouverture = érosion suivie par une dilatation avec le même élément
structurant
Fermeture = dilatation suivie par une érosion avec le même élément
structurant