0% ont trouvé ce document utile (0 vote)
60 vues13 pages

Indexation

Ce document traite de l'indexation d'images et des systèmes de recherche d'images par le contenu. Il définit l'indexation d'images, explique ses principes et sa classification. Il décrit également des méthodes d'indexation telles que les signatures, l'histogramme et la transformée de Hough.

Transféré par

Tommy R'tsu
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
60 vues13 pages

Indexation

Ce document traite de l'indexation d'images et des systèmes de recherche d'images par le contenu. Il définit l'indexation d'images, explique ses principes et sa classification. Il décrit également des méthodes d'indexation telles que les signatures, l'histogramme et la transformée de Hough.

Transféré par

Tommy R'tsu
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

N° d’ordre : … / STI / TCO Année Universitaire : 2021/ 2022

UNIVERSITE D’ANTANANARIVO

ECOLE SUPERIEURE POLYTECHNIQUE

D’ANTANANARIVO

MENTION TELECOMMUNICATION

Titre : Ingénieur
Domaine : Sciences de l’Ingénieur
Mention : Télécommunication
Parcours : Système et Traitement d’Information

par : RANDRIAMIARANTSOA Maminiaina Christophe Tommy

RAPPORT SUR L’INDEXATION D’IMAGE

Professeur :
Mme RAMAFIARISONA Hajasoa Malalatiana
Table des matières
CHAPITRE 1 : INDEXATION D’IMAGE .................................................................................. 1

1.1 Définition ............................................................................................................................ 1

1.2 Principes de l’indexation d’image ........................................................................................... 1

1.3 Classification d’indexation d’image........................................................................................ 1

1.3.1 Indexation sémantique ................................................................................................. 1

1.3.2 Indexation descriptive .................................................................................................. 2

1.3.3 Les phases d’indexation ............................................................................................... 2

1. 3.3.1 Indexation logique ............................................................................................... 2

[Link] Indexation physique .............................................................................................. 2

1.4 Signatures ................................................................................................................................ 2

1.4.1 Histogramme ................................................................................................................ 2

1.4.2 Information partielle ..................................................................................................... 3

1.4.3 Indexation textuelle ...................................................................................................... 3

1. 5 Transformée de Hough ........................................................................................................... 3

CHAPITRE 2 : SYSTEME DE RECHERCHE D’IMAGE PAR LE CONTENU ................... 5

2.1 Introduction ............................................................................................................................. 5

2.2 Récupération d’images par leur contenu ................................................................................. 5

2.2.1 Attribut couleur ............................................................................................................... 6

2.2.2 Attribut texture ................................................................................................................ 7

2.2.3 Etat de l’art sur les CBIR ................................................................................................ 8

2.3 Les requêtes ............................................................................................................................. 9

i
CHAPITRE 1
INDEXATION D’IMAGE
1.1 Définition
L’indexation a pour but de substituer à une image un représentant (ou descripteur) moins
encombrant qui la caractérise le mieux possible et de ne travailler que sur ce modèle lors de la
recherche. Cela permettra une meilleure organisation des données, de limiter la quantité de données
examinées durant une recherche, d’y accéder rapidement et de confiner la recherche au maximum.
1.2 Principes de l’indexation d’image
Contrairement à d’autres types de données, comme le texte, il n’est pas utile d’utiliser les images
directement dans un Systèmes de recherche d’image par contenu (CBIR : Content Based Image
Retrieval) vue la taille des images actuelles. Il faut caractériser les images par des informations à la
fois discriminantes et invariables à certains paramètres (comme la taille de l’image, l’angle de la
prise de vue, etc.). L’indexation peut être fixe : les descripteurs calculés sont toujours les mêmes.
L’indexation peut aussi être évolutive : les descripteurs s’adaptent à l’utilisateur ou au contexte dans
le temps, ce qui permet de renforcer l’adéquation système/utilisateur.
L’indexation est l’ensemble des processus aboutissant à la construction d’un index de l’image. Les
techniques dites d'indexation, se proposent d'attacher à une image ou à une vidéo un ensemble de
descripteurs de leur contenu, dans le but de mesurer la ressemblance avec les descripteurs
correspondant à la requête.
Mais cette requête peut prendre des formes très différentes, elle peut être conceptuelle (ex : mot),
symbolique (ex : schéma) ou instancielle (ex : une autre image). De la même façon, l'indexation sera
sémantique (on attache des descripteurs de niveau conceptuel au document) ou visuelle (on attache
des descripteurs de niveau visuel au document).
1.3 Classification d’indexation d’image
1.3.1 Indexation sémantique
Par nature, l'indexation manuelle est sémantique. L'opérateur d'indexation attache au document des
données de haut niveau relatif à la signification du contenu de l'objet. Les requêtes associées sont
en général des mots, désignant un objet, une action, le nom d'un personnage ou d'un événement.
L’indexation sémantique consiste à décrire une image d’après ce qu’elle représente : sa sémantique.
L’objet image est ici considéré non pas en tant que tel, mais plutôt par rapport à ce qu’il décrit, son
sens, son interprétation.
1
1.3.2 Indexation descriptive
Par opposition, l'indexation automatique est essentiellement descriptive ou visuelle.
L'algorithme d'indexation attache des données de bas niveau sémantique, relatifs aux contenus
géométrique, spectral, de l'image, à un niveau local ou global. Les requêtes associées se font en
général par l'exemple, ou par modèle.
1.3.3 Les phases d’indexation
Un système d’indexation comprend généralement deux phases de traitement :
1. 3.3.1 Indexation logique
L’indexation logique consiste à extraire et à modéliser les caractéristiques de l’image qui sont
principalement la forme, la couleur et la texture. Chacune de ces caractéristiques pouvant être
considérée pour une image entière ou pour une région de l’image.
[Link] Indexation physique
L’indexation physique consiste à déterminer une structure efficace d’accès aux données pour trouver
rapidement une information. De nombreuses techniques basées sur des arbres (arbre-B, arbre-R,
arbre quaternaire,…) ont été proposées. Pour qu’un système de recherche d’images soit performant,
il faut que l’indexation logique soit pertinente et que l’indexation physique permette un accès rapide
aux documents recherchés.
1.4 Signatures
Il existe plusieurs types de primitives pour l'indexation : le pixel, le bloc de pixel, la région, le point
d'intérêt, le contour, etc.
Deux approches de la structuration sont possibles : l'approche globale et l'approche partielle. La
première consiste en l'accumulation de l'information sur toute l'image pour la formation d'une
signature dite globale, ce qui restreint le champ des similarités aux seules similarités globales.
L'exemple le plus simple de ce type de signature est l'histogramme. L'alternative équivaut à
l'approche partielle selon laquelle l'image est caractérisée par zones. Le choix d'une signature
conditionne, en partie, l'invariance accessible lors de la recherche. Les signatures doivent donc être
choisies en fonction de l'application visée, au même titre que les caractéristiques primaires dont elles
sont issues.
1.4.1 Histogramme
A un facteur de normalisation près, l'histogramme constitue une approximation de la densité de
probabilité associée à l'image, vue comme une variable aléatoire. Cette approche statistique est

2
proche de la recherche textuelle pour laquelle les documents sont couramment caractérisés par la
fréquence d'apparition de mots-clés.
1.4.2 Information partielle
L'inconvénient majeur de l'indexation par histogramme est la perte de l'information spatiale. En
laissant pour le moment de côté les méthodes basées sur la segmentation de l'image, nous pouvons
distinguer deux grandes approches pour la prise en compte de l'information spatiale lors de
l'indexation : l'approche relative et l'approche absolue. La première vise à introduire une notion de
cohérence spatiale entre les caractéristiques primaires calculées pour chaque primitive image, il
s'agit de représenter les liens relatifs entre primitives. La seconde approche tend plutôt à coder une
information spatiale absolue : la position du pixel (indice de ligne et de colonne) dans l'image est
alors la donnée de base.
1.4.3 Indexation textuelle
Le texte est une source d'information sémantique qui peut être utilisée pour l'indexation et la
recherche des images. Les mots-clés ou les phrases peuvent provenir de l'indexation manuelle ou de
données multimédia liées _a l'image. La technique du Latent Semantic Indexing permet de
constituer le vecteur de fréquence indexant chaque image.
1. 5 Transformée de Hough
Le fonctionnement de la transformée de Hough se base sur l’utilisation d’un espace paramétrique,
appelé espace de Hough, permettant de simplifier le problème complexe de détection globale de
formes dans l’espace image. En effet, dans cet espace paramétrique, la détection est locale et donc
plus simple. Toute courbe qui peut être décrite par des paramètres est susceptible d’être détectée par
la transformée de Hough. Puisque les linéaments que l’on souhaite mettre en évidence ont une allure
rectiligne, nous nous limiterons ici à la reconnaissance de droites.
L’espace de Hough sera donc constitué de deux dimensions, soit le nombre de paramètres
nécessaires à l’expression analytique d’une droite. Les deux paramètres utilisés sont ceux
apparaissant dans l’équation normale d’une droite :
𝜌 = 𝑋 cos 𝜃 + 𝑌 sin 𝜃

3
Où ρ est la longueur et θ l’orientation du vecteur normal de la droite depuis l’origine d’un référentiel
cartésien choisi.
La méthode de la transformée de Hough utilise ces propriétés afin n de détecter des ensembles de
pixels alignés dans une image, via leur représentation dans ce nouvel espace à deux dimensions.

4
CHAPITRE 2

SYSTEME DE RECHERCHE D’IMAGE PAR LE CONTENU


2.1 Introduction
L’image est une représentation visuelle ou mentale de quelque chose, objet, être vivant ou concept.
Concrétement, une image en Vision est une représentation spatiale de l’énergie réfléchie par des
objets physiques présents dans le champ de vue du capteur (oeil pour l’Homme, caméra pour un
Robot).
Des traitements comme la transformée de Fourier permettent de représenter les pixels de l’image
selon des modèles périodiques qui sont caractérisés par leurs fréquences et leurs directions. Ces
éléments sont souvent exploités en indexation pour représenter l’objet dans des structures de
données sous forme d’arbres à titre d’exemple.
Le calcul des descripteurs d’images par apparence, nécessite de déterminer les caractéristiques utiles
dans l’image sur lesquelles les futures opérations vont être appliquées.
Comme son nom l'indique, le principe de cette méthode est d'identifier des images à partir de leur
contenu (c'est à dire à partir des données de l'image elles même et non à partir du texte associé aux
images). L'indexation des images, qui se fait automatiquement, nécessite l'extraction des paramètres
de celles-ci au préalable. Ces paramètres "quantifient" la couleur, la texture, l'intensité ou bien
encore les formes contenues dans l'image et fournissent une "signature" de l'image.
Deux aspects indissociables coexistent dans les systèmes de recherche d’images par le contenu,
l’indexation et la recherche.
2.2 Récupération d’images par leur contenu
La thématique appelée Content Based Image Retrieval (CBIR) traite du problème de sélectionner
dans une base d’images, celles qui répondent à une requête, par exemple “Sortir les images
d’environnement routier”. Les méthodes de CBIR se fondent sur l’extraction des caractéristiques
importantes des images. Ces caractéristiques peuvent être soit locales soit globales.
Dans la suite de ce mémoire, nous allons appliquer ces informations pour la localisation et la
navigation d’un robot. Mais avant, nous allons décrire notre méthode pour extraire des
caractéristiques globales à partir d’images couleur. Les images en couleur texturées sont porteuses
d’informations riches et leurs contenus peuvent les décrire entièrement. Nous rappelons qu’avant
que le concept de CBIR ne soit mis en oeuvre en 1992 par T. Kato (Wik), la recherche dans les
bases de données images utilisait des propriétés textuelles. Les techniques et les outils de CBIR sont
5
inspirés des domaines de la statistique, de la reconnaissance de formes, du traitement de signal et de
la vision par ordinateur. De plus, en CBIR , les mesures statistiques de similarité entre les
représentations sont corrélées avec la similarité subjective visuelle.
Le processus de CBIR peut être modélisé par un modèle en 4 couches, comme le montre la figure
ci-dessous. Les étapes sont : l’indexation par le contenu, l’extraction des caractéristiques, la
compilation et la recherche par requête. Les invariants peuvent être extraits en utilisant soit les
conditions extrinsèques soit les propriétés intrinsèques ce qui est plus pratique.
Pour mesurer la couleur et la texture, nous avons choisi l’approche physique. Dans cette approche,
la luminance de l’image est représentée comme une onde électromagnétique. Le processus
d’observation est une intégration de la densité de l’énergie de cette onde dans les dimensions spatio-
spectrales. Dans la théorie des espaces d’échelles, les sondes ou caractéristiques doivent avoir une
forme gaussienne pour éviter les détails extérieurs lorsque l’échelle est plus grossière. On trouve
dans la littérature plusieurs espaces d’échelle, tels que: Poisson, Bessel et Relativiste. L’espace
d’échelle gaussien est cependant linéaire et lié au processus de diffusion linéaire.
2.2.1 Attribut couleur
La luminance ou les valeurs du tri-stimuli peuvent être utilisées directement ou via quelques
transformations dans d’autres espaces de couleur pour extraire des informations sur le contenu de
l’image. La couleur peut être définie comme le résultat perceptuel de la lumière lorsqu’elle pénètre
dans la rétine. Cette lumière a une longueur d’onde comprise entre 400 et 700 nm. Concernant la
vision humaine, l’analyse de la couleur est basée sur la colorimétrie ou l’analyse du contenu spectral
du stimulus trichromatique détecté par l’oeil; c’est le système XYZ qui décrit des couleurs
conformes à ce que perçoit l’Homme. Par ailleurs, dans l’approche physique de la mesure de
couleur, la luminance de l’image est représentée par une onde electromagnétique E(x; y; σ).

6
Image : Système de récupération d’image par le contenu
2.2.2 Attribut texture
Dans une image, plusieurs régions sont caractérisées par des structures régulières comparables aux
textures qui figurent dans certains vêtements que l’on voit au quotidien. Des chercheurs ont tenté de
définir qualitativement la texture dans l’image. Par exemple Pickett considère que la texture est
utilisée pour décrire des tableaux de variations de deux dimensions((Pic70)). Les éléments et les
règles d’espacement ou d’arrangement peuvent être manipulés arbitrairement en gardant un
indicateur de répétitivité. Pour sa part, Hawkins ((Haw70)) estime que la notion de texture dépend
de trois ingrédients:
• un modèle local répété sur une large région par rapport à sa taille ;
• ce modèle consiste en un arrangement non aléatoire de parties élémentaires ;
• les parties sont des entités uniformes ayant appromativement la même dimension partout à
l’intérieur de la texture.
Aussi, la texture est souvent caractérisée par la résolution des détails perceptibles dans l’image, qui
peuvent être grossière ou fine; on peut parler de taux de grossièreté (coarseness). Par exemple, une
pièce de vêtement en laine est plus grossière qu’une pièce de soie sous les mêmes conditions de
visualisation. Le caractère plus ou moins grossier de la texture est relié à la période de répétitivité
7
spatiale de la structure locale. Une période grande implique une texture grossière alors qu’une
période plus petite implique une texture fine. Toutefois, cette mesure de grossièreté est insuffisante
pour mesurer qualitativement la texture. Elle peut orienter les mesures de sorte que l’on puisse
prendre les mesures élevées comme une référence à une texture grossière et vice versa.
En outre, la texture est une propriété de voisinage. Sa mesure est donc étroitement liée au voisinage
d’observation.
Enfin, la texture artificielle consiste en un arrangement de symboles voire des segments de ligne,
des points, des étoiles ou autres, placés sur un arrière-plan neutre.
2.2.3 Etat de l’art sur les CBIR
Dans ((HHSH93)), l’image est segmentée en 8 regions de couleurs homogènes et réduites à 24*24
pixels. Ces pixels sont directement utilisés dans l’appariemment. Pour faire le matching,
premièrement une correspondance entre les régions dans la requête et la cible est trouvée. Les
régions similaires dans l’autre image sont fusionnées. La similarité de la forme entre deux régions
est basée sur le nombre de pixels qui sont superposés. La similarité de couleur entre deux régions
est la distance dans l’espace HLS (Hue, Luminosité, Saturation) entre les régions à comparer.
Dans l’approche proposée dans ((CO96)), les couleurs de chaque image sont quantifiées en 13 bins
de couleurs. Six valeurs sont associées à chaque bin de couleur Une autre méthode ((CO96)) consiste
à utiliser les attributs couleur et texture, la position et la forme des régions (blobs) et l’arrière-plan.
La couleur est représentée par 218 bins des coordonnées de couleur dans l’espace L*ab. La texture
est représentée par le contraste et l’anisotropie dans les régions. La forme est représentée par la
surface (excentricité et orientation).
Pour apparier, on utilise une décomposition en couleur singulière (SVD) pour projeter le vecteur
d’histogramme en un sous espace de dimension inférieure. Les points résultants sont indexés par un
R tree.
Le système ((OM95)) utilise une base de données de description de texte et d’autres éléments
textuels comme la date et la position de la photo. Pour chaque image un histogramme de la couleur
contenant seulement 20 bins est calculé.
Par ailleurs, dans ((BM00)), les caractéristiques utilisées sont les histogrammes sur la teinte et sur
la luminance.
L’appariement consiste à calculer la distance entre deux histogrammes de caractéristiques avec une
distance L1, L2 ou Minkovsky. La distance entre deux images est la somme pondérée des distances
entre les caractéristiques.

8
2.3 Les requêtes
Il existe 3 façons de faire une requête dans un système d’indexation et recherche des images :
❖ requête par « mots clés »
❖ requête par « esquisse »
❖ requête par « exemple »

Figure 2.02 : Exemple de requêtes

9
FICHE DE RENSEIGNEMENT

Nom : RANDRIAMIARANTSOA
Prénoms : Maminiaina Christophe Tommy
Adresse : LOT II X 152 TER Anosibe Ouest I

Antananarivo 101 Madagascar

Téléphone : 034 20 776 25 / 033 85 776 25


E-mail :tommyrtsoa@[Link]

Titre du rapport : RAPPORT SUR L’INDEXATION D’IMAGE

Professeur : Mme RAMAFIARISONA Hajasoa Malalatiana

10

Vous aimerez peut-être aussi