Cours5 Iri Images

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

56 vues37 pages

Cours5 Iri Images

Transféré par

lobnabakir123

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Indexation d’images

Plan du cours

 Généralités
 Méthodes
 Indexation textuelle
 Indexation par le contenu
Quelques chiffres :

 INA : 500 000 h video + 600 000 h audio + 2 000 000 de

photos
 82 Milliards de photos par an dans le monde
 390 Millions d’images indexées par Google
 4250 films commerciaux par an (UNESCO)
Motivations :

 Conservation d’un patrimoine (culturel, scientifique,…)

 Valorisation en facilitant l’accès et l’exploration
 Exploitation commerciale (photos numériques, TV
numérique, …)
Généralités : quelles images ?

 biomédical, satellitaires, photos, 2D ou 3D,…

 3 catégories générales
 Images d’art (auteur, titre,…)
 Images documentaires (reliées à un texte)
 Images ordinaires
 Centres d’intérêts actuels :
 Audio-vidéo, multimédia, 3D
les acteurs

 Acteurs industriels :
 QBIC (IBM),Virage, Netra
 NewPhenix (CEA)
 Acteurs académiques
 VisualSeek (Columbia), …
 IMEDIA (INRIA, Rocquencourt), RETIN (ETIS,Cergy),
KIWI (Insa, Lyon), DIVAN (INA)…
définition
 Objectif de l’indexation : faciliter l’accès à des bases de
données en extrayant une information synthétique.
 Fouille de données (Data Mining), Extraction de connaissances,
Vision artificielle
Généralité
 Catalogue :
 Exploitation de données globales sur le document visuel,
indépendantes du contenu
 Classification :
 Exploitation d’une caractéristique globale du document visuel
 Indexation
 Exploitation d’une analyse fine du contenu du document visuel
Introduction

 1980 : Annotation textuelle des images

 1990 : Indexation par la couleur, la forme et la texture
 1993 : Requête en utilisant la similarité des images
 1997 : Requête par images exemplaires et mesure de la
pertinence (relevance feedback)
 2000 : apprentissage sémantique et adaptation à
l’utilisateur
 Enjeux actuels : annotation interactive, formalisation de la
connaissance (ontologies), grosses bases de données
(problèmes de stockage, de vitesse d’accès,…), données
hétérogènes, …
Indexation d’images à partir du texte
Indexation d’images à partir du texte
ROME (AFP), 2005-06-11
[Link]

L'Italienne Clementina
Cantoni arrive vendredi 10
juin sur le sol italien après
25 jours de détention en
Afghanistan
Indexation d’images à partir du texte
 Une image illustre un document mais le document ne
décrit pas forcément l’image ;
 Le texte accompagnateur d’une image ne suffit généralement
pas
 La richesse du contenu d’une image dépend du domaine
de connaissances de celui qui la regarde ;
 Nécessité de modéliser ce domaine
 Aspects subjectifs du contenu
 Plus facile de faire une description des objets contenus dans
l’image que des émotions qui en résultent
Indexation d’images à partir du texte
 Avantages :
 exploite les outils d’indexation textuelle, prise en compte plus
aisée des aspects sémantiques.
 Inconvénients :
 vocabulaire limité
 difficultés de l’annotation : définition du vocabulaire, temps
d’annotation >> temps réel, subjectivité, etc.
Indexation d’images à partir du texte
Ontologies
 Nécessité de définir un langage de description
 Limité par le contexte de production
 Limite l’utilisation
 Définition d’ontologies : modélisation du contexte
(objets/concepts et relations entre eux) de façon à lever
toute ambiguïté d’interprétation
« Le problème fondamental est de respecter la diversité des
langages et des représentations du monde, tout en permettant
l'échange d'information.[…]. Identifier, modéliser les concepts
d'un domaine, pertinents pour une des applications, Se mettre
d'accord, au sein d'une communauté, sur les termes employés
pour se référer à ces concepts. »
Taxonomie / Nomenclature
Indexation par le contenu
 Initialement les objets multimédia étaient traités comme
un seul item.
 Recherche sur mot clé introduit manuellement dans le
système.
 Utilisation de relations entre objets.
 Il est très difficile d’expliciter tous les aspects des
données qui sont important pour les utilisateurs.
 Une annotation textuelle est toujours restrictive même si elle prend
en compte en même temps des informations syntaxiques et
symboliques.
 L’approche la plus répandue reste quand même l’annotation
textuelle et manuelle.
 Avantage :
 recherche indépendante du type de média.
 Indexation textuelle classique.
 Inconvénients :
 Coût très important.
 Difficile de trouver un langage commun pour décrire les choses. Exemple
: clair, lumineux (les thésaurus ne résolvent pas tout).
 Une même personne peut décrire le même concept différemment en
fonction de la situation.
 Le non verbal ne peut être exprimé sans ambigüité.
Indexation par le contenu : principe (1/2)
Principe (2/2)
 Off-line : production d’indexes issus de l’analyse du
contenu des images
 Extraction de caractéristiques pertinentes
 Réduction de la dimensionnalité
 Organisation par classification
 On-line : gestion des requêtes d’un utilisateur
 « Gap sémantique »
 Relevance feedback
Extraction de caractéristiques (1/2)
 Caractéristiques :
 Spécifiques : points saillants, minuties,…
 Générales : couleur, texture, forme
 Globale ou locale :
 Blocs arbitraires, segmentation, information topologique
Extraction de caractéristiques
 Problème de représentation
 Caractéristiques numériques, symboliques, graphes,…
 Invariances
 Translation, rotation, homothétie,
 non-linéaires ?
Caractéristiques et notion de similarité
Images similaires ?
 Deux images seront comparées par l’intermédiaire des
caractéristiques extraites
 Sim( Im1, Im2 ) = Sim( f(Im1), f(Im2) ), avec f la fonction
d’extraction des caractéristiques
 Mesures de similarités, distances
 (A) s( x, x ) = s( y, y ) > s( x, y )
 (B) s( x, y ) = s( y, x )
 (C) d( x, x) = 0
 (D) d(x,y) = 0 => x = y
 (E) d(x, y) <= d(x,z) + d(z,y)
 (F) d(x,y) <= max( d(x,z), d(z,y) )
 Distance euclidienne
 Distance euclidienne généralisée
 Malahanobis
 Chi2
 Similarité en cosinus
 Combinaisons linéaires de similarités (ou distances)
Réduction d’information
 Réduction de la dimensionnalité
 ACP
 Algorithmes de sélection
 Quantification (forme de clusterisation)
 Sélection = Mettre des poids sur chaque caractéristiques
Automatiquement :
 Supervisé, non supervisé
 Supervisé, wrapper : SVM-RFE, Fisher,…
 Non supervisé, filter : clusterisation des caractéristiques
 Comparaison des caractéristiques après une
transformation F
 « Notion du noyau »
 K(x,y) = < F (x), F (y)>, K semi-defini positif
 D(x,y) = <x,x> + <y,y> -2<x,y> devient
 D(F(x), F(y) ) = K(x,x) + K(y,y) -2K(x,y)
 Intérêt : la spécification de K définit implicitement F
 Intensivement utilisé pour ACP, la discrimination de Fisher,
la classification SVM,…
Requêtes

 Grande diversité
 Les systèmes imposent des types de requête :
 Recherche d’une image dans une base
 Recherche d’images similaires à une image exemplaire
 Recherche d’images similaires à des images exemples et
dissimilaires à d’autres
 Recherche d’images contenant une région de l’image
exemplaire
 …
Feedback utilisateur
 Défaut majeur des systèmes standards : l’utilisateur doit
s’adapter au système
 Caractéristiques extraites automatiquement non intuitive
 Fossé entre la formulation des requêtes et le codage de
l’information
 Nécessité d’adapter le système à l’utilisateur
 Apprentissage : requêtes, mesures de similarités
Feedback utilisateur
Evaluation
 Exploitation du rang de récupération
 Critère de validation de MPEG7
 Rank*(k) = rang(k) si < K(q), 1.25K sinon
 AVR(q) : moyenne des rangs
 MRR(q) = AVR(q) – 0.5( 1 + NG(q) )
 NMRR(q) = MRR(q) / ( 1.25K – 0.5(1+NG(q)) )
 Critère final : moyenne des NMRR
 Notations : q = 1 requête ; k = une image pertinente pour
la requête ; NG(q) nombre d’images pertinentes pour la
requête ; K limite de rang acceptable
 MPEG : Motion Picture Expert group
 MPEG7 : A Multimedia Content Description Interface,
 normalisé en 2001
 Standard de description du contenu de données
multimédia + interprétation du sens de l’information
 S’appuie sur XML (langage à balises)
 Un éditeur gratuit d’IBM (pour indexer des videos)
[Link]/tech/videoannex
Conclusion

 Indexation des images : problème non résolu

 Experts issus de domaines variés (informatique,
traitement de l’image, psycho visuel, apprentissage
machine, …)
 Deux axes à étudier simultanément :
 Techniques d’analyse d’image donc d’extraction et de
comparaison de l’information
 Pertinence de l’information pour un utilisateur
 Produits commerciaux encore basiques …

Vous aimerez peut-être aussi

Indexation visuo-textuelle des images
Pas encore d'évaluation
Indexation visuo-textuelle des images
7 pages
Rapport sur l'Indexation d'Image
Pas encore d'évaluation
Rapport sur l'Indexation d'Image
13 pages
Indexation de documents Audio-Vidéo
Pas encore d'évaluation
Indexation de documents Audio-Vidéo
21 pages
Indexation de contenu audio-vidéo
Pas encore d'évaluation
Indexation de contenu audio-vidéo
21 pages
Indexation Visuelle en Informatique
Pas encore d'évaluation
Indexation Visuelle en Informatique
206 pages
RSX205 BDM1
Pas encore d'évaluation
RSX205 BDM1
29 pages
Vision par ordinateur et apprentissage
Pas encore d'évaluation
Vision par ordinateur et apprentissage
55 pages
Recherche visuelle dans les documents multimédias
Pas encore d'évaluation
Recherche visuelle dans les documents multimédias
19 pages
2 Indexation Et Recherche D'images
Pas encore d'évaluation
2 Indexation Et Recherche D'images
6 pages
Introduction aux bases de données multimédias
Pas encore d'évaluation
Introduction aux bases de données multimédias
12 pages
Chapitre 2 (2) Indexation
Pas encore d'évaluation
Chapitre 2 (2) Indexation
29 pages
Recherche d'Images par Contenu Visuel
Pas encore d'évaluation
Recherche d'Images par Contenu Visuel
85 pages
Indexation d'Images par Contenu Sémantique
Pas encore d'évaluation
Indexation d'Images par Contenu Sémantique
114 pages
Indexationimage 130508052913 Phpapp01
Pas encore d'évaluation
Indexationimage 130508052913 Phpapp01
30 pages
Modèles de recherche multimédia
Pas encore d'évaluation
Modèles de recherche multimédia
37 pages
Recherche d'Images par Contenu (CBIR)
Pas encore d'évaluation
Recherche d'Images par Contenu (CBIR)
20 pages
LSI2 Techniques Indexation Recherche Multimédia 1
100% (2)
LSI2 Techniques Indexation Recherche Multimédia 1
12 pages
Chapitre - 1 - Techniques D'indexation Et Recherche Multimedia
Pas encore d'évaluation
Chapitre - 1 - Techniques D'indexation Et Recherche Multimedia
40 pages
Bedouhene Saïda - Auto.2011
Pas encore d'évaluation
Bedouhene Saïda - Auto.2011
87 pages
Cours sur le Traitement d'Images Numériques
Pas encore d'évaluation
Cours sur le Traitement d'Images Numériques
65 pages
Introduction au Traitement d'Images
Pas encore d'évaluation
Introduction au Traitement d'Images
65 pages
Extraction sémantique d'images numériques
Pas encore d'évaluation
Extraction sémantique d'images numériques
12 pages
Indexation et Recherche d'Images
Pas encore d'évaluation
Indexation et Recherche d'Images
16 pages
Outils de base en traitement d'images
Pas encore d'évaluation
Outils de base en traitement d'images
14 pages
Introduction au traitement d'images numériques
Pas encore d'évaluation
Introduction au traitement d'images numériques
11 pages
6-Vision Par Ordinateur
Pas encore d'évaluation
6-Vision Par Ordinateur
32 pages
Représentation D'images Et Apprentissage (Profond) (PDFDrive)
Pas encore d'évaluation
Représentation D'images Et Apprentissage (Profond) (PDFDrive)
70 pages
Introduction au Text et Web Mining
Pas encore d'évaluation
Introduction au Text et Web Mining
8 pages
Master2-Info-reconnaissance de Caracteres
Pas encore d'évaluation
Master2-Info-reconnaissance de Caracteres
88 pages
VSST10 Laborie Codreanu Sedes
Pas encore d'évaluation
VSST10 Laborie Codreanu Sedes
18 pages
Cours Chap3 2pp
Pas encore d'évaluation
Cours Chap3 2pp
23 pages
Indexation et Segmentation des Vidéos
Pas encore d'évaluation
Indexation et Segmentation des Vidéos
22 pages
Optimiser l'Indexation Documentaire
Pas encore d'évaluation
Optimiser l'Indexation Documentaire
13 pages
Introduction au traitement d'images numériques
Pas encore d'évaluation
Introduction au traitement d'images numériques
40 pages
Traitement Numérique d'Images et Vidéo
Pas encore d'évaluation
Traitement Numérique d'Images et Vidéo
62 pages
Introduction au Traitement d'Images et Infographie
Pas encore d'évaluation
Introduction au Traitement d'Images et Infographie
61 pages
Indexation sémantique pour services web
Pas encore d'évaluation
Indexation sémantique pour services web
74 pages
Diapos TI
Pas encore d'évaluation
Diapos TI
15 pages
1 Introduction
Pas encore d'évaluation
1 Introduction
80 pages
Chapitre - 1 Techniques Dindexation Et Recherche Multimedia 2 1
Pas encore d'évaluation
Chapitre - 1 Techniques Dindexation Et Recherche Multimedia 2 1
40 pages
Cours Chap1 2pp
Pas encore d'évaluation
Cours Chap1 2pp
16 pages
Chapitre1 VF
100% (1)
Chapitre1 VF
44 pages
Chapitre 02 Operation Sur Les Images
Pas encore d'évaluation
Chapitre 02 Operation Sur Les Images
52 pages
Introduction au traitement d'images numériques
Pas encore d'évaluation
Introduction au traitement d'images numériques
23 pages
Cours Technique D'indexation Et Recherche Multimedia
100% (3)
Cours Technique D'indexation Et Recherche Multimedia
148 pages
Cours Chap2 2pp
Pas encore d'évaluation
Cours Chap2 2pp
23 pages
Introduction à la vision par ordinateur
Pas encore d'évaluation
Introduction à la vision par ordinateur
76 pages
Lecture 1 Inroduction
Pas encore d'évaluation
Lecture 1 Inroduction
66 pages
Cours Chap5 2pp
Pas encore d'évaluation
Cours Chap5 2pp
10 pages
Intro PDF
Pas encore d'évaluation
Intro PDF
39 pages
Techniques d'indexation multimédia
Pas encore d'évaluation
Techniques d'indexation multimédia
33 pages
Exam 2016
Pas encore d'évaluation
Exam 2016
4 pages
Traitement d'Image et Vision Artificielle
Pas encore d'évaluation
Traitement d'Image et Vision Artificielle
51 pages
Indexation et Archivage Multimédia
Pas encore d'évaluation
Indexation et Archivage Multimédia
12 pages
Chapitre 4 SEBAA BD Multimedia
Pas encore d'évaluation
Chapitre 4 SEBAA BD Multimedia
52 pages
Introduction à la Reconnaissance d'Images
Pas encore d'évaluation
Introduction à la Reconnaissance d'Images
244 pages
Introduction au Traitement d'Images
Pas encore d'évaluation
Introduction au Traitement d'Images
52 pages
Approche Objet Et Pyramidale Dans La Classification Non Supervisee Des Images de Teledetection
Pas encore d'évaluation
Approche Objet Et Pyramidale Dans La Classification Non Supervisee Des Images de Teledetection
15 pages
Cours: Traitement d'Images et Couleurs
Pas encore d'évaluation
Cours: Traitement d'Images et Couleurs
37 pages
TP05 Tech&Prog LI2
Pas encore d'évaluation
TP05 Tech&Prog LI2
2 pages
Exam C
Pas encore d'évaluation
Exam C
20 pages
TP3-Intents: Objectif
Pas encore d'évaluation
TP3-Intents: Objectif
4 pages
QCM sur le Test Logiciel ISTQB
100% (2)
QCM sur le Test Logiciel ISTQB
12 pages
Dénombrement des ensembles finis et combinaisons
Pas encore d'évaluation
Dénombrement des ensembles finis et combinaisons
7 pages
Préparation ISTQB : Cours de Test Logiciel
Pas encore d'évaluation
Préparation ISTQB : Cours de Test Logiciel
79 pages
Guide Scrum pour Débutants
Pas encore d'évaluation
Guide Scrum pour Débutants
7 pages
Cours IA: Modélisation et Résolution
Pas encore d'évaluation
Cours IA: Modélisation et Résolution
6 pages
Ouils de Diagnostic Stratégique
Pas encore d'évaluation
Ouils de Diagnostic Stratégique
27 pages
QCM Devops
100% (3)
QCM Devops
6 pages
TP1 Partie 2 - Tableau Kanban
Pas encore d'évaluation
TP1 Partie 2 - Tableau Kanban
1 page
1.architecture Microservices VF
Pas encore d'évaluation
1.architecture Microservices VF
39 pages
Introduction au Big Data et Gestion des Données
Pas encore d'évaluation
Introduction au Big Data et Gestion des Données
17 pages
Introduction à XML et ses Avantages
Pas encore d'évaluation
Introduction à XML et ses Avantages
30 pages
Leçon 1
Pas encore d'évaluation
Leçon 1
3 pages
Balises HTML5 essentielles pour STI2D
Pas encore d'évaluation
Balises HTML5 essentielles pour STI2D
3 pages
Cloud Computing: Filière ISIC
Pas encore d'évaluation
Cloud Computing: Filière ISIC
32 pages
Ir 1011602
Pas encore d'évaluation
Ir 1011602
14 pages
Introduction à l'Informatique Décisionnelle
Pas encore d'évaluation
Introduction à l'Informatique Décisionnelle
143 pages
Pa6 Hamour Ramy
Pas encore d'évaluation
Pa6 Hamour Ramy
6 pages
Référentiels partagés en urbanisation SI
Pas encore d'évaluation
Référentiels partagés en urbanisation SI
22 pages
Corrigés TD Algorithmique : Fonctions et Procédures
Pas encore d'évaluation
Corrigés TD Algorithmique : Fonctions et Procédures
3 pages
Organigramme Du Département Informatique
Pas encore d'évaluation
Organigramme Du Département Informatique
1 page
Liste Des Extensions de Fichiers Importantes en Informatique
Pas encore d'évaluation
Liste Des Extensions de Fichiers Importantes en Informatique
3 pages
EIDIA : Ingénierie Digitale et IA
Pas encore d'évaluation
EIDIA : Ingénierie Digitale et IA
2 pages
Correction TD 7 : Patrons de conception
Pas encore d'évaluation
Correction TD 7 : Patrons de conception
4 pages
Cours JAVA EE IID Chapitre 1 Introduction
Pas encore d'évaluation
Cours JAVA EE IID Chapitre 1 Introduction
84 pages
Introduction au Langage Assembleur
Pas encore d'évaluation
Introduction au Langage Assembleur
39 pages
Manuel Informatique 5e CG
Pas encore d'évaluation
Manuel Informatique 5e CG
6 pages
NF EN 1089-3 - Bouteilles À Gaz Transportables, Identification de La Bouteille À Gaz Partie 3 - Code Couleur
Pas encore d'évaluation
NF EN 1089-3 - Bouteilles À Gaz Transportables, Identification de La Bouteille À Gaz Partie 3 - Code Couleur
12 pages
Intelligence Artificielle - Wikipédia
Pas encore d'évaluation
Intelligence Artificielle - Wikipédia
86 pages
Modélisation Des Bases de Données
Pas encore d'évaluation
Modélisation Des Bases de Données
40 pages
Azure
Pas encore d'évaluation
Azure
5 pages
QCMcrypto
Pas encore d'évaluation
QCMcrypto
3 pages
Examen Final Revue Du Système de Gestion de Bases de Données PDF
Pas encore d'évaluation
Examen Final Revue Du Système de Gestion de Bases de Données PDF
26 pages
Base de Données-1-8
Pas encore d'évaluation
Base de Données-1-8
8 pages
Technicien Supérieur Informatique de Gestion
Pas encore d'évaluation
Technicien Supérieur Informatique de Gestion
20 pages
DA CNSS Gestion Reclamation V0.4 CommentairesM - hallOUM
Pas encore d'évaluation
DA CNSS Gestion Reclamation V0.4 CommentairesM - hallOUM
20 pages
Mémoire de Licence - HOUNSONLON Justin
Pas encore d'évaluation
Mémoire de Licence - HOUNSONLON Justin
44 pages
Série td-1-1
Pas encore d'évaluation
Série td-1-1
3 pages
Infrastructure Technologique des SI
Pas encore d'évaluation
Infrastructure Technologique des SI
71 pages