0% ont trouvé ce document utile (0 vote)
22 vues45 pages

IntroductionRF Avr

Transféré par

Kerolle Sonfack
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Thèmes abordés

  • reconnaissance de visages,
  • systèmes à base de connaissanc…,
  • apprentissage automatique,
  • descripteurs de Fourier,
  • reconnaissance faciale,
  • modélisation,
  • traitement de la parole,
  • tests d'hypothèses,
  • deep learning,
  • classification en SPAM
0% ont trouvé ce document utile (0 vote)
22 vues45 pages

IntroductionRF Avr

Transféré par

Kerolle Sonfack
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Thèmes abordés

  • reconnaissance de visages,
  • systèmes à base de connaissanc…,
  • apprentissage automatique,
  • descripteurs de Fourier,
  • reconnaissance faciale,
  • modélisation,
  • traitement de la parole,
  • tests d'hypothèses,
  • deep learning,
  • classification en SPAM

Modélisation et Reconnaissance des formes

Introduction

Marie-Odile Berger
http://members.loria.fr/moberger

September 18, 2018

M.-O. Berger Intro MRF September 18, 2018 1 / 45


Objectifs du cours

I cadre général: la reconnaissance et l’identification des formes


I forme= image nuage de points, signal de parole, des capteurs...
I Quelque problèmes:
I reconnaitre la présence d’un objet/des objets dans une image (mais pas
seulement)
I localiser ces objets dans l’image
I connaitre précisément sa position géométrique (ex: robotique, conduite
automatisée...)
I tenir compte de l’incertain sur l’identificaton pour effectuer une action

But
modéliser des formes, les reconnaitre, les localiser...
en tenant compte de l’incertain, des connaissances a priori, des données
(exemples) disponibles

M.-O. Berger Intro MRF September 18, 2018 2 / 45


Concepts de base de la RF

Objectif: Doter les machines des capacités de l’homme à reconnaı̂tre des


caractères, des objets, des sons, des signes des signaux temporels...
Deux grands objets d’étude:
I Étudier de quelle manière l’être humain effectue cette reconnaissance
(touche à des domaines comme psychologie, physiologie, biologie)
I Viser le développement de théories et de techniques permettant
d’effectuer certaines tâches de reconnaissance (domaines:
informatique, statistique, mathématiques)

M.-O. Berger Intro MRF September 18, 2018 3 / 45


Qu’est ce qu’une forme?

I Exemples de formes: empreintes digitales, écriture manuscrite,


visages, parole, images, des objets temporels...
I La RF consiste à étudier comment les machines peuvent
I apprendre à extraire des structures d’intérêt,
I prendre des décisions en observant un environnement
I reconnaı̂tre, décrire ou classifier des formes

M.-O. Berger Intro MRF September 18, 2018 4 / 45


Historique

Au départ, la RF est surtout du traitement du signal


I test de la présence d’un signal
I identification de sources multiples
I traitement de la parole
et progressivement, on a envisagé des tâches plus complexes...

M.-O. Berger Intro MRF September 18, 2018 5 / 45


L’humain fait beaucoup de choses:

reconnaı̂tre
I des visages
I des sons
I des formes
et ceci indépendamment
I du point de vue sous lesquels on les observe
I des conditions d’observation
I de leur variabilité
Mais le domaine est en forte progression depuis 2012.

M.-O. Berger Intro MRF September 18, 2018 6 / 45


Quelques exemples en images

M.-O. Berger Intro MRF September 18, 2018 7 / 45


exemple: segmentation

Figure: segnet: A Deep Convolutional Encoder-Decoder Architecture for Image


Segmentation [Badrinarayanan 2016]

demo
M.-O. Berger Intro MRF September 18, 2018 8 / 45
Détection précise ou approximative?

Détéction de piétons [Andriluka CVPR 2009]: on peut se contenter de


détecter des boites contenant des piétons

M.-O. Berger Intro MRF September 18, 2018 9 / 45


Détection précise ou approximative?

Où avoir une estimation précise de la position du corps

M.-O. Berger Intro MRF September 18, 2018 10 / 45


Joint reconstruction and semantic segmentation [Hane
CVPR 2013]

M.-O. Berger Intro MRF September 18, 2018 11 / 45


Quelques exemples classiques de RF

Problème Entrée Sortie


Analyse de documents image du document mots, graphique
Filtres internet Emails classification en SPAM
Analyse du langage naturel texte informations sémantiques
Reconnaissance de la parole spectrogramme mots
Recherche multimédia son, images, vidéo Ident. d’évènements
Reconnaissance biometrique empreintes digitales, iris authentification
Identifications de défauts images pièces au rebut
Surveillance médicale signaux (ECG, temp) émission d’alertes
Identification et suivi vidéo trajectoire de la cible

M.-O. Berger Intro MRF September 18, 2018 12 / 45


Les controverses de la RF (1)

cognitivistes contre comportementalistes


I faut-il s’inspirer de nos connaissances sur la perception humaine pour
concevoir des systèmes d’inspiration cybernétique.
I le comportementaliste ne cherche pas à analyser le concept mais
essaie de collecter un maximum de prototypes différents pour en
extraire des régularités et des moyens de classification

M.-O. Berger Intro MRF September 18, 2018 13 / 45


Les controverses de la RF (2)

Apprentissage / représentation
Étant donné un ensemble de formes caractérisant une classe, doit on
I utiliser une représentation sophistiquée des formes (ce qui nécessite
souvent des connaissances explicites sur le domaine)
I travailler directement sur les données sans a priori (tout repose sur le
processus de classification)

M.-O. Berger Intro MRF September 18, 2018 14 / 45


Les modèles de la RF

I RF statistique
I RF syntaxique ou structurelle
I Systèmes à base de connaissances
Dans ce cours, on parlera surtout de RF statistique. D’autres modules du
master envisagent les autres aspects.
La RF est à la confluence de plusieurs domaines: maths, stats, probas,
apprentissage, biologie, informatique, parallélisme

M.-O. Berger Intro MRF September 18, 2018 15 / 45


Un système de reconnaissance des formes

l’approche conventionnelle:

I Les caractéristiques des données sont extraites (de manière statique)


indépendamment du processus de classification

M.-O. Berger Intro MRF September 18, 2018 16 / 45


Un système de reconnaissance des formes

l’approche par réseaux convolutionnels (CNN): extraction des


caractéristiques et entrainement du classifieur ne sont pas dissociées:

M.-O. Berger Intro MRF September 18, 2018 17 / 45


Quelques exemples de CNNs

I Reconnaissance d’objet Demo Berkeley

M.-O. Berger Intro MRF September 18, 2018 18 / 45


conventionnel/CNN

I Les CNN etle Deep Learning font l’objet d’un module dans AVR (E.
Vincent/J. Fix) Voir aussi les intervention de Yann Le Cun au collège
de France.
I Questions communes à tous les systèmes: on cherche une fonction de
classification minimisant une métrique qualifiant la distance entre les
resultats obtenus et les résultats souhaités
I Quelle distance utiliser? comment calculer le minimum? La solution est
elle sensible à la présence de données aberrantes?
I Tout ne peut se résoudre par les CNN qui demandent beaucoup de
données d’apprentissage!

M.-O. Berger Intro MRF September 18, 2018 19 / 45


Les problèmes de la RF statistique

I Collecter des données


I Représenter les données d’entrée (souvent de taille importante): →
Extraire les caractéristiques de ces données pour réduire la dimension
du problème
I Modéliser les classe d’objets
I Choisir une procédure adéquate pour classifier un objet d’après son
vecteur de caractéristiques. Évaluer la qualité du classifieur

M.-O. Berger Intro MRF September 18, 2018 20 / 45


Collecter les données

I But :Amasser des données représentatives d’un phénomène et


également des données permettant ultérieurement de tester le
système de RF
I Problème: Comment savoir que l’on a assez de données ? (Sont elles
bien représentatives du phénomène?)
I A ce propos, consulter l’article 2018 de Sciences et Avenir:
Intelligence artificielle : la reconnaissance faciale est-elle misogyne et
raciste ?

M.-O. Berger Intro MRF September 18, 2018 21 / 45


Représenter les données

Objectifs: réduire la taille du problème en décrivant la donnée par


quelques caractéristiques discriminantes (valeurs semblables pour des
motifs semblables, valeurs différentes pour des motifs différents)
I dépendance du domaine et des connaissances a priori sur le domaine
(formes paramétrables)
I invariance souhaitable vis à vis de l’espace de mesure (invariances en
général vis à vis de rotation, translation et changement d’échelle).
Invariance souhaitable vis à vis d’occultation partielle ou de
déformations.
I souhait d’une représentation compacte pour accélérer la
reconnaissance
I Note: avec les CNN, une forme d’invariance vient de l’introduction
dans les données d’apprentissage de diverses données donnant lieu à
la meme interprétation

M.-O. Berger Intro MRF September 18, 2018 22 / 45


Caractériser les données: exemple 1

caractéristiques possibles: aire, périmètre, compacité, histogramme . . .

M.-O. Berger Intro MRF September 18, 2018 23 / 45


Caractériser les données: exemple 2
Empreinte: extraire des données caractéristiques comme les birfurcations
et les points terminaux.

M.-O. Berger Intro MRF September 18, 2018 24 / 45


Caractériser les données: exemple 3
les modèles d’apparence [cootes95]: plutôt que de caractériser des images
de visages par l’extraction de caractéristiques a priori (lèvres, nez, yeux...)
extraire directement des caractéristiques communes aux images à partir
d’un groupe d’exemples.
Représentation linéaire des variations d’un ensemble de formes par rapport
à la forme moyenne (voir le cours sur l’ACP et les modèles linéaires):

Figure: (1): extrait de la base de données. (2): les modes extraits

M.-O. Berger Intro MRF September 18, 2018 25 / 45


Caractériser les données: exemple 3

Figure: représentation d’une forme en utilisant 1, 2, 3 ... modes

M.-O. Berger Intro MRF September 18, 2018 26 / 45


Modèle et représentation des classes

Il existe de nombreuses façons de représenter des classes. L’objectif est


d’avoir une représentation compacte et de faciliter l’identification de la
classe d’appartenance d’un nouvel exemple.
Quelques représentations fréquentes:
I représentation de la classe par la base des exemples: cout du test
d’appartenance prohibitif car on passe tous les éléments en revue.
I représentation d’une classe par une distribution de probabalité
(souvent paramétrique) suivie par les exemples exemples (Gaussienne
par exemple)
I connaissance des fonctions de séparations des classes (frontières
linéaires, quadratiques ...)

M.-O. Berger Intro MRF September 18, 2018 27 / 45


Modèle génératif versus modèle discriminant

I Modèles génératifs:
I Basé sur l’étude de P(x|Class). On décrit la classe sans chercher à
regarder ce qui différencie cette classe des autres classes.
I exemple: ACP

I Modèles discriminants:
I on cherche à maximiser la qualité de la classification sur une base
d’apprentissage.
I exemple: SVM (hyperplan séparateur), perceptron, (erreurs),..

M.-O. Berger Intro MRF September 18, 2018 28 / 45


Exemple de représentation des classes

Étant donnés un certain nombre d’exemples des objets à reconnaı̂tre, étant


donné un nouvel objet x, on veut affecter x à l’une des classes.
On peut:
I ne pas structurer la base des exemples et mesurer la concordance la
meilleure entre l’objet et les exemples de la classe (pattern matching)

I Produire une représentation statistique de la base (moyenne,


variance) et l’utiliser pour la reconnaissance

M.-O. Berger Intro MRF September 18, 2018 29 / 45


En présence de données aberrantes
Le contrôle d’une forme de régularité des classes ou des distributions,
permet d’éviter de créer des frontières inutilement complexes, risquant de
refléter uniquement le bruit...

Gérer les données incorrectes, rares ou bruitées est un problème


important de la RF.
M.-O. Berger Intro MRF September 18, 2018 30 / 45
Quelques problèmes importants

I Avoir des outils statistiques/probabilistes/numériques permettant


I de détecter des mesures invalides/inadaptées: théorie des tests
I de travailler dans un espace de dimension réduite: réduction de la
dimensionnalité
I des moyens de grouper/modéliser des données similaires (une classe
d’objets) avec des critères dépendant de l’application: plus proche
voisin, classification, modélisation linéaire, méthodes probabilistes
I d’estimer les paramètres caractéristiques d’une mesure, sa classe étant
connue: théorie de l’estimation
I Des mesures atypiques ou erronées peuvent être présentes dans les
données → faire en sorte qu’elles n’influencent pas le processus de
reconnaissance (notion de robustesse)

M.-O. Berger Intro MRF September 18, 2018 31 / 45


La RF en fonction des connaissances disponibles:
objectif: à partir de données numériques (image, parole, capteur, signal),
étudier,caractériser ou classifier le phénomène ayant donné lieu à ces
observations

Réseaux neurones

M.-O. Berger Intro MRF September 18, 2018 32 / 45


Contenu du cours
Notions abordées dans ce cours:
I Données et incertitudes
I Représentation des données
I Modélisation et prise en compte de l’incertain
I Tests adéquation mesure/modèle
I Modélisation linéaire
I l’analyse en composante principales (ACP), l’analyse en composantes
indépendantes (ACI), l’analyse linéaire discriminante (ALD)
I Exemples de systèmes de reconnaissance de visage basés sur des
classifieurs linéaires (ADABOOST)
I Estimation
I Les bases de l’estimation paramétrique
I Estimation robuste
I Algorithme EM
I Quelques problèmes de reconnaissance des formes dans le domaine de
l’image
M.-O. Berger Intro MRF September 18, 2018 33 / 45
Part I

Représenter les données

M.-O. Berger Intro MRF September 18, 2018 34 / 45


Problèmes de représentation

I la taille: Les données sont rarement de taille raisonnable


(spectrogramme, images,. . . ) → il faut adopter une représentation
des données de taille raisonnable avec le moins possible de perte
d’information
I l’invariance: les données peuvent être enregistrées dans des repères
différents (ex orientation différente). Les données peuvent aussi être
des mesures indirectes d’un même phénomène: les mesure ne sont
donc pas directement semblables même si elles concernent un même
phénomène
I Utiliser des mesures invariantes (ou le plus possible) pour caractériser
des formes.
I dans les cas complexes, il n’y a pas de caractéristiques évidentes
résumant au mieux les données et tenant compte des variations
d’apparence. Celles ci doivent être apprises.

M.-O. Berger Intro MRF September 18, 2018 35 / 45


Comment caractériser l’invariance?

Il peut y avoir de simples mouvements de l’objet, des changements de


points de vue, des changements d’illumination, des occultations....

M.-O. Berger Intro MRF September 18, 2018 36 / 45


Problème (malédiction (*)) de la dimension

*: terme inventé par Richard Bellman pour parle de la difficulté de


travailler avec des données appartenant à des espaces de grande
dimension.
I Représenter une forme par un vecteur de caractéristiques de petite
taille permet de limiter la complexité des processus
I Un grand vecteur de caractéristiques peut avoir tendance à modéliser
l’accessoire (le bruit) plutôt que l’essentiel des données.
I malédiction: il faut énormément de données pour obtenir une bonne
estimation. Soient 100 observations d’un phénomène faites dans
l’intervalle [0, 1]. Pour réaliser dans [0, 1]10 une couverture
équivalente à celle des 100 points il faudrait 10010 = 1020
observations, ce qui est la plupart du temps inenvisageable.

M.-O. Berger Intro MRF September 18, 2018 37 / 45


Exemples de représentation: descripteurs de Fourier

A la différence des moments géométriques qui ne nécessitent pas de


segmentation, les descripteurs de Fourier sont calculés à partir du contour
de la forme.
si f (x) est une périodique de période T , on définit les coefficients an et bn
par
RT RT
a0 = 2/T 0 f (x)dx, an = 2/T 0 cos(2πnx/T )f (x)dx
RT
bn = 2/T 0 sin(2πnx/T )f (x)dx

f peut être approximée par


X X
a0 + an cos(2πnx/T ) + bn sin(2πnx/T )

en se limitant en pratique à un certain nombre de termes.

M.-O. Berger Intro MRF September 18, 2018 38 / 45


Représentation: descripteurs de Fourier

Exemples d’approximations successives par série de Fourier:

M.-O. Berger Intro MRF September 18, 2018 39 / 45


Représentation: descripteurs de Fourier
Propriétés utiles des descripteurs de Fourier:coeffs de f (x − τ ).
an0 = an cos(2πnτ /T ) − bn sin(2πnτ /T )
bn0 = an sin(2πnτ /T ) + bn cos(2πnτ /T )
Il n’ y a pas d’invariance par translation, mais le module des coefficients
est invariant.
Troncature :
La limitation en pratique à un certain nombre de termes n’est pas
forcément évidente: une marche nécessite une infinité de coefficients pour
être bien représentée.

intérêt: une modélisation hiérarchique en terme de détails assez naturelle


M.-O. Berger Intro MRF September 18, 2018 40 / 45
Exemple de représentation: signatures

Utiliser des représentations moins constructives mais effectivement


invariantes à des groupes de transformations.
Exemple: codage de la pente
Balayer un contour. Construire la distribution f (x), ou l’histogramme de
l’angle polaire de la tangente à la courbe.
En utilisant comme codage le module de la transformée de Fourier de
f , on a l’invariance par rotation (rotation: addition d’une constante à
l’angle polaire)

M.-O. Berger Intro MRF September 18, 2018 41 / 45


Signatures
Autre exemple: utiliser l’angle du contour par rapport au rayon issu du
centre de gravité et passant par ce point.
Inconvénient: dans tous les cas, deux formes différentes peuvent partager
la même signature

Remarque: l’invariance à des transformations 2D peut être prise en compte


à deux niveaux:
I dans le descripteur: on a en général une description plus pauvre mais
qui permet une recherche rapide des éléments ressemblants. Il reste à
faire un peu de ménage parmi les candidats.
I dans le processus de recherche/classification: on recherche les
éléments ressemblants modulo un groupe de transformations défini.
M.-O. Berger Intro MRF September 18, 2018 42 / 45
Bibliographie I

S. Agarwal and D. Roth.


Learning a sparse representation for object detection.
In Proceedings of 7th European Conference on Computer Vision, Copenhagen
(Denmark), 2002.

Mykhaylo Andriluka, Stefan Roth, and Bernt Schiele.


Pictorial structures revisited: People detection and articulated pose estimation.
In IEEE Conference on Computer Vision and Pattern Recognition (CVPR), June
2009.
Best Paper Award Honorable Mention by IGD.

Vijay Badrinarayanan, Alex Kendall, and Roberto Cipolla.


Segnet: A deep convolutional encoder-decoder architecture for image
segmentation.
CoRR, abs/1511.00561, 2015.

M.-O. Berger Intro MRF September 18, 2018 43 / 45


Bibliographie II

T.F. Cootes, C.J. Taylor, D.H. Cooper, and J. Graham.


Active shape models -their training and application.
Computer Vision and Image Understanding, 61(1):38–59, 1995.

R. O. Duda and P. E. Hart.


Pattern Classification and Scene Analysis.
Wiley-InterScience, 1973.

C. HÃne, C. Zach, A. Cohen, R. Angst, and M. Pollefeys.


Joint 3d scene reconstruction and class segmentation.
In 2013 IEEE Conference on Computer Vision and Pattern Recognition, pages
97–104, June 2013.

A. K. Jain, R. P. W Duin, and J. Mao.


Statistical Pattern Recognition: A Review.
IEEE Transactions on PAMI, 22(1):4–37, January 2000.

M.-O. Berger Intro MRF September 18, 2018 44 / 45


Bibliographie III

Yann LeCun, Fu-Jie Huang, and Leon Bottou.


Learning Methods for Generic Object Recognition with Invariance to Pose and
Lighting.
In Proceedings of IEEE Conference on Computer Vision and Pattern Recognition,
Washington, DC (USA), 2004.

L. Rabiner.
A tutorial on hidden markov models and selected applications in speech
recognition.
Proc. IEEE, 77:257–286, 1989.

A. Webb, editor.
Statistical Pattern Recognition.
wiley, 2002.

M.-O. Berger Intro MRF September 18, 2018 45 / 45

Common questions

Alimenté par l’IA

Generative models focus on describing a class by studying P(x|Class) without needing to distinguish it from other classes, utilizing approaches like ACP for dimensionality reduction. In contrast, discriminative models aim to maximize classification accuracy by focusing directly on the boundary between classes using methods like SVMs or perceptrons .

Invariant data representations are crucial as they account for variations such as rotation, scale, translation, and occlusion in input data, which can otherwise impact recognition accuracy. Ensuring invariance allows the system to focus on the essential features that characterize the data, improving robustness and recognition accuracy across different conditions .

Using biased data in training facial recognition systems can lead to discriminatory outcomes, as systems may reflect inherent biases such as misogyny or racism. This can manifest in inaccuracies like higher false recognition rates for certain demographics, undermining fairness and reliability. Ensuring diversity in training data is essential to mitigate these biases and improve system equity .

One key challenge in collecting data for statistical pattern recognition systems is ensuring that the dataset is both representative and comprehensive enough to adequately model the phenomenon. Additionally, determining whether enough data has been collected is difficult, as non-representative data can lead to biased models and poor generalization .

CNNs integrate feature extraction and classifier training into a unified process, contrasting with conventional systems that treat feature extraction and classification as separate steps. This integration allows CNNs to learn features directly optimized for classification tasks through backpropagation, reducing dependency on handcrafted features and improving adaptability to complex inputs .

PCA assists in data representation by reducing dimensionality while preserving variance, thus obtaining a more compact form. It involves linear transformations that prioritize components of highest variance, helping mitigate issues such as the 'curse of dimensionality' by transforming data into uncorrelated variables .

Reducing data dimensionality is vital in pattern recognition as it simplifies models, reduces computational complexity, and can enhance recognition accuracy by focusing on the most informative aspects of the data. This reduction helps avoid the curse of dimensionality, improving both efficiency and effectiveness of identification systems .

The curse of dimensionality refers to the exponential increase in data volume needed as dimensionality increases. In pattern recognition, it makes distance measures and statistical computations less effective in high-dimensional spaces, requiring more data to reliably train models and leading to computational inefficiency and overfitting problems .

Fourier descriptors represent shapes by transforming spatial domain information into frequency domain, capturing contour information efficiently. This approach provides a compact representation invariant to scale but not to translation or rotation. A limitation is the potential requirement of many coefficients for accurate representation, complicating attempts at succinct characterizations .

The size of a feature vector has a critical impact on a pattern recognition system's complexity and accuracy. Smaller vectors can simplify models and reduce computational load, potentially enhancing detection speed and robustness against noise. However, overly small vectors risk losing vital information, while larger vectors may capture noise instead of underlying structures, thus requiring a balance .

Vous aimerez peut-être aussi