0% ont trouvé ce document utile (0 vote)
348 vues27 pages

Reconnaissance Écriture et Formes

Ce chapitre présente les notions de base de la reconnaissance des formes et de l'écriture. Il définit ces domaines et décrit les principales étapes d'un système de reconnaissance, notamment l'acquisition, le prétraitement, la segmentation, l'extraction des caractéristiques et la classification. Le chapitre détaille également les approches de reconnaissance de l'écriture manuscrite et les étapes d'un système de reconnaissance de l'écriture hors ligne.

Transféré par

Nezha BENICHOU
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
348 vues27 pages

Reconnaissance Écriture et Formes

Ce chapitre présente les notions de base de la reconnaissance des formes et de l'écriture. Il définit ces domaines et décrit les principales étapes d'un système de reconnaissance, notamment l'acquisition, le prétraitement, la segmentation, l'extraction des caractéristiques et la classification. Le chapitre détaille également les approches de reconnaissance de l'écriture manuscrite et les étapes d'un système de reconnaissance de l'écriture hors ligne.

Transféré par

Nezha BENICHOU
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

Université Abdelmalek Saadi

Faculté des sciences et techniques


Al Hoceima

Filière : Systèmes Embarqués et Robotique


Module : Traitement de signal avancé

Rapport de mini-projet : La reconnaissance


d’écriture et des formes

Réalisé par : Encadré par:


Année Universitaire : 2020/2021


Remerciement

C’est une habitude saine de remercier au début d’un


tel travail tous ceux qui ont contribué à le rendre
possible.
C’est avec notre enthousiasme le plus vif et le plus
sincère que nous voudrions rendre mérite à tous ceux
qui, plus au moins à leurs manières, nous ont aidés à
élaborer ce rapport.
Nous tenons à remercier notre Professeur Mr. EL
ALLATI Abderrahim pour le fait de nous donner cette
opportunité d’améliorer notre connaissance dans le
domaine de Traitement de signal avancé.
Nos remerciements vont aussi à toutes les
personnes qui nous ont soutenus jusqu’au bout .
Table des matières
Remerciement
Liste des figures......................................................................................................4
Introduction Générale..............................................................................................6
Chapitre 1 : Reconnaissance des formes et de l’écriture........................................7
I-Introduction:................................................................................................................ 8
II-Reconnaissance des formes :......................................................................................8
II-1- Définition :............................................................................................................8
II-2- Domaines d’application :.......................................................................................8
II-3- Le processus RF :..................................................................................................9
II-3-1 L’acquisition :......................................................................................................9
II-3-2 Le prétraitement et la segmentation :..................................................................9
II-3-3 L’extraction :.......................................................................................................9
II-3-4 La classification :.................................................................................................9
III-La reconnaissance d’écriture:.................................................................................11
III-1- Définition :.........................................................................................................11
III-2- Les systèmes de reconnaissance de l’écriture :...................................................11
III-2-1 Le mode d’acquisition de l’écriture :................................................................11
III-2-2 Le type de l’écriture :.......................................................................................12
III-3 Les approches de reconnaissance de mots :.........................................................12
III-3-1 Approche globale :..........................................................................................12
III-3-2 Approche analytique :......................................................................................11
III-4 Les étapes d’un système de reconnaissance de l’écriture hors ligne :..................12
III-4-1 Etape d’acquisition :.........................................................................................12
III-4-2 Le prétraitement :.............................................................................................13
III-4-3 Segmentation :..................................................................................................13
III-4-4 Extraction des caractéristiques :.......................................................................14
III-4-5 Classification :..................................................................................................14
III-4-6 L'apprentissage :...............................................................................................14
III-4-7 Post-traitement :...............................................................................................14
VI- Conclusion :........................................................................................................15
Chapitre 2: Code et Simulation………………………………………………16
I-Introduction........................................................................................................17
II-Le programme principal :.........................................................................................17
III-Les sous-programmes utilisés :...............................................................................20
III-1- Création de base de données :............................................................................20
III-2- Acquisition :.......................................................................................................20
III-3- Prétraitement d’image :......................................................................................21
III-4- Segmentation de l’image :..................................................................................22
III-4-1- Segmentation par ligne :.................................................................................22
III-4-2 Segmentation par lettre :...................................................................................22
III-5- Extraction des caractéristiques :.........................................................................23
III-6- Classification :....................................................................................................23
III-7- Reconnaissance :................................................................................................25
Conclusion………………………………………………………………………….……………….26
Références............................................................................................................27
Liste des figures

Figure 1:Schéma d’un système de reconnaissance de formes....................................................9


Figure 2:Ecriture en ligne et hors ligne.....................................................................................11
Figure 3:Schéma général d'un système de reconnaissance de l’écriture...................................12
Figure 4:Extraction de caractères sous forme de matrice.........................................................13
Figure 5 : L’affichage de l’image avec bruit…………………………………………………… 19
Figure 6 : Prétraitement de l’image…………………………………………………………….. 20
Figure 7 : Segmentation par ligne………………………………………………………………. 21
Figure 8 : Segmentation par lettre………………………………………………………………..22
Figure 9 : Reconnaissance de l’écriture………………………………………………………...25
Introduction Générale
Les techniques liées au traitement de l’information connaissent actuellement
un développement très actif en liaison avec l’informatique et présentent un
potentiel de plus en plus important dans le domaine de l’interface homme
machine on parle alors sur l’intelligence artificielles, il regroupe des sciences et
technologies qui permettent d’imiter ou d’étendre l’intelligence humaine à l’aide
de machines capables d’apprentissage, de prise de décisions voire même de
raisonnement.
Dans notre projet nous avons traité une des applications de l’Intelligence
Artificielle faible la plus importante et la plus utilisable dans le domaine de la
robotique c’est la Reconnaissance des formes, et d’écritures là où on va bien
détailler les choses.
L’écriture restera l’un des grands fondements des civilisations et le mode par
excellence de conservation et de transmission du savoir. La reconnaissance de
l’écriture est un domaine vaste qui constitue un sous ensemble des systèmes de
la reconnaissance des formes (RF). Ces systèmes sont la première étape d’un
processus de compréhension de notre univers dans le cadre global de la
communication homme machine. La reconnaissance des textes cursifs reste
toujours un problème ouvert aussi bien dans sa forme imprimée que manuscrite.
Ceci à cause des difficultés auxquelles sont confrontés les chercheurs et les
développeurs, telles que la variabilité de la forme, du style, et de l’inclinaison de
l’écriture.
Il existe cependant plusieurs domaines pour lesquels la reconnaissance de
l’écriture est appliquée avec un certain succès : le tri automatique du courrier, le
traitement automatique de dossiers administratifs, des formulaires d’enquêtes,
ou encore l’enregistrement des chèques bancaires.
Après cette introduction, dans le premier chapitre, nous présenterons
rapidement les notions de bases de la reconnaissance des formes, la
reconnaissance de l’écriture.
Dans le deuxième chapitre nous présenterons notre travail sur la réalisation
(simulation) du code sous Matlab.
Chapitre 1 : Reconnaissance des formes et
de l’écriture
I- Introduction:
La reconnaissance de formes comporte actuellement un champ très large des
méthodes soutenant le développement de nombreuses applications dans
beaucoup de différents secteurs d'activités. Les méthodes et techniques de
reconnaissance de formes se trouver généralement dans le milieu de la
simulation « intelligente » des tâches, qui a certainement infiltré notre vie
quotidienne. La fabrication aidée par les robots, les systèmes de diagnostic
médical, la reconnaissance automatique des documents ou caractères (OCR).

Alors dans ce chapitre nous allons présenter l’ensemble des généralités sur le
domaine de reconnaissance de formes, puis la reconnaissance de l’écriture en
générale, en fin La reconnaissance d'écriture manuscrite qui est à la fois un défi
scientifique de fond et un enjeu économique d'importance.

II- Reconnaissance des formes 

II-1- Définition :
La reconnaissance de formes est un domaine pluridisciplinaires se situent au
carrefour  de plusieurs disciplines, on cite parmi autres : la linguistique, les
statistiques, l’électronique, l’informatique, la théorie de communication, la
biologie, l’optique,…etc. Cette discipline consiste à reproduire les capacités
perceptuelles de l’homme, en catégorisant un ensemble de données brutes selon
le patron observé. La reconnaissance de formes n'est pas seulement limitée à la
perception visuelle, mais inclut également tous les types de perception
artificielle nécessitant la reconnaissance des modèles de donnée. Puisque
nombreuses chaînes de caractères et de symboles sont présentes en de multiples
orientations et en plusieurs tailles, alors la reconnaissance doit être robuste vis à
vis du placement des formes. Le recouvrement ou l’interconnexion de symboles
doit pouvoir être analysé.

II-2- Domaines d’application :


Généralement, les objets à reconnaître sont de type signal ou image, ce qui
implique deux grandes familles d’applications :
 Reconnaissance des signaux: Où on essaye d’automatiser l’interprétation
des signaux :
 Signaux vocaux : reconnaissance de la parole, reconnaissance du
locuteur…
 Signaux biomédicaux : électrocardiogramme…
 Surveillance d’instruments, diagnostics de panne…
 Reconnaissance des formes dans les images numériques: Où on essaye
d’automatiser le processus de la vision humaine :
 Reconnaissance d’empreintes digitales.
 La reconnaissance de l'écriture.
 L’analyse de documents.
 Analyse de scènes, interprétation d’images, « computer vision »…

II-3- Le processus RF :


L'objectif du processus RF est de réduire la quantité de données à traiter, à partir
des informations originales qui font partie de l'espace d'observation ou du
monde réel (souvent une image ou un signal) jusqu'à sa description symbolique
c'est-à-dire le passage de l’espace d’observation vers l’espace de représentation.

Les unités d’un système de reconnaissance de formes correspondantes sont :

II-3-1 L’acquisition :

Acquisition de formes, qui peut prendre plusieurs formes : acquisition de signal


ou d'image, collecte de données.

II-3-2 Le prétraitement et la segmentation :


Les étapes de prétraitement et segmentation sont nécessaires, dans le
prétraitement on parle de seuillage, de squelettisation, etc…

II-3-3 L’extraction :
L’extraction des caractéristiques consiste à exprimer les primitifs sous une
forme numérique ou symbolique appelée codage.

II-3-4 La classification  :
La classification c'est-à-dire le passage de l’espace de codage vers l’espace de
décision.
Avant qu’un modèle de décision ne soit intégrer dans un système de
reconnaissance, il faut avoir procéder auparavant a deux étapes :

 L’apprentissage :
L’étape d’apprentissage consiste à caractériser les classes de formes de manière
à bien distinguer les familles homogènes de formes. C’est une étape clé dans le
système de reconnaissance. On distingue deux types d’apprentissage :
apprentissage supervisé et apprentissage non supervisé.

 Apprentissage supervisé : Chaque forme est étiquetée par un opérateur


appelé professeur, cette étiquette permet d’indiquer au module
d’apprentissage la classe dans laquelle le professeur souhaite que la forme
soit rangée .Cette phase d’apprentissage consiste à analyser les
ressemblances entre les éléments d’une même classe et les dissemblances
entre les éléments de classes différentes pour en déduire la meilleure
partition de l’espace des représentations

 Apprentissage non supervisé : on fournit un système de reconnaissance de


nombreuses formes non étiquetées. L’étape de classification va se charger
d’identifier automatiquement les formes appartenant à une même classe.

Dans le domaine de la reconnaissance de l’écriture, ce sont les méthodes


basées sur un apprentissage supervisé qui sont le plus souvent utilisées ; et plus
particulièrement pour les caractères manuscrits isolés car les classes naturelles
sont connues et en nombre limité.

 Le test :
Cette étape permet d’évaluer la performance du classifieur pour un
apprentissage donné. C’est une étape importante car elle peut mettre en cause le
choix des primitives ou le choix de la méthode d’apprentissage

Figure 1:Schéma d’un système de reconnaissance de formes


III- La reconnaissance d’écriture

III-1- Définition :
Est un traitement informatique qui a pour but de traduire un texte écrit en un
texte codé numériquement. Il  fait appel à la reconnaissance de forme, mais
également au traitement automatique du langage naturel. Cela veut dire que le
système, tout comme le cerveau humain, reconnaît des mots et des phrases
existant dans un langage connu plutôt qu’une succession de caractères. Ceci
améliore grandement la robustesse.

III-2- Les systèmes de reconnaissance de l’écriture :


Les systèmes de reconnaissance de l’écriture peuvent être classifiés selon deux
critères :

III-2-1 Le mode d’acquisition de l’écriture :

Selon ce critère, les systèmes de reconnaissance automatique de l’écriture sont


regroupés en deux familles :
 Systèmes de reconnaissance en ligne :
Dans le cas en ligne, il s’agit de reconnaître l’écriture au fur et à mesure de son
tracé. Le texte est saisi avec un stylo et une tablette à numériser, les informations
recueillies sont constituées par une suite ordonnée de points (définis par leurs
coordonnées) échantillonnés à cadence fixe.
La reconnaissance en ligne peut disposer de l’information temporelle (vitesse,
accélération, levés de stylo, retours en arrière, barres de t, points diacritiques),
mais d’aucune information sur l’épaisseur du tracé si on ne dispose pas d’un
signal de pression de la pointe du stylet sur le support.
 Systèmes de reconnaissance hors ligne :
Dans le cas hors ligne, il s’agit de reconnaître des textes manuscrits à partir de
documents écrits au préalable. L’image du texte écrit est numérisée à l’aide d’un
scanneur, les informations recueillies se présentent sous la forme d’une image
discrète constituée d’un ensemble de pixels.
Figure 2:Ecriture en ligne et hors ligne

III-2-2 Le type de l’écriture  :


 Les systèmes de reconnaissances de l’écriture imprimée
 Les systèmes de reconnaissances de l’écriture manuscrite

III-3 Les approches de reconnaissance de mots :


La reconnaissance de l’écriture utilise principalement deux approches:

III-3-1 Approche globale :


Se base sur une description unique de l'image du mot, vue comme une entité
indivisible. Disposant de beaucoup d'informations, en effet, la discrimination des
mots proches est très difficile, et l'apprentissage des modèles nécessite une
grande quantité d'échantillons qui est souvent difficile à réunir. Cette approche
est souvent appliquée pour réduire la liste des mots candidats dans le contexte
d'une reconnaissance à vocabulaire réduits.

III-3-2 Approche analytique :


Basée sur un découpage du mot. Elle consiste à segmenter le mot manuscrit en
parties inférieures aux lettres appelés graphèmes et à retrouver les lettres puis le
mot par la combinaison de ces graphèmes. Cette approche est la seule applicable
dans le cas de grand vocabulaire.

III-4 Les étapes d’un système de reconnaissance de l’écriture


hors ligne :
Comme la reconnaissance de l’écriture est une branche de la reconnaissance des
formes.il fait appel généralement aux étapes suivantes: Acquisition,
prétraitements, segmentation, extraction des caractéristiques, classification,
suivis éventuellement d’une phase de post-traitement.
Figure 3:Schéma général d'un système de reconnaissance de l’écriture

III-4-1 Etape d’acquisition :


L'acquisition permettant la conversion du document papier sous la forme d'une
image numérique (bitmap). Cette étape est importante car elle se préoccupe de la
préparation des documents à saisir, du choix et du paramétrage du matériel de
saisie (scanner), ainsi que du format de stockage des images.

III-4-2 Le prétraitement :
Consiste à préparer les données issues du capteur à la phase suivante. Il s'agit
essentiellement de réduire le bruit superposé aux données et d'essayer de ne
retenir que les informations significatives de la forme représentée.
Parmi les opérations de prétraitement généralement utilisées on peut citer :
 La binarisation (Seuillage) : c'est le passage d'une image en couleur ou
définie par plusieurs niveaux de gris à une image composée de deux valeurs
0 et 1, plus simple à traiter.
 Normalisation : permet de réduire tous les types de variations, et pour
obtenir des données normalisées.
 Suppression du bruit : possède à éliminer les pixels qui représentent des
bruits.
III-4-3 Segmentation :
La segmentation consiste de générer un découpage de l’image en des éléments
susceptibles d’être reconnus, en décortiquant par exemple le caractère en sous
caractères simples à identifier.

III-4-4 Extraction des caractéristiques :


C'est l'une des étapes les plus délicates et les plus importantes en OCR. La
reconnaissance d'un caractère passe d'abord par l'analyse de sa forme et
l'extraction de ses traits caractéristiques (primitives) qui seront exploités pour
son identification.

Figure 4:Extraction de caractères sous forme de matrice

III-4-5 Classification :
La classification est l’élaboration d’une règle de décision qui transforme les
attributs caractérisant les formes en appartenance à une classe (passage de
l’espace de codage vers l’espace de décision).

III-4-6 L'apprentissage :
Permet de construire un dictionnaire de prototype. D'une manière générale, on
distingue deux types de techniques d'apprentissage : supervisé et non supervisé.

III-4-7 Post-traitement :
Le but principal est d'améliorer le taux de reconnaissance en faisant des
corrections orthographiques ou morphologiques à l'aide de dictionnaires et de
corriger les erreurs de l’étape précédente.

Nombre de l ' écriture reconnues


Taux de reconnaissance =
Nombre total d ' écriture
VI- Conclusion :
Jusqu’à ici nous avons obtenu un ensemble de notions de bases sur le domaine
de reconnaissance des formes et de l’écriture, nous pouvons poursuivre vers la
simulation sous Matlab.
Chapitre 2 :

Code et Simulation

I- Introduction
 MATLAB signifie MATrix LABoratory, associe un environnement de
bureau adapté pour l'analyse par itération et les processus de conception
avec un langage de programmation, tels que C, C++, JAVA, permettant
d'exprimer directement les mathématiques sous forme de tableaux et de
matrices Ici, vous jouez avec les matrices. Il existe une large gamme
d'applications, notamment le traitement de signaux et d'images,
l'accusation d'images.

 OCR (Optical Character Recognition)


Composantes d’un système d’OCR
Un système OCR typique se compose de plusieurs éléments. La première étape
du processus consiste à numériser le document analogique à l'aide d'un scanner
optique. Lorsque les régions contenant du texte sont localisées, chaque symbole
est extrait par un processus de segmentation. Les symboles extraits peuvent
ensuite être prétraités, en éliminant le bruit, pour faciliter l'extraction des
caractéristiques à l'étape suivante. L'identité de chaque symbole est trouvée en
comparant les caractéristiques extraites avec les descriptions des classes de
symboles obtenues lors d'une phase d'apprentissage précédente. Enfin, des
informations contextuelles sont utilisées pour reconstruire les mots et les
nombres du texte original.

II- Le programme principal :


III- Les sous-programmes utilisés :
III-1- Création de base de données :

III-2- Acquisition :
Figure 5 : L’affichage de l’image avec bruit

III-3- Prétraitement d’image :

Figure 6 : Prétraitement de l’image


III-4- Segmentation de l’image :
III-4-1- Segmentation par ligne :

Figure 7 : Segmentation par ligne

III-4-2 Segmentation par lettre :


Figure 8 : Segmentation par lettre.

III-5- Extraction des caractéristiques :

III-6- Classification :
III-7- Reconnaissance :

Figure 9 : Reconnaissance de l’écriture


Conclusion

Le domaine de la reconnaissance de l’écriture est très vaste et riche en


connaissance, que ce soit sur la langue elle même ou ses différentes tournures et
ses ambigüités. dans cette tâche, les OCR sont très performants mais nécessitent
des améliorations car doit apprendre à distinguer la forme de chaque caractère
dans un vocabulaire de taille souvent importante, il doit en plus être capable de
la distinguer dans chacun des styles typographiques (polices), chaque corps et
chaque langue, proposés dans le même document.
Nous espérons dans l’avenir pouvoir intégrer un groupe de recherche dans ce
domaine pour pouvoir contribuer dans la recherche ainsi que développer notre
algorithme pour couvrir plus de caractères arabes et plus de scripteurs et
contribuer dans l’avancement des recherches dans le domaine de reconnaissance
de l’écriture manuscrite.
Références
https://www.memoireonline.com/09/09/2694/m_Systeme-de-reconnaissance-
hors-ligne-des-mots-manuscrits-arabe-pour-multi-scripteurs1.html

https://fr.scribd.com/document/378668808/La-reconnaissance-en-ligne-de-l-
ecriture-arabe-manuscrite

https://www.mathworks.com/support/search.html/answers/36042-how-can-
i-save-images-in-a-loop.html?fq=asset_type_name:answer
%20category:matlab/images_btfntr_-1&page=1

https://fr.wikipedia.org/wiki/Reconnaissance_de_l'%C3%A9criture_manus
crite

https://members.loria.fr/ABelaid/publis/pour_la_science.pdf

G. Tremblay, «Optimisation d’ensemble de classifieurs non paramétriques


avec apprentissage par représentation partielle de l’information», Thèse de
doctorat, Ecole de technologie supérieure, Université du Québec, 2004.

Vous aimerez peut-être aussi