0% ont trouvé ce document utile (0 vote)

65 vues22 pages

OCR Extraction Index Compteur

L'article analyse l'utilisation de la reconnaissance optique de caractères (OCR) pour l'extraction automatisée des index de compteurs, soulignant son rôle essentiel dans la transformation numérique des services publics. Il décrit les étapes clés du processus OCR, y compris l'acquisition d'images, le prétraitement, la reconnaissance de caractères et le post-traitement, tout en mettant en avant l'importance de techniques de prétraitement avancées pour surmonter les défis environnementaux. Enfin, l'article souligne que l'évolution vers des systèmes OCR basés sur l'apprentissage profond améliore la précision et l'efficacité de la lecture des compteurs.

Transféré par

manuel.kenne

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

65 vues22 pages

OCR Extraction Index Compteur

Transféré par

manuel.kenne

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

Extraction de l'Index d'un Compteur via la Méthode OCR :

Une Analyse Approfondie des Architectures et des

Techniques

1. Introduction : L'Impératif de la Lecture Automatisée des

Compteurs (AMR) via l'OCR

La lecture automatisée des compteurs (AMR) est devenue une composante

essentielle de la gestion moderne des services publics, et la reconnaissance optique
de caractères (OCR) est au cœur de cette transformation. L'OCR est une technologie
conçue pour convertir divers types de documents, tels que les papiers scannés, les
PDF ou les images capturées par des appareils photo numériques, en données
numériques éditables et consultables.1 Elle y parvient en exploitant des algorithmes
d'apprentissage automatique, de traitement d'image et de reconnaissance de formes
pour interpréter et extraire le texte du contenu visuel.2 Fondamentalement, l'OCR
transforme les images de texte en formats lisibles par machine 4, permettant aux
ordinateurs de "lire" et d'interpréter les caractères.6

L'application de l'OCR à la lecture des compteurs de services publics automatise le

processus d'extraction et d'analyse des données de compteurs, les transformant
instantanément en informations numériques.6 Cette automatisation offre des
avantages considérables, notamment une réduction du temps de traitement pouvant
atteindre 70 % et une précision d'extraction des données allant jusqu'à 99 %.7 Elle
rationalise les opérations en minimisant la saisie manuelle des données, ce qui se
traduit par des cycles de facturation plus rapides et une charge administrative
réduite.5 De plus, elle contribue à une amélioration de la satisfaction client grâce à
une facturation précise et sans erreur, et soutient les initiatives de durabilité en
réduisant les processus basés sur le papier.6

Le passage de la lecture manuelle à la lecture des compteurs basée sur l'OCR

représente une étape cruciale dans la transformation numérique des opérations des
services publics. La lecture manuelle des compteurs est traditionnellement une tâche
chronophage, sujette aux erreurs et inefficace, en particulier avec de grands volumes
de données.9 L'automatisation de ce processus par l'OCR conduit à une efficacité
accrue, une meilleure précision et une réduction significative de l'effort humain.6
Cette évolution n'est pas simplement une mise à niveau technologique, mais un
changement fondamental dans les paradigmes opérationnels, passant de processus
analogiques centrés sur l'humain à des processus numériques automatisés. Cette
implication plus large s'étend au-delà de la simple lecture des compteurs pour
englober l'ensemble de la chaîne de valeur des services publics, impactant la
facturation, le service client et même l'analyse énergétique 6, soulignant le rôle de
l'OCR en tant que technologie fondamentale pour une gestion intelligente des
services publics.

2. Principes Fondamentaux de la Reconnaissance Optique de

Caractères (OCR) pour les Données Numériques

Le processus OCR est une chaîne d'étapes qui convertit les informations visuelles en
texte lisible par machine.4 Ce pipeline comprend généralement l'acquisition d'images,
le prétraitement, la reconnaissance de texte (identification de caractères) et le post-
traitement.4

Composants Essentiels

● Acquisition d'Images : La première étape consiste à capturer l'image du

compteur. Cela peut être réalisé à l'aide de scanners, de caméras ou d'appareils
photo de téléphones mobiles.5 L'image est ensuite convertie en données binaires,
ce qui permet de distinguer le fond du texte.5
● Prétraitement : Cette étape cruciale vise à améliorer la qualité de l'image
numérique pour optimiser la précision de l'OCR. Les techniques employées
incluent le lissage des bords, la suppression du bruit numérique, la correction des
problèmes d'alignement 11, la conversion en niveaux de gris, la binarisation, la
dilatation, l'érosion, la correction du désalignement (de-skewing) et la
normalisation.2 L'objectif est de rendre le texte plus facile à discerner et de
réduire les erreurs.5
● Reconnaissance de Caractères : C'est le cœur de l'OCR, où le logiciel identifie
les caractères et les extrait de l'image.11 Ce processus implique la décomposition
des caractères en formes plus simples (lignes, courbes) et leur comparaison avec
des motifs prédéfinis (extraction de caractéristiques) ou l'utilisation
d'algorithmes d'apprentissage automatique.5 L'OCR traditionnelle repose sur la
reconnaissance de formes et la correspondance de modèles 5, tandis que les
approches modernes tirent parti de l'apprentissage profond.2
● Post-traitement : Cette étape finale rend le texte reconnu éditable, consultable
et lisible par machine.5 Elle comprend la correction des erreurs de
reconnaissance 8 et le formatage de la sortie.8 Pour les lectures de compteurs,
cela implique souvent la conversion du texte extrait en données structurées.6

Types d'OCR Spécialisés Pertinents pour la Lecture de Compteurs

Bien que l'OCR générale traite le texte imprimé 4, des formes spécialisées existent. La
reconnaissance intelligente de caractères (ICR) est conçue pour le texte manuscrit 4,
ce qui pourrait être pertinent pour certains types de compteurs ou annotations. La
reconnaissance optique de marques (OMR) identifie les marques telles que les cases
à cocher.11 Pour les lectures de compteurs, en particulier ceux avec des affichages à 7
segments, un logiciel OCR spécialisé comme SSOCR a été développé.20 Ce logiciel
utilise une région d'intérêt (ROI) basée sur les coordonnées X et Y pour définir
l'emplacement d'un nombre dans une image, et peut être configuré pour ignorer des
éléments comme les virgules afin d'améliorer la précision.20

La progression de l'OCR "simple" basée sur la correspondance de motifs et de

modèles vers des approches basées sur l'apprentissage profond 2 marque un
changement fondamental dans la manière dont la reconnaissance de caractères est
réalisée. Les premiers systèmes OCR fonctionnaient en stockant des motifs d'images
comme modèles et en comparant les caractères numérisés à ces modèles.11 Il
s'agissait d'une approche basée sur des règles ou la correspondance de motifs.
Cependant, les systèmes OCR plus avancés, y compris l'ICR et les solutions
modernes, "exploitent des algorithmes d'apprentissage automatique pour améliorer
continuellement leurs connaissances" 11, et l'apprentissage profond a apporté des
"contributions significatives aux secteurs de la vision par ordinateur et du traitement
du langage naturel" pour l'extraction de données.4 Les architectures de
transformeurs sont spécifiquement mises en avant pour améliorer la précision et
l'efficacité de la reconnaissance de texte.3 Cela indique une transition des règles
rigides et prédéfinies vers des modèles adaptatifs basés sur l'apprentissage qui
peuvent mieux généraliser les variations de polices, de styles et de conditions
d'image. Cette adaptabilité est essentielle pour les applications du monde réel
comme la lecture de compteurs, où les conditions sont rarement idéales. Cette
évolution implique que l'OCR moderne ne se limite pas à la lecture de caractères
isolés, mais à la compréhension de leur contexte et de leurs variations, ce qui la rend
plus robuste et polyvalente pour les tâches complexes. Cela suggère également que
la "précision" d'un système OCR n'est pas statique, mais peut s'améliorer avec le
temps grâce à davantage de données et à un apprentissage avancé.

Tableau 1 : Étapes Clés du Processus OCR pour la Lecture de Compteurs

Étape Description Générale Fonction Spécifique Références

pour la Lecture de
Compteurs

Acquisition Capture du Capture de l'image 5

d'Images document visuel du compteur

source. (souvent par caméra
mobile) et conversion
en données
numériques.

Prétraitement Amélioration de la Correction du 2

qualité de l'image désalignement,

pour optimiser la réduction du bruit,
reconnaissance. amélioration du
contraste,
binarisation pour
rendre les chiffres
plus lisibles.

Détection de la Identification des Localisation précise 20

Région d'Intérêt zones pertinentes de l'affichage

(ROI) contenant le texte à numérique ou du
extraire. cadran du compteur
pour isoler les
chiffres.

Reconnaissance de Identification des Conversion des 5

Caractères caractères images de chiffres en

individuels ou des valeurs numériques,
séquences de texte. souvent avec des
modèles
d'apprentissage
profond pour la
robustesse.

Post-traitement et Correction des Vérification de la 7

Validation erreurs, formatage et plausibilité des

vérification de la lectures, application
cohérence des de règles métier (ex:
données extraites. le relevé ne doit pas
diminuer), formatage
des données pour
l'intégration.

3. Prétraitement Avancé des Images pour une OCR Robuste des

Compteurs

La précision de l'OCR dépend fortement de la qualité de l'image source.17 Les images

floues, de faible résolution ou déformées peuvent entraîner une interprétation
erronée ou illisible du texte, réduisant considérablement la précision de l'OCR.22 Les
images de compteurs dans le monde réel présentent des défis divers, notamment des
variations d'éclairage, de résolution, d'arrière-plan, ainsi que des positions et des
angles de rotation imprévisibles.24 L'accumulation de poussière, les gouttelettes d'eau
et les obstructions physiques compliquent davantage les lectures précises.24

Techniques de Prétraitement Essentielles

Pour contrer ces problèmes, une série de techniques de prétraitement est appliquée :
● Normalisation : Ajuste les valeurs d'intensité des pixels à une plage standard, ce
qui rend l'image plus "normale" pour le traitement.2
● Correction du Désalignement (Deskewing) : Corrige les images inclinées ou
penchées, garantissant que le texte est aligné horizontalement ou verticalement.
Cette étape est cruciale pour une segmentation précise des lignes.2
● Mise à l'Échelle de l'Image : Assure que l'image a une résolution suffisante,
généralement au moins 300 DPI (points par pouce), pour des performances OCR
optimales. Une DPI inférieure peut entraîner des résultats peu clairs, tandis
qu'une DPI excessivement élevée augmente inutilement la taille du fichier.14
● Suppression du Bruit : Élimine les petits points, taches ou distorsions
indésirables (comme les ombres ou les taches) qui peuvent réduire
considérablement la qualité de l'OCR. Des filtres comme le flou gaussien ou le
filtrage médian sont utilisés.2
● Binarisation : Convertit les images couleur ou en niveaux de gris en images noir
et blanc (binaires), simplifiant l'image et améliorant le contraste entre les
caractères et l'arrière-plan.2 Il s'agit souvent d'une étape interne pour les
moteurs OCR, mais un contrôle externe peut améliorer la précision.17
● Amélioration du Contraste : Augmente la différence entre le texte et l'arrière-
plan, ce qui est vital pour les chiffres estompés ou les arrière-plans inégaux.17

Atténuation des Défis Environnementaux : Stratégies pour l'Éblouissement, la

Réflexion et la Saleté

Des facteurs environnementaux spécifiques exigent un prétraitement ciblé :

● Éblouissement et Réflexion : La lumière directe sur les couvercles des
compteurs peut provoquer des reflets qui obscurcissent les chiffres.15 Les
stratégies incluent l'utilisation de diffuseurs entre la source lumineuse et le
compteur pour produire un éclairage diffus.15 Des solutions avancées exploitent
l'apprentissage profond, comme les réseaux neuronaux convolutifs (CNN), pour
détecter et supprimer les reflets des images de documents.27 Une sélection
minutieuse de l'éclairage, comme l'éclairage coaxial-vertical pour les surfaces
brillantes, peut également accentuer la différence entre la surface et
l'inscription.28
● Saleté et Obstructions Physiques : L'accumulation de poussière et d'autres
objets étrangers sur l'affichage du compteur peut masquer les chiffres.24 Les
filtres de réduction du bruit sont directement applicables ici.26 Les techniques
d'amélioration d'image, y compris les algorithmes de défloutage et la
normalisation de l'éclairage, sont cruciales pour améliorer la précision de la
reconnaissance dans des conditions défavorables.24

Le prétraitement générique de l'OCR est insuffisant pour la lecture des compteurs

dans le monde réel ; les défis spécifiques au domaine tels que l'éblouissement et la
saleté nécessitent des techniques d'amélioration d'image hautement adaptées. Les
techniques générales de prétraitement de l'OCR (binarisation, correction du
désalignement, suppression du bruit) sont bien établies.2 Cependant, les images de
compteurs sont confrontées à des défis uniques tels que l'éblouissement, la réflexion,
la saleté, l'éclairage variable et les angles imprévisibles.22 Des techniques spécialisées
sont mentionnées pour ces problèmes, comme les diffuseurs pour la réflexion 15, les
CNN pour la suppression des reflets 27 et l'amélioration avancée de l'image pour la
saleté.24 Cela implique qu'une approche de prétraitement "taille unique" est inefficace
pour cette application spécifique. Le succès de l'OCR de compteurs repose sur
l'adaptation du traitement d'image aux caractéristiques visuelles uniques et aux
conditions environnementales des compteurs. Cela met en évidence l'importance de
l'expertise du domaine dans les applications de vision par ordinateur. Cela suggère
que les systèmes OCR pratiques et de haute précision pour des domaines de niche
impliquent souvent une boucle de rétroaction continue entre les défis de déploiement
et le développement de techniques spécialisées de prétraitement et d'entraînement
de modèles.

Tableau 2 : Impact des Techniques de Prétraitement d'Image sur la Précision de

l'OCR de Compteurs

Technique Description Défi OCR Impact sur la Références

Adressé (pour Précision de
les Compteurs) Lecture du
Compteur

Conversion en Réduit la Simplifie l'image Améliore la 2

Niveaux de complexité de pour la distinction des

Gris l'image en détection des chiffres du fond,
supprimant les caractères, réduisant les
informations de améliore la erreurs dues à
couleur. robustesse aux la complexité
variations de visuelle.
couleur.
Binarisation Convertit Augmente le Crée des bords 2

l'image en noir contraste entre de caractères

et blanc pur. le texte et nets, facilitant
l'arrière-plan, l'isolation et la
crucial pour les reconnaissance
chiffres des chiffres.
estompés ou les
fonds
complexes.

Réduction du Élimine les Gère la Permet à l'OCR 2

Bruit pixels poussière, les de se

indésirables saletés, les concentrer sur
(taches, grain, artefacts de les vrais
distorsions). capture d'image chiffres, évitant
(flou, grain). les
interprétations
erronées dues
aux marques
parasites.

Correction du Redresse les Corrige les Assure que les 2

Désalignement images inclinées images prises chiffres sont

(Deskewing) ou penchées. sous un angle, traités dans leur
les compteurs orientation
mal alignés. standard,
améliorant la
reconnaissance.

Mise à l'Échelle Ajuste la Gère les images Garantit une 14

de l'Image résolution de de faible clarté suffisante

l'image (DPI). résolution ou les des chiffres
variations de (min. 300 DPI)
taille. pour une
reconnaissance
précise.

Amélioration Augmente la Compense les Rend les chiffres 17

du Contraste différence chiffres pâles, plus distincts,

d'intensité entre l'éclairage même dans des
les chiffres et le faible, les reflets conditions
fond. subtils. d'éclairage
difficiles,
améliorant la
détection.

Atténuation de Utilisation de Gère les reflets Réduit les zones 15

l'Éblouissemen diffuseurs ou de sur le couvercle masquées par la

t/Réflexion techniques du compteur, lumière,
d'éclairage l'éblouissement. exposant les
spécifiques. chiffres pour
une
reconnaissance
complète.

Suppression de Techniques Gère Améliore la 24

la d'amélioration l'accumulation lisibilité des

Saleté/Obstruc d'image de poussière, chiffres
tions avancées les gouttelettes masqués ou
(défloutage, d'eau, les déformés par
normalisation). obstructions des facteurs
physiques. environnementa
ux.

4. Architectures d'Apprentissage Profond pour une

Reconnaissance Précise de l'Index du Compteur

Détection de la Région d'Intérêt (ROI) : Localisation de l'Affichage du Compteur

L'identification précise de la zone d'affichage du compteur (Région d'Intérêt) est une

première étape cruciale dans la lecture automatisée des compteurs.20 Cela garantit
que le moteur OCR se concentre uniquement sur les chiffres pertinents, ignorant le
désordre environnant.17 L'apprentissage profond, en particulier les réseaux neuronaux
convolutifs (CNN), a révolutionné la détection de la ROI.

Des modèles comme YOLO (You Only Look Once), spécifiquement YOLOv8, sont
très efficaces pour détecter la région du compteur dans les images de compteurs
d'eau grâce à leur précision et leur efficacité computationnelle.24 L'

algorithme YOLOX-DC, basé sur YOLOX, utilise une tête de détection circulaire
découplée, qui est plus précise que les boîtes englobantes rectangulaires
traditionnelles pour identifier les cadrans de compteurs à aiguille circulaires et
contient moins d'informations d'arrière-plan.31

Faster R-CNN (Réseau neuronal convolutif basé sur les régions) est une autre
architecture puissante. Un algorithme Faster R-CNN amélioré, utilisant ResNet50
combiné à un réseau de pyramide de caractéristiques (FPN) et à ROI Align (au lieu de
ROI Pooling), a atteint une précision de reconnaissance de 91,8 % pour la détection
des chiffres de compteurs d'eau.32 Le FPN améliore la précision pour les cibles de
chiffres de petite taille en utilisant les informations de toutes les couches de
caractéristiques, tandis que ROI Align élimine les erreurs de quantification lors de la
projection des boîtes candidates.32 Alors que les méthodes traditionnelles comme la
transformée de Hough et la correspondance de modèles étaient utilisées pour la
localisation des cadrans, elles souffrent souvent d'une faible précision dans les
arrière-plans complexes et manquent de flexibilité.31 Les modèles d'apprentissage
profond surmontent ces limitations en apprenant des caractéristiques robustes
directement à partir des données.

Modèles Avancés de Segmentation et de Reconnaissance de Caractères

Une fois la ROI détectée, l'étape suivante consiste à segmenter les chiffres individuels
et à les reconnaître. Les modèles d'apprentissage profond ont considérablement fait
progresser ce domaine.
● Le Rôle des Transformeurs (TrOCR) et autres Approches d'Apprentissage
Profond : Les transformeurs ont révolutionné le traitement du langage naturel
(NLP) et sont de plus en plus appliqués aux tâches de vision par ordinateur, y
compris l'OCR.33 Ils traitent toutes les parties des données d'entrée
simultanément, capturant des relations complexes plus efficacement que les
approches précédentes comme les RNN et les LSTM.34 Le
TrOCR (Transformer-based Optical Character Recognition) est une
application spécifique pour la segmentation et la reconnaissance des chiffres
dans des environnements difficiles.24 Ces modèles sont intégrés aux systèmes
OCR pour reconnaître et traiter les séquences numériques extraites des
affichages des compteurs.24 D'autres techniques basées sur les CNN comme PP-
OCRv3 et RobustScanner montrent également des performances supérieures
dans des conditions difficiles.24
● Comprendre les Mécanismes d'Attention et l'Encodage Positionnel dans le
Contexte :
○ Mécanismes d'Attention : Au cœur des Transformeurs se trouve le
mécanisme d'attention, qui permet au modèle de pondérer l'importance de
différentes parties de la séquence d'entrée.38
■ L'Auto-Attention (Intra-attention) permet au modèle de prendre en
compte différentes positions au sein de la même séquence lors de la
construction d'une représentation d'un mot ou d'un chiffre particulier.38
Elle calcule les scores d'attention en prenant le produit scalaire des
vecteurs de Requête (Q) et de Clé (K) pour chaque jeton, représentant
leur pertinence.40 Cela permet de capturer efficacement les dépendances
à longue portée.35
■ L'Attention Multi-Têtes améliore la capacité du modèle à se concentrer
simultanément sur différentes parties de l'entrée en incorporant plusieurs
"têtes d'attention", chacune avec ses propres matrices Q, K et V.38 Cela
permet de capturer diverses caractéristiques et dépendances.38
○ Encodage Positionnel : Les Transformeurs traitent les jetons en parallèle, ce
qui accélère l'entraînement mais signifie qu'ils ne capturent pas
intrinsèquement l'ordre des jetons.35 L'encodage positionnel résout ce
problème en ajoutant des informations sur la position de chaque jeton dans la
séquence, aidant le modèle à comprendre les relations et l'ordre.38 Ceci est
généralement réalisé à l'aide de fonctions sinus et cosinus qui créent des
motifs ondulatoires uniques pour chaque position.42 Sans cela, les
permutations des mêmes chiffres seraient indiscernables.40
● BERT (Encodeur) vs. GPT (Décodeur) pour le Contexte :
○ BERT (Bidirectional Encoder Representations from Transformers) :
N'utilise que la partie encodeur de l'architecture du Transformeur.39 Il dérive
un contexte bidirectionnel profond en traitant les mots en relation avec tous
les autres mots d'une phrase (contexte gauche et droit), en utilisant un
mécanisme de "modélisation du langage masqué" (MLM).43 BERT est non
génératif et excelle dans les tâches nécessitant une compréhension, comme
l'analyse de sentiments ou la réponse aux questions.39 Pour l'OCR, sa
compréhension bidirectionnelle des séquences de caractères pourrait être
très bénéfique pour une reconnaissance robuste des chiffres.
○ GPT (Generative Pre-trained Transformer) : N'utilise que la partie
décodeur du Transformeur.39 C'est un modèle autorégressif, prédisant le mot
suivant en fonction des mots précédents (contexte unidirectionnel).37 GPT est
fondamentalement génératif, excellant dans les tâches de génération de
texte.37 Bien que TrOCR utilise une architecture de transformeur pour la
reconnaissance, sa conception spécifique pour la reconnaissance de
caractères plutôt que la génération s'aligne davantage avec les capacités de
compréhension contextuelle de BERT, adaptées aux séquences d'entrée
visuelles.

Le passage de la correspondance de motifs traditionnelle aux modèles

d'apprentissage profond, en particulier les Transformeurs avec attention et encodage
positionnel, modifie fondamentalement la manière dont les lectures de compteurs
sont interprétées. Il passe de la reconnaissance de chiffres isolés à la compréhension
de l'ensemble de la séquence numérique dans son contexte. Alors que l'OCR
traditionnelle repose souvent sur la comparaison de caractères individuels à des
modèles 11, les modèles d'apprentissage profond comme les CNN et les
Transformeurs sont utilisés pour la détection et la reconnaissance des chiffres.24 Les
Transformeurs utilisent l'auto-attention 40 et l'encodage positionnel 42 pour capturer
les relations entre les éléments au sein de la

même séquence et comprendre leur ordre, respectivement. Cela signifie que les
systèmes modernes n'identifient pas seulement un "5" ou un "2" de manière isolée,
mais comprennent "523" comme un nombre cohérent. Le modèle apprend les
dépendances entre les chiffres (par exemple, comment un "1" peut apparaître
différemment lorsqu'il est suivi d'un "0" ou d'un "7" dans une police ou un type
d'affichage spécifique) et leur ordre précis. Cette compréhension contextuelle
avancée est cruciale pour améliorer la précision dans des scénarios difficiles comme
les transitions de demi-chiffres 24 ou lors de l'utilisation de polices ou de types
d'affichage variés.44 Elle permet des systèmes de lecture de compteurs plus robustes
et intelligents qui peuvent inférer le sens de l'ensemble de la séquence, plutôt que de
simples caractères individuels.

Tableau 3 : Analyse Comparative des Modèles d'Apprentissage Profond pour la

Reconnaissance des Chiffres de Compteurs

Type de Caractéristiques Avantages pour Limitations/ Références

Modèle/Architec Clés la Lecture de Défis
ture Compteurs

CNNs Apprentissage Détection et Peut avoir du 24

(Général) de hiérarchies segmentation mal avec les

spatiales de efficaces des dépendances à
caractéristiques régions longue portée
; traitement numériques et ou les variations
d'images. des chiffres. d'échelle
extrêmes.

YOLO (You Détection Détection Moins précis 24

Only Look d'objets en rapide et pour les objets

Once) temps réel, efficace de la très petits ou
prédiction de région du dans des scènes
boîtes compteur très
englobantes. (YOLOv8) ou du encombrées par
cadran (YOLOX- rapport à
DC) ; bonne d'autres
efficacité détecteurs à
computationnell deux étapes.
e.

Faster R-CNN Détection Haute précision Plus lent que les 32

d'objets en deux pour la modèles à une

étapes détection de étape comme
(proposition de chiffres, même YOLO ; peut
région puis de petite taille, être gourmand
classification). grâce à FPN et en ressources.
ROI Align.

Transformeurs Mécanismes Excellent pour la Nécessite des 37

(TrOCR) d'auto-attention reconnaissance ressources

et encodage de séquences computationnell
positionnel ; de caractères ; es substantielles
traitement capture les ; complexité de
parallèle. dépendances l'entraînement.
contextuelles au
sein de la
lecture
numérique.

BERT Contexte Compréhension Non génératif ; 39

(Encodeur bidirectionnel robuste des nécessite des

Transformer) profond via relations entre couches
masquage les chiffres dans supplémentaires
linguistique. une séquence pour des tâches
numérique, spécifiques
même avec des comme la
variations. reconnaissance
visuelle.

GPT (Décodeur Modèle Excellent pour la Contexte 37

Transformer) autorégressif, génération de unidirectionnel

contexte texte cohérent limite la
unidirectionnel. (moins pertinent compréhension
pour la globale de la
reconnaissance séquence pour
pure de la
chiffres). reconnaissance.

5. Post-traitement et Validation pour une Extraction de Données

de Compteurs de Haute Précision

Le post-traitement est une étape essentielle pour améliorer la précision des résultats
de l'OCR et garantir que le texte extrait est aussi précis que possible.12 Cela implique
la détection et la correction des fautes d'orthographe 12 et la comparaison du texte
extrait avec une bibliothèque de caractères pour identifier les erreurs
grammaticales.12 Pour les lectures de compteurs, cela signifie s'assurer que la
séquence numérique extraite est correcte. Le résultat est ensuite formaté en
données structurées, souvent sous forme de paires clé-valeur, pour une analyse plus
approfondie et une intégration dans les systèmes.7

Mise en Œuvre de Règles de Validation et de Contrôles de Cohérence

Au-delà de la simple correction d'erreurs, des règles de validation robustes sont

essentielles pour une extraction de données de compteurs de haute précision. Cela
inclut :
● Estimation de la Plage : Pour les compteurs à aiguille, un algorithme
d'estimation de la plage peut améliorer la précision en déterminant la plage valide
du compteur cible.25
● Contrôles de Cohérence : Validation des valeurs extraites par rapport aux
formats attendus, aux données historiques ou aux règles métier prédéfinies.8 Par
exemple, un relevé de compteur ne devrait généralement pas diminuer, ou il
devrait se situer dans une plage de consommation plausible.
● Règles de Paires Clé-Valeur : Des règles peuvent être établies pour détecter et
extraire des segments de texte contenant des clés spécifiques (par exemple,
"Relevé du Compteur :") et leurs valeurs correspondantes.4 Cela garantit que
l'index numérique correct est associé au compteur.

Vérification Optique de Caractères (OCV) pour une Fiabilité Améliorée

La vérification optique de caractères (OCV) est une technologie connexe utilisée pour
comparer les caractères marqués à une "chaîne de jugement" pour une évaluation de
réussite/échec.45 Alors que l'OCR lit les caractères, l'OCV vérifie leur exactitude par
rapport à une norme connue. Dans le contexte des lectures de compteurs, cela
pourrait impliquer la comparaison de l'index extrait par OCR avec un motif connu ou
une plage attendue, ou même avec une deuxième passe OCR pour la redondance.
Cela est particulièrement précieux dans les applications industrielles pour l'assurance
qualité et la prévention des erreurs.45

L'Humain dans la Boucle (HITL)

Pour les documents signalés ou les extractions incertaines, l'intervention humaine

("Human-in-the-loop") est cruciale pour l'extraction et la validation des données les
plus précises.4 Cette approche hybride garantit que le système peut gérer les cas
complexes ou ambigus, maintenant une grande précision tout en automatisant la
majorité du processus.

Même avec l'apprentissage profond avancé, l'OCR pour les applications critiques
comme la lecture de compteurs n'est pas un système entièrement autonome de type
"configurer et oublier". Il s'agit d'une approche hybride où l'IA améliore l'efficacité,
mais la supervision humaine et les règles de validation spécifiques au domaine
restent vitales pour maintenir une grande précision et la confiance. Les systèmes
OCR offrent des avantages significatifs en matière d'automatisation, tels que la
réduction de la saisie manuelle des données et un traitement plus rapide.5
Cependant, malgré les affirmations de haute précision (jusqu'à 99 % dans certains
cas 7), l'accent est fortement mis sur le post-traitement, les règles de validation 8 et
l'OCV.45 Le concept d'"Humain dans la boucle" est explicitement mentionné pour les
documents signalés.4 Cela indique que pour les applications à enjeux élevés comme la
facturation des services publics, la précision et la fiabilité absolues sont primordiales.
Bien que l'IA gère la majeure partie du travail, une couche de vérification humaine,
soutenue par des règles de validation intelligentes, est nécessaire pour détecter les
cas limites, les ambiguïtés ou les erreurs que même les modèles avancés pourraient
manquer. Cela suggère que l'avenir de l'IA dans de telles applications n'est pas
nécessairement l'automatisation complète, mais plutôt une augmentation intelligente,
où l'IA permet aux opérateurs humains d'être plus efficaces et précis, plutôt que de
les remplacer entièrement. Cela souligne également la nécessité de mécanismes
robustes de gestion des erreurs et de contrôle qualité dans la conception des
systèmes.

6. Défis et Trajectoires Futures dans l'Extraction Automatisée de

l'Index des Compteurs

Adresser les Conditions d'Imagerie Complexes et la Variabilité des Données

Malgré des avancées significatives, l'automatisation des lectures de compteurs est

toujours confrontée à des défis considérables, principalement en raison des
conditions environnementales très variables et souvent difficiles.24 Ceux-ci incluent :
● Éclairage Divers : Les images prises sous un éclairage variable (jour/nuit,
ombres, éblouissement) peuvent gravement affecter la reconnaissance des
chiffres.22
● Résolution et Arrière-plans Variables : Les images de faible résolution et les
arrière-plans complexes et incohérents compliquent l'analyse.24
● Positions et Angles de Compteur Imprévisibles : Les pages inclinées ou les
images capturées sous des angles non idéaux déforment les chiffres et rendent
la segmentation difficile.22
● Obstructions Physiques : L'accumulation de poussière, les gouttelettes d'eau et
les objets étrangers sur l'affichage du compteur peuvent masquer les chiffres.24
● Transitions de Demi-Chiffres : L'interprétation précise des chiffres pendant
leurs états de transition (par exemple, entre 8 et 9) est complexe.24
● Polices et Jeux de Caractères Spécifiques : Certaines polices spécialisées (par
exemple, les affichages à 7 segments, OCR-A/B) ou les caractères non standard
peuvent être difficiles pour les moteurs OCR généraux.20
● Variabilité du Format des Données : Les services publics traitent de grands
volumes de données dans des formats divers (structurés, semi-structurés, non
structurés), ce qui pose des défis d'intégration.47

Considérations de Scalabilité, d'Adaptabilité et d'Intégration

Les solutions doivent être évolutives pour s'adapter aux volumes croissants d'images
de lecture de compteurs et adaptables aux améliorations futures.9 L'intégration avec
les systèmes hérités existants au sein des services publics est également un défi
courant.47 Les besoins en traitement de données en temps réel augmentent, poussant
à des systèmes plus rapides et plus efficaces.47 Les préoccupations en matière de
sécurité et de confidentialité sont primordiales lors de la manipulation de données
clients et opérationnelles sensibles.22

Recherche et Développement Émergents dans l'OCR de Compteurs

La recherche future vise à développer des solutions plus robustes en :

● Amélioration Avancée de l'Image : Intégration de techniques telles que les
algorithmes de défloutage, la normalisation de l'éclairage et la suppression du
bruit.24 Les réseaux antagonistes génératifs (GAN) sont explorés pour
l'amélioration de l'image dans des conditions défavorables.24
● Optimisation des Architectures Réseau : Développement de modèles hybrides
qui combinent les forces de différentes architectures d'apprentissage profond
(par exemple, CNN pour la détection, Transformeurs pour la reconnaissance)
pour gérer des séquences numériques étendues et une gamme plus large de
formats de compteurs.24
● Edge Computing : Implémentation de solutions d'apprentissage profond sur des
appareils périphériques (comme les téléphones mobiles) pour une lecture de
compteurs en temps réel et sur site, réduisant la dépendance au traitement dans
le cloud et améliorant l'efficacité.10
● Amélioration de la Généralisation : Se concentrer sur des modèles capables de
mieux généraliser à des types de compteurs et à des conditions
environnementales non vus.31

Les défis persistants dans l'OCR de lecture de compteurs, malgré les avancées
significatives de l'IA, mettent en évidence le problème du "dernier kilomètre" où les
performances théoriques des modèles se heurtent aux complexités imprévisibles des
environnements de déploiement réels. Les modèles d'apprentissage profond comme
YOLO et Faster R-CNN atteignent une grande précision dans des ensembles de
données contrôlés ou de référence.31 Cependant, de nombreux défis du monde réel
persistent : éclairage variable, flou, poussière, angles imprévisibles et transitions de
demi-chiffres.24 Ceux-ci sont souvent difficiles à simuler entièrement dans les
données d'entraînement. Cela indique un écart entre les performances idéalisées des
modèles et un déploiement pratique et robuste. Le défi principal passe de "le modèle
peut-il reconnaître les caractères?" à "le modèle peut-il reconnaître les caractères de
manière fiable dans

n'importe quelle condition du monde réel?". Cela implique que la recherche et le

développement futurs se concentreront de plus en plus sur la résilience des systèmes
d'IA au "bruit" et à la variabilité de leurs environnements d'exploitation,
potentiellement grâce à une augmentation plus avancée des données, des
techniques d'adaptation de domaine et des fonctions de perte robustes qui
pénalisent plus lourdement les erreurs du monde réel. Cela souligne également
l'importance de la collaboration interdisciplinaire entre les chercheurs en IA et les
experts du domaine (par exemple, les ingénieurs des services publics) pour
comprendre et résoudre ces limitations pratiques.
Conclusion

L'extraction de l'index d'un compteur par la méthode OCR représente une avancée
majeure vers la numérisation et l'optimisation des opérations des services publics. En
automatisant la lecture des compteurs, cette technologie réduit considérablement les
erreurs manuelles, accélère les cycles de facturation et améliore la satisfaction des
clients. Le parcours de l'OCR, des systèmes basés sur des règles simples aux
architectures d'apprentissage profond sophistiquées comme les Transformeurs,
démontre une évolution vers une compréhension contextuelle plus profonde et une
plus grande adaptabilité aux défis du monde réel.

Le succès de l'OCR pour la lecture de compteurs repose sur une chaîne d'étapes
interconnectées, de l'acquisition d'images de haute qualité à un post-traitement
rigoureux et à des mécanismes de validation. Le prétraitement avancé des images est
indispensable pour atténuer les problèmes inhérents aux environnements réels, tels
que l'éblouissement, la saleté et les variations d'éclairage. Les architectures
d'apprentissage profond, notamment les CNN pour la détection de la région d'intérêt
(ROI) et les Transformeurs pour la reconnaissance des caractères, permettent une
précision inégalée en allant au-delà de la reconnaissance isolée des chiffres pour
interpréter des séquences numériques entières avec un contexte.

Cependant, malgré ces avancées, le "dernier kilomètre" du déploiement de l'IA dans

des environnements imprévisibles présente toujours des défis importants.
L'intégration de l'IA avec la supervision humaine, à travers des boucles "humain-
dans-la-boucle" et des règles de validation métier, reste essentielle pour garantir la
fiabilité et la confiance dans les données critiques. La recherche future se
concentrera sur l'amélioration de la robustesse des modèles face aux conditions
d'imagerie complexes, l'optimisation des architectures réseau pour une meilleure
généralisation et l'exploitation de l'edge computing pour un traitement en temps réel.
En fin de compte, l'extraction de l'index des compteurs par OCR est un témoignage
de la puissance de l'IA pour transformer les industries, à condition qu'elle soit
développée et déployée avec une compréhension approfondie des nuances du
domaine et un engagement envers une précision continue.

Sources des citations

1. pdf.abbyy.com, consulté le juin 12, 2025, https://pdf.abbyy.com/learning-

center/what-is-ocr/#:~:text=In%20order%20to%20extract%20and,content
%20of%20the%20original%20document.
2. Study of Optical Character Recognition - Alochana Journal, consulté le juin 12,
2025, https://alochana.org/wp-content/uploads/37-AJ3083.pdf
3. OPTICAL CHARACTER RECOGNITION (OCR): A COMPREHENSIVE REVIEW -
IRJMETS, consulté le juin 12, 2025,
https://www.irjmets.com/uploadedfiles/paper//issue_7_july_2023/43530/final/
fin_irjmets1690334613.pdf
4. OCR Data Extraction: Definition, Features, and Methods - Label Your Data,
consulté le juin 12, 2025, https://labelyourdata.com/articles/ocr-data-extraction-
methods
5. OCR Algorithms: Types, Use Cases and Best Solutions - Itransition, consulté le
juin 12, 2025, https://www.itransition.com/computer-vision/ocr-algorithm
6. Extract Meter Readings with UGO OCR Based Billing System, consulté le juin 12,
2025, https://www.inventia.in/ocr-based-billing/
7. Utility Meter OCR - Meter Scanning & Data Capture - Klippa, consulté le juin 12,
2025, https://www.klippa.com/en/ocr/data-fields/utility-meters/
8. OCR: What is Optical Character Recognition? - Tecalis, consulté le juin 12, 2025,
https://www.tecalis.com/blog/ocr-optical-character-recognition-what-is-best-
free-systems-users-business-text-online
9. OCR - Venture Data, consulté le juin 12, 2025,
https://www.venturedata.ai/solutions/ocr
10. Deep Learning-Powered System for Real-Time Digital Meter Reading on Edge
Devices, consulté le juin 12, 2025, https://www.mdpi.com/2076-3417/13/4/2315
11. What is OCR and how does it work? | Adobe Acrobat, consulté le juin 12, 2025,
https://www.adobe.com/in/acrobat/roc/blog/what-is-ocr.html
12. Extracting text from images – how OCR (Optical Character Recognition) tools
work, consulté le juin 12, 2025, https://apix-drive.com/en/blog/useful/a-guide-to-
image-extraction-using-ocr-tools
13. Optical Character Recognition (OCR) - Text Mining & Analysis @ Pitt, consulté le
juin 12, 2025, https://pitt.libguides.com/textmining/ocr
14. Optical Character Recognition (OCR): An Introduction - Library Guides, consulté
le juin 12, 2025, https://guides.libraries.psu.edu/OCR
15. OpenCV practice: OCR for the electricity meter - Projects and papers by Martin
Kompf, consulté le juin 12, 2025, https://en.kompf.de/cplus/emeocv.html
16. Automatic Electricity Meter Reading Based on Image Processing - ResearchGate,
consulté le juin 12, 2025,
https://www.researchgate.net/publication/291345837_Automatic_Electricity_Met
er_Reading_Based_on_Image_Processing
17. Improve OCR Accuracy with Preprocessing Tips | Docparser, consulté le juin 12,
2025, https://docparser.com/blog/improve-ocr-accuracy/
18. Improve OCR accuracy using advanced preprocessing techniques - Nitor
Infotech, consulté le juin 12, 2025, https://www.nitorinfotech.com/blog/improve-
ocr-accuracy-using-advanced-preprocessing-techniques/
19. Best OCR Software - OCR Text & Handwriting Recognition - Esker, consulté le
juin 12, 2025, https://www.esker.com/cloud-technologies/OCR/
20. Capturing Data with Optical Character Recognition (OCR) – mypi ..., consulté le
juin 12, 2025, https://mypi.website/capturing-data-with-optical-character-
recognition-ocr/
21. 7 steps of image pre-processing to improve OCR using Python - NextGen Invent,
consulté le juin 12, 2025, https://nextgeninvent.com/blogs/7-steps-of-image-pre-
processing-to-improve-ocr-using-python-2/
22. The 6 Biggest OCR Problems and How to Overcome Them - Conexiom, consulté
le juin 12, 2025, https://conexiom.com/blog/the-6-biggest-ocr-problems-and-
how-to-overcome-them
23. OCR/OCV Control Descriptions - NI, consulté le juin 12, 2025,
https://www.ni.com/docs/en-US/bundle/ni-vision-assistant-help/page/
ocr_controls.html
24. (PDF) Water Meter Reading Based on Text Recognition Techniques and Deep
Learning, consulté le juin 12, 2025,
https://www.researchgate.net/publication/389521227_Water_Meter_Reading_Bas
ed_on_Text_Recognition_Techniques_and_Deep_Learning
25. Post-OCR output in key value format for Sticker C subset ..., consulté le juin 12,
2025, https://www.researchgate.net/figure/Post-OCR-output-in-key-value-
format-for-Sticker-C-subset_tbl1_371776211
26. Fundamentals of Image Processing Filters | KEYENCE America, consulté le juin 12,
2025, https://www.keyence.com/products/vision/vision-sys/resources/vision-sys-
resources/fundamentals-of-image-processing-filters.jsp
27. Document Flare Remover - AWS Marketplace - Amazon.com, consulté le juin 12,
2025, https://aws.amazon.com/marketplace/pp/prodview-xpraiswle2kiu
28. Basics of Lighting Selection in Machine Vision Inspection | KEYENCE America,
consulté le juin 12, 2025,
https://www.keyence.com/products/vision/vision-sys/resources/vision-sys-
resources/basics-of-lighting-selection.jsp
29. Image variation found in the images of meters - ResearchGate, consulté le juin 12,
2025, https://www.researchgate.net/figure/Image-variation-found-in-the-
images-of-meters_fig3_363861287
30. Low-Light Image and Video Enhancement: A Comprehensive Survey and Beyond
- arXiv, consulté le juin 12, 2025, https://arxiv.org/html/2212.10772v5
31. Deep Learning-Based Pointer Meter Reading Recognition for ..., consulté le juin
12, 2025, https://www.mdpi.com/1424-8220/25/1/244
32. Detection of Water Meter Digits Based on Improved Faster R-CNN, consulté le
juin 12, 2025, https://www.scirp.org/journal/paperinformation?paperid=131633
33. What are Transformers in Artificial Intelligence? - AWS, consulté le mai 24, 2025,
https://aws.amazon.com/what-is/transformers-in-artificial-intelligence/
34. Transformer vs. LSTM: 4 Key Differences and How to Choose - Kolena, consulté
le mai 24, 2025, https://www.kolena.com/guides/transformer-vs-lstm-4-key-
differences-and-how-to-choose/
35. RNN vs LSTM vs GRU vs Transformers | GeeksforGeeks, consulté le mai 24, 2025,
https://www.geeksforgeeks.org/rnn-vs-lstm-vs-gru-vs-transformers/
36. www.netguru.com, consulté le mai 24, 2025,
https://www.netguru.com/blog/transformer-models-in-nlp#:~:text=Transformer
%20models%20have%20revolutionized%20the,translation%2C
%20summarization%2C%20and%20conversation.
37. Transformer Models in Natural Language Processing - Netguru, consulté le mai
24, 2025, https://www.netguru.com/blog/transformer-models-in-nlp
38. Architecture and Working of Transformers in Deep Learning ..., consulté le mai
24, 2025, https://www.geeksforgeeks.org/architecture-and-working-of-
transformers-in-deep-learning/
39. Foundation Models, Transformers, BERT and GPT | Niklas Heidloff, consulté le mai
24, 2025, https://heidloff.net/article/foundation-models-transformers-bert-and-
gpt/
40. How Positional Embeddings work in Self-Attention | GeeksforGeeks, consulté le
mai 24, 2025, https://www.geeksforgeeks.org/working-of-positional-embedding-
in-self-attention/
41. Transformer Attention Mechanism in NLP | GeeksforGeeks, consulté le mai 24,
2025, https://www.geeksforgeeks.org/transformer-attention-mechanism-in-nlp/
42. Positional Encoding in Transformers | GeeksforGeeks, consulté le mai 24, 2025,
https://www.geeksforgeeks.org/positional-encoding-in-transformers/
43. Differences Between GPT and BERT | GeeksforGeeks, consulté le mai 24, 2025,
https://www.geeksforgeeks.org/differences-between-gpt-and-bert/
44. Optical character recognition - Wikipedia, consulté le juin 12, 2025,
https://en.wikipedia.org/wiki/Optical_character_recognition
45. OCR Verification and Character Inspection | KEYENCE America, consulté le juin
12, 2025, https://www.keyence.com/products/vision/vision-sys/applications/ocr-
verification-and-character-inspection.jsp
46. Digit recognition with Tesseract OCR and python - Stack Overflow, consulté le
juin 12, 2025, https://stackoverflow.com/questions/32755943/digit-recognition-
with-tesseract-ocr-and-python
47. Data Extraction in Utilities: Use Cases, Documents, Best Practices - Docsumo,
consulté le juin 12, 2025,
https://www.docsumo.com/blogs/data-extraction/utilities-industry

Vous aimerez peut-être aussi

V1
Pas encore d'évaluation
V1
7 pages
Facture OCR
Pas encore d'évaluation
Facture OCR
36 pages
Évaluation des performances OCR en numérisation
Pas encore d'évaluation
Évaluation des performances OCR en numérisation
47 pages
Reconnaissance de Textes Manuscrits Par Machine Learning
Pas encore d'évaluation
Reconnaissance de Textes Manuscrits Par Machine Learning
32 pages
Final Project
100% (1)
Final Project
56 pages
Modèle Cahier de Charges Pour Projet Logiciel de Reconnaissance de Caractére Optique
Pas encore d'évaluation
Modèle Cahier de Charges Pour Projet Logiciel de Reconnaissance de Caractére Optique
3 pages
Developpent D'une Application OCR en Utilisant Deep Learning
Pas encore d'évaluation
Developpent D'une Application OCR en Utilisant Deep Learning
25 pages
Présentation:: Reconnaissance Optique de Caractères (OCR)
Pas encore d'évaluation
Présentation:: Reconnaissance Optique de Caractères (OCR)
31 pages
Enquête sur la reconnaissance optique de caractères
Pas encore d'évaluation
Enquête sur la reconnaissance optique de caractères
4 pages
Automatisation des Dossiers Médicaux par OCR
Pas encore d'évaluation
Automatisation des Dossiers Médicaux par OCR
1 page
Projet OCR : Rapport de soutenance
Pas encore d'évaluation
Projet OCR : Rapport de soutenance
23 pages
Technologies modernes de saisie de données
Pas encore d'évaluation
Technologies modernes de saisie de données
21 pages
Rapport PFE Complete
Pas encore d'évaluation
Rapport PFE Complete
12 pages
Complicated Table Extraction Into CSV File Using
Pas encore d'évaluation
Complicated Table Extraction Into CSV File Using
34 pages
Master2-Info-reconnaissance de Caracteres
Pas encore d'évaluation
Master2-Info-reconnaissance de Caracteres
88 pages
Projet OCR
Pas encore d'évaluation
Projet OCR
7 pages
Traitement Numerique Des Images PDF
Pas encore d'évaluation
Traitement Numerique Des Images PDF
204 pages
Outils OCR pour documents et données
Pas encore d'évaluation
Outils OCR pour documents et données
3 pages
Applications du Perceptron Multicouche
Pas encore d'évaluation
Applications du Perceptron Multicouche
33 pages
Article 1
Pas encore d'évaluation
Article 1
4 pages
Reconnaissance d'images numérisées : OCR et méta-données
Pas encore d'évaluation
Reconnaissance d'images numérisées : OCR et méta-données
19 pages
Détection automatique de documents KYC
Pas encore d'évaluation
Détection automatique de documents KYC
9 pages
Dessin
Pas encore d'évaluation
Dessin
18 pages
Rapport PFE Complete
100% (1)
Rapport PFE Complete
13 pages
Reconnaissance Faciale en Temps Réel avec OpenCV
Pas encore d'évaluation
Reconnaissance Faciale en Temps Réel avec OpenCV
28 pages
Système de tri des déchets par IA
Pas encore d'évaluation
Système de tri des déchets par IA
6 pages
Extraction de texte d'images avec OCR
Pas encore d'évaluation
Extraction de texte d'images avec OCR
15 pages
Vision par ordinateur avec Azure AI
Pas encore d'évaluation
Vision par ordinateur avec Azure AI
4 pages
Solutions GED et OCR pour Alfresco
Pas encore d'évaluation
Solutions GED et OCR pour Alfresco
9 pages
Détection d'objets par Machine Learning
Pas encore d'évaluation
Détection d'objets par Machine Learning
53 pages
Benkessirat Walid (Elaboration D'un OCR Basé Sur Les Modèle de Markov Cachés
Pas encore d'évaluation
Benkessirat Walid (Elaboration D'un OCR Basé Sur Les Modèle de Markov Cachés
83 pages
Épreuve Informatique PSI 2023 : OCR
Pas encore d'évaluation
Épreuve Informatique PSI 2023 : OCR
28 pages
Interprétation de Documents Techniques
Pas encore d'évaluation
Interprétation de Documents Techniques
207 pages
Guide d'utilisation de PaddleOCR en Python
Pas encore d'évaluation
Guide d'utilisation de PaddleOCR en Python
14 pages
Épreuve Informatique PC5IN 2023
Pas encore d'évaluation
Épreuve Informatique PC5IN 2023
28 pages
GAN pour la détection de contours d'images
Pas encore d'évaluation
GAN pour la détection de contours d'images
72 pages
Système de tri des déchets par IA
Pas encore d'évaluation
Système de tri des déchets par IA
20 pages
Reconnaissance de plaques arabes IoT
Pas encore d'évaluation
Reconnaissance de plaques arabes IoT
3 pages
La These
Pas encore d'évaluation
La These
67 pages
Utiliser l'OCR dans WinDev 25 pour factures
Pas encore d'évaluation
Utiliser l'OCR dans WinDev 25 pour factures
2 pages
Segmentation Et Détection Des Images
Pas encore d'évaluation
Segmentation Et Détection Des Images
24 pages
Projets Innovants en Vision par Ordinateur
Pas encore d'évaluation
Projets Innovants en Vision par Ordinateur
5 pages
Système de reconnaissance de chiffres manuscrits
Pas encore d'évaluation
Système de reconnaissance de chiffres manuscrits
1 page
Rapport sur la reconnaissance d'objets
Pas encore d'évaluation
Rapport sur la reconnaissance d'objets
52 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
11 pages
Bentrioua Naziha (Conception Et Déploiement D'une GED Munie D'un Outil D'extraction
Pas encore d'évaluation
Bentrioua Naziha (Conception Et Déploiement D'une GED Munie D'un Outil D'extraction
109 pages
Rapport
Pas encore d'évaluation
Rapport
38 pages
Détection d'obstacles avec vision 3D
Pas encore d'évaluation
Détection d'obstacles avec vision 3D
42 pages
Reconnaissance de plaques d'immatriculation
Pas encore d'évaluation
Reconnaissance de plaques d'immatriculation
14 pages
Scanner Presentation
Pas encore d'évaluation
Scanner Presentation
9 pages
Mcot 8471
Pas encore d'évaluation
Mcot 8471
4 pages
Défis de l'OCR Manuscrit Bancaire
Pas encore d'évaluation
Défis de l'OCR Manuscrit Bancaire
6 pages
Rapport de Pfe (Debut)
Pas encore d'évaluation
Rapport de Pfe (Debut)
5 pages
Text Mining Et Reconnaissance D'écriture Appliqués À L'assurance
Pas encore d'évaluation
Text Mining Et Reconnaissance D'écriture Appliqués À L'assurance
106 pages
Prix du tableau Krull en OCR
Pas encore d'évaluation
Prix du tableau Krull en OCR
82 pages
Extraction d'informations dans les factures
Pas encore d'évaluation
Extraction d'informations dans les factures
191 pages
Cours de Traitement d'Images
Pas encore d'évaluation
Cours de Traitement d'Images
75 pages
Transformée de Hough Rectangulaire : Détection Optimale de Droites
Pas encore d'évaluation
Transformée de Hough Rectangulaire : Détection Optimale de Droites
65 pages
Exposémaths
Pas encore d'évaluation
Exposémaths
27 pages
Maths 4eme Seq 4 Hobec
Pas encore d'évaluation
Maths 4eme Seq 4 Hobec
2 pages
Maths 4eme Seq 5
Pas encore d'évaluation
Maths 4eme Seq 5
2 pages
Phase Analyse 1
Pas encore d'évaluation
Phase Analyse 1
30 pages
I. La Méthode UML
Pas encore d'évaluation
I. La Méthode UML
5 pages
Fiche TD 1 - Récursivité DS4
Pas encore d'évaluation
Fiche TD 1 - Récursivité DS4
2 pages
Fiche TD 4 Type Abstrait de Données+Piles+Files+Classe Complexite+Arbre
Pas encore d'évaluation
Fiche TD 4 Type Abstrait de Données+Piles+Files+Classe Complexite+Arbre
3 pages
Perceptron Multicouche - Fonctionnement Et Applications
Pas encore d'évaluation
Perceptron Multicouche - Fonctionnement Et Applications
22 pages
Budget Pour L
Pas encore d'évaluation
Budget Pour L
1 page
Introduction à l'apprentissage automatique
100% (2)
Introduction à l'apprentissage automatique
11 pages
2 Cours Methodes Factorielles
Pas encore d'évaluation
2 Cours Methodes Factorielles
32 pages
Pfe Firas Chebbi Et Melek Maalej
Pas encore d'évaluation
Pfe Firas Chebbi Et Melek Maalej
81 pages
Développement Et Évaluation D'une Formation en Ligne Sur L'intégration de L'intelligence Artificielle Dans L'enseignement
Pas encore d'évaluation
Développement Et Évaluation D'une Formation en Ligne Sur L'intégration de L'intelligence Artificielle Dans L'enseignement
108 pages
Utilisation Du Deep Learning Pour La Detection D'embarcation A Partir Des Images Satellites
Pas encore d'évaluation
Utilisation Du Deep Learning Pour La Detection D'embarcation A Partir Des Images Satellites
89 pages
Vrai Synthèse
Pas encore d'évaluation
Vrai Synthèse
59 pages
Parametres de Tir
Pas encore d'évaluation
Parametres de Tir
26 pages
Presentation Desu Jet
Pas encore d'évaluation
Presentation Desu Jet
23 pages
Mathématiques Pour La Science Des Données
Pas encore d'évaluation
Mathématiques Pour La Science Des Données
8 pages
Somfy - GDK700 - User Manual - Fr-En
Pas encore d'évaluation
Somfy - GDK700 - User Manual - Fr-En
68 pages
Connaissances Et Perceptions Des Étudiants en Médecine Vis-à-Vis de L'utilisation de L'intelligence Arti
Pas encore d'évaluation
Connaissances Et Perceptions Des Étudiants en Médecine Vis-à-Vis de L'utilisation de L'intelligence Arti
33 pages
Machine Learning Scikit-Learn 3e Éd.
Pas encore d'évaluation
Machine Learning Scikit-Learn 3e Éd.
25 pages
L'IA Et Son Influence Sur Le Droit Des Affaires
100% (3)
L'IA Et Son Influence Sur Le Droit Des Affaires
146 pages
Chapitre1 Intro
Pas encore d'évaluation
Chapitre1 Intro
69 pages
Cours SIG 2022 2023 - Chapitre 1 Et Introduction
Pas encore d'évaluation
Cours SIG 2022 2023 - Chapitre 1 Et Introduction
20 pages
Data Mining Et Statistique
Pas encore d'évaluation
Data Mining Et Statistique
37 pages
Olympique La Plateforme D'évaluation EduSpace 3
Pas encore d'évaluation
Olympique La Plateforme D'évaluation EduSpace 3
1 page
Analyse de Facteurs de Fiabilité D'actifs Industriels de Transport de Gaz Par Apprentissage Automatique Supervisé
Pas encore d'évaluation
Analyse de Facteurs de Fiabilité D'actifs Industriels de Transport de Gaz Par Apprentissage Automatique Supervisé
6 pages
Introduction aux méthodes statistiques
Pas encore d'évaluation
Introduction aux méthodes statistiques
55 pages
Offre de These-4
Pas encore d'évaluation
Offre de These-4
2 pages
Capgemini2
Pas encore d'évaluation
Capgemini2
13 pages
Mathématiques Pour La Science Des Données
Pas encore d'évaluation
Mathématiques Pour La Science Des Données
7 pages
Plan Révisé de L'examen de Sortie Pour L'informatique Et L'ingénierie
Pas encore d'évaluation
Plan Révisé de L'examen de Sortie Pour L'informatique Et L'ingénierie
16 pages
Introduction à DevOps et MLOps
Pas encore d'évaluation
Introduction à DevOps et MLOps
16 pages
Détection de plaques d'immatriculation avec YOLOv5
Pas encore d'évaluation
Détection de plaques d'immatriculation avec YOLOv5
14 pages
Impact de l'IA sur l'emploi au Maroc
Pas encore d'évaluation
Impact de l'IA sur l'emploi au Maroc
23 pages
Techniques innovantes en machine learning
Pas encore d'évaluation
Techniques innovantes en machine learning
10 pages
ML QCM
Pas encore d'évaluation
ML QCM
13 pages
01 SerieExercice KNN
Pas encore d'évaluation
01 SerieExercice KNN
6 pages
Questionnaire
Pas encore d'évaluation
Questionnaire
2 pages