0% ont trouvé ce document utile (0 vote)

34 vues76 pages

Université Saad Dahlab Blida 1 Institut D'aéronautique Et Des Études Spatiales Département Études Spatiales

Ce mémoire de fin d'études présente la mise en œuvre d'un système embarqué pour la détection des cibles dans le cadre d'un Master en Aéronautique, option Télécommunications Spatiales. Il aborde les généralités sur la détection d'objets, les systèmes embarqués, ainsi que l'application du Deep Learning pour la détection d'objets. Le document inclut également des résultats et analyses concernant les performances des modèles utilisés.

Transféré par

blackbird13

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

34 vues76 pages

Université Saad Dahlab Blida 1 Institut D'aéronautique Et Des Études Spatiales Département Études Spatiales

Transféré par

blackbird13

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

‫الجمهورية الجزائرية الديمقراطية الشعبية‬

LA REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE

‫وزارة التعليم العالي والبحث العلمي‬

Ministère de l'Enseignement Supérieur et de la Recherche Scientifique
Université Saad Dahlab Blida 1
Institut d'Aéronautique et des Études Spatiales
Département Études Spatiales

Mémoire de fin d’études

En vue de l’obtention du diplôme de

Master en Aéronautique
Option : Télécommunications Spatiales
THEME

Implementation d'un système embarqué pour la détection

des cibles.

Proposé et dirigé par : Réalisé par :

Dr. BOUDIBA Ouissem DRIEF Ahmed
Dr. AZMEDROUB Boussad LALIBI Mohammed

Soutenue devant le jure composer de :

Dr.KRIM Mohamed Président
Dr. BENKERCHA Rabah Examinateur

Promotion : 2022 / 2023

Remerciement

out d’abord, nous tenons à exprimer nos sincères remerciements à Dieu Tout-Puissant
T pour nous avoir accordé la force et le courage nécessaires pour mener à bien ce
travail.

Nous souhaitons exprimer notre gratitude particulière à Le Chef Département Dr. S Tah-
raoui, Dr. B. Azmedroub et Monsieur Dr. B. Ouissem pour nous avoir proposé ce sujet de
recherche et pour leur encadrement tout au long de notre parcours. Leurs connaissances,
leur expérience et leurs conseils précieux ont été d’une grande aide pour la réalisation de
ce mémoire.

Nous aimerions également exprimer notre profonde reconnaissance envers nos parents
respectifs, qui nous ont soutenus et encouragés tout au long de cette aventure académique.

Nos remerciements vont également à tous les membres du jury qui ont accepté de consacrer
leur temps pour évaluer notre travail et pour leurs précieuses observations et recomman-
dations.

Enfin, nous tenons à exprimer notre gratitude envers tous nos enseignants qui ont contribué
à notre formation et à notre développement académique.

Nous sommes conscients que sans le soutien et l’implication de toutes ces personnes, la
réalisation de ce travail aurait été impossible. Nous leur sommes profondément reconnais-
sants pour leur précieuse contribution à notre réussite.

Que tous ceux qui ont contribué à notre parcours soient remerciés du fond du cœur.
Table des matières

Remerciement

Table des matières i

Listes des abréviations iv

Table des figures v

Liste des tableaux viii

Introduction Générale 1

1 Généralités sur la détection des objets et les systèmes embarqués 3

1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Détection d’objets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1 Principes de la détection d’objets . . . . . . . . . . . . . . . . . . . 4
1.2.2 Applications de la détection d’objet . . . . . . . . . . . . . . . . . . 5
1.2.3 Défis de la détection d’objets . . . . . . . . . . . . . . . . . . . . . 5
1.2.4 État de l’Art sur la détection d’objets . . . . . . . . . . . . . . . . . 7
1.3 Systèmes Embarqués . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Importance des systèmes embarqués dans les applications en temps
réel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3.2 Déploiement des systèmes embarqués . . . . . . . . . . . . . . . . . 9
1.3.3 Contraintes en temps réel dans les systèmes embarqués . . . . . . . 10
1.3.4 Types des systèmes embarqués . . . . . . . . . . . . . . . . . . . . . 11
1.3.5 Raspberry Pi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

i
TABLE DES MATIÈRES ii

2 Détection d’objets avec Deep Learing 14

2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2 Intelligence artcielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3 Machine Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.4 Deep Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.1 Concept du Deep Learning . . . . . . . . . . . . . . . . . . . . . . . 18
2.4.2 L’avantage du Deep Learning . . . . . . . . . . . . . . . . . . . . . 20
2.4.3 Applications du Deep Learning . . . . . . . . . . . . . . . . . . . . 20
2.5 Les Neurones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.5.1 les Neurones artificiels . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.5.2 Fonctions d’Activation . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.5.3 Architectures des réseaux de neurone . . . . . . . . . . . . . . . . . 27
2.6 Entraı̂ner un réseau de neurones artificiels . . . . . . . . . . . . . . . . . . 29
2.6.1 La fonction de cout . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.6.2 les algorithmes d’optimisation . . . . . . . . . . . . . . . . . . . . . 30
2.6.3 Underfitting and Overfitting . . . . . . . . . . . . . . . . . . . . . . 33
2.6.4 Gérer le overfitting par la régularisation . . . . . . . . . . . . . . . 34
2.6.5 Réseau neuronal convolutif . . . . . . . . . . . . . . . . . . . . . . . 36
2.6.6 Architecture du réseau neuronal convolutif . . . . . . . . . . . . . . 36
2.6.7 Les architectures CNN les plus courantes . . . . . . . . . . . . . . . 39
2.7 Modèles de détection d’objets . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.7.1 Modèles à un seul stage (Single-Stage Models) . . . . . . . . . . . . 40
2.7.2 Modèles à deux étapes (Two-Stage Models) . . . . . . . . . . . . . . 45
2.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

3 Résultats et analyses 47
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2 Outils et environement de développement . . . . . . . . . . . . . . . . . . . 48
3.3 Dataset utilisée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3.1 Pretraitement des donnees . . . . . . . . . . . . . . . . . . . . . . . 50
3.4 Apprentissage et détection du drone . . . . . . . . . . . . . . . . . . . . . . 53
3.5 Perte dans la détection d’objet . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.5.1 La perte de classification . . . . . . . . . . . . . . . . . . . . . . . . 56
3.5.2 La perte de localisation . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.5.3 La perte de regularization . . . . . . . . . . . . . . . . . . . . . . . 56
TABLE DES MATIÈRES iii

3.5.4 La perte total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

3.6 Modèle SSD-Mobilenet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.7 Modèle Faster R-CNN-ResNet50 . . . . . . . . . . . . . . . . . . . . . . . . 59
3.8 Comparaison de la méthode SSD et Faster R-CNN . . . . . . . . . . . . . 61
3.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

Conclusion Générale 63

Bibliographie 64
Listes des abréviations

AI Artificial Intelligence (Intelligence Artificielle)

ARM Advanced RISC Machine (Machine RISC Avancée)
BM2711 Broadcom BCM2711 (Broadcom BCM2711)
CNN Convolutional Neural Network (Réseau Neuronal Convolutif)
CSI Camera Serial Interface (Interface Série de Caméra)
CV Computer Vision (Vision par Ordinateur)
DCN Deformable Convolutional Networks (Réseaux Convolutifs Déformables)
DenseNet Densely Connected Convolutional Networks (Réseau Neuronal Convolutif Densément Connecté
DLA Dictionary Learning-based Algorithms (Algorithmes basés sur l’apprentissage de dictionnaires)
EfficientNet Efficient Neural Network (Réseau Neuronal Efficace)
FPS Frames Per Second (Images par Seconde)
GPIO General Purpose Input/Output (Entrée/Sortie à Usage Général)
GPS Global Positioning System (Système de Positionnement Global)
GPU Graphics Processing Unit (Unité de Traitement Graphique)
HDMI High-Definition Multimedia Interface (Interface Multimédia Haute Définition)
HoG Histogram of Oriented Gradients (Histogramme des Gradients Orientés)
IDE Integrated Development Environment (Environnement de Développement Intégré)
Jupyter Julia, Python and R
Go Gigaoctet
MLP Multilayer Perceptron (Perceptron Multicouche)
MobileNet Efficient Convolutional Neural Networks for Mobile Vision Applications (Réseaux Neuronaux C
NLP Natural Language Processing (Traitement du Langage Naturel)
ReLU Rectified Linear Unit (Unité Linéaire Rectifiée)
Resnet Residual Neural Network (Réseau Neuronal Résiduel)
RetinaNet Focal Loss for Dense Object Detection (Perte Focale pour la Détection Dense d’Objets)
R-CNN Region-based Convolutional Neural Network (Réseau Neuronal Convolutif Basé sur les Région
RMSprop Root Mean Square Propagation (Propagation de la Racine de la Moyenne Carrée)
RoI Region of Interest (Région d’Intérêt)
RPN Region Proposal Network (Réseau de Proposition de Région)
SGD Stochastic Gradient Descent (Descente de Gradient Stochastique)
SSD Single Shot MultiBox Detector (Détection d’objets en une seule passe)
SVM Support Vector Machine (Machine à Vecteurs de Support)
Tanh Hyperbolic Tangent (Tangente Hyperbolique)
USB Universal Serial Bus (Bus Universel en Série)
VGG16 Visual Geometry Group 16 (Groupe de Géométrie Visuelle 16)
Wi-Fi Wireless Fidelity (Fidélité Sans Fil)
YOLO You Only Look Once (Détection d’objets en une seule passe)

iv
Table des figures

1.1 Étapes de base de la mise en œuvre de la détection et de la classification

d’objets. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Exemples d’applications diverses de la détection d’objet . . . . . . . . . . 6
1.3 Exemples sur les défis pour la détection d’objets . . . . . . . . . . . . . . . 7
1.4 Les Composants Raspberry Pi 4 Model B [27] . . . . . . . . . . . . . . . . 13

2.1 Intelligence Artficielle, Machine Learning et Deep Learning [28]. . . . . . . 16

2.2 Machine learning : un nouveau paradigme de programmation. . . . . . . . 16
2.3 Réseau neuronal profond. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4 Différence entre l’apprentissage automatique et l’apprentissage profond. . . 18
2.5 Un réseau neuronal est paramétré par ses poids . . . . . . . . . . . . . . . 18
2.6 Une fonction de perte mesure la qualité de la sortie du réseau [28] . . . . . 19
2.7 Le score de perte est utilisé comme signal de rétroaction pour ajuster les
poids[28] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.8 Difference application du deep learning. . . . . . . . . . . . . . . . . . . . . 22
2.9 Neurone biologique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.10 Schéma d’un réseau de neurones monocouche [30] . . . . . . . . . . . . . . 23
2.11 Illustration de la fonction de décision du perceptron et de la séparabilité
linéaire [29] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.12 Schéma d’Unité linéaire rectifiée (ReLU) . . . . . . . . . . . . . . . . . . . 25
2.13 Schéma de la fonction Sigmoı̈de . . . . . . . . . . . . . . . . . . . . . . . . 26
2.14 Schéma de la fonction tangente hyperbolique (tanh) . . . . . . . . . . . . . 26
2.15 Schéma de la fonction Softmax . . . . . . . . . . . . . . . . . . . . . . . . 27
2.16 Schéma d’un réseau de neurones à une seule couche [30] . . . . . . . . . . . 28
2.17 Schéma d’un réseau de neurones multicouche [31] . . . . . . . . . . . . . . 28
2.18 Illustration de la descre de gradient. . . . . . . . . . . . . . . . . . . . . . . 30
2.19 Exemples de sous-apprentissage (modèle linéaire), bon ajustement (modèle
quadratique) et surapprentissage (polynôme de degré 15)[32] . . . . . . . . 33

v
TABLE DES FIGURES vi

2.20 Schéma de la technique de dropout. . . . . . . . . . . . . . . . . . . . . . . 35

2.21 Exemples des différentes techniques d’augmentation de données. . . . . . . 35
2.22 Exemple d’un réseau de neurones convolutif (CNN) pour la génération de
cartes de caractéristiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.23 Exemples d’Architecture d’un réseau neuronal convolutif . . . . . . . . . . 37
2.24 Exemple de convolution 2D avec rembourrage (padding) . . . . . . . . . . 37
2.25 Exemple de max pooling 2D. . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.26 Exemple d’une couche entièrement connectée . . . . . . . . . . . . . . . . . 39
2.27 Exemples des types de modèles de détection d’objets . . . . . . . . . . . . 40
2.28 Les cartes de caractéristiques de résolution inférieure (à droite) détectent
des objets à plus grande échelle [33] . . . . . . . . . . . . . . . . . . . . . . 41
2.29 SSD : Détecteur multi-boı̂tes en une seule passe . . . . . . . . . . . . . . . 42
2.30 CenterNet régresse les centres des objets ainsi que leurs attributs (largeur
et hauteur pour la détection d’objets en 2D) [34] . . . . . . . . . . . . . . . 43
2.31 Schéma d’entraı̂nement de CenterNet [34] . . . . . . . . . . . . . . . . . . . 44
2.32 Architecture Faster R-CNN [35] . . . . . . . . . . . . . . . . . . . . . . . . 45
2.33 Architecture VGG16. [36] . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

3.1 Logos des outils et environnements utilisés . . . . . . . . . . . . . . . . . . 48

3.2 Logo de Kaggle [40] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3 Exemples d’images utilisées comme dataset [41] . . . . . . . . . . . . . . . 49
3.4 Les données utilisées dans l’entraı̂nement et le test. . . . . . . . . . . . . . 50
3.5 Exemples d’images utilisées comme dataset . . . . . . . . . . . . . . . . . . 51
3.6 Installation de l’outil LabelImg à l’aide de Jupyter Notebook . . . . . . . . 51
3.7 Chargement d’une image . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.8 Annotation d’une région à l’aide de LabelImg . . . . . . . . . . . . . . . . 52
3.9 Attribution d’une classe à l’aide de LabelImg . . . . . . . . . . . . . . . . . 52
3.10 Sauvegarde de l’annotation dans LabelImg . . . . . . . . . . . . . . . . . . 52
3.11 Logo de Jypter Notebook [42] . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.12 Configuration des paramètres et des fichiers à l’aide de Jupyter Notebook . 53
3.13 Configuration des chemins et des répertoires à l’aide de Jupyter Notebook 54
3.14 Création des répertoires à l’aide de Jupyter Notebook . . . . . . . . . . . . 54
3.15 Installation de Tensorflow Object Detection à l’aide de Jupyter Notebook . 54
3.16 Création de Label Map à l’aide de Jupyter Notebook . . . . . . . . . . . . 54
3.17 Création de TF records à l’aide de Jupyter Notebook . . . . . . . . . . . . 54
3.18 Mise à jour de la configuration à l’aide de Jupyter Notebook . . . . . . . . 55
TABLE DES FIGURES vii

3.19 Apprentissage du modèle à l’aide de Jupyter Notebook . . . . . . . . . . . 55

3.20 Evaluation du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.21 Analyses des pertes dans le modèles SSD-Mobilenet . . . . . . . . . . . . . 58
3.22 Résultats obtenue du modèles SSD-Mobilenet . . . . . . . . . . . . . . . . 59
3.23 Analyses des pertes dans le modèles Faster RCNN ResNet50 . . . . . . . . 60
3.24 Résultats obtenue du modèles Faster R-CNN ResNet50 . . . . . . . . . . . 61
Liste des tableaux

2.1 Comparaison entre les quatre architectures CNN . . . . . . . . . . . . . . . 40

2.2 Expérience avec des cartes de caractéristiques à échelles multiples . . . . . 42

3.1 Analyses quantitative des graphiques des modèles SSD-Mobilenet . . . . . 59

3.2 Analyses quantitative des graphiques des modèles Faster R-CNN ResNet50 61

viii
Introduction Générale

’implémentation d’un système embarqué pour la détection des cibles a été un sujet
L de recherche de longue date dans le domaine de la vision par ordinateur. Au fil des
années, l’utilisation croissante de la détection d’objets dans diverses applications a rendu
impératif le développement de méthodes plus précises et rapides.

Traditionnellement, la détection d’objets reposait sur des approches classiques, mais l’avènement
de l’apprentissage en profondeur (Deep Learning) a introduit une alternative prometteuse.
Cependant, la formation de modèles profonds reste un défi complexe. Les travaux en cours
offrent de nouvelles perspectives de recherche dans ce domaine, ouvrant ainsi la voie à des
méthodes compétitives.[1]

La détection d’objet et tous les systèmes de détection ont deux limitations principales :

Une limitation en termes de précision, et une limitation en termes du temps.

L’obtention des hautes performances pour un système de détection d’objet dans le monde
réel est un problème ouvert pour les chercheurs depuis quelques années.

Cependant, l’utilisation des systèmes embarqués pour la détection d’objets présente également
des défis. En raison des ressources limitées, tels que la puissance de calcul et la mémoire,
ces systèmes peuvent être confrontés à des contraintes en termes de capacité de traite-
ment et de stockage des modèles de détection. De plus, l’intégration de capteurs sur des
plateformes embarquées peut être difficile en raison de contraintes d’espace et de poids.

Dans cette étude, notre objectif est de mettre en place un système embarqué pour la
détection des cibles en utilisant différents modèles (SSD et Faster R-CNN). Cette approche
nous permettra de bénéficier d’une méthode rapide et efficace basée sur le Deep Learning,
spécialement adaptée à l’implémentation sur des systèmes embarqués.

Le présent mémoire se concentre sur la mise en œuvre des algorithmes de détection d’objets
basés sur le traitement d’images, et éventuellement sur l’intelligence artificielle telle que
les méthodes de deep learning, sera réalisée au sein d’un système embarqué utilisant un
Raspberry Pi équipé d’une caméra. Ce système est conçu pour des applications en temps
réel.

1
Introduction Générale 2

Le premier chapitre jette les bases d’une compréhension approfondie de la détection d’ob-
jets et met en lumière l’importance cruciale des systèmes embarqués dans ce domaine. En
examinant de manière détaillée la détection d’objets, ce chapitre offre une vue d’ensemble
complète des techniques, des algorithmes et des méthodologies utilisés pour identifier et
localiser des objets dans des images.

Le deuxième chapitre nous allons examiner le concept du Deep Learning, en commençant

par le domaine de l’apprentissage automatique (machine learning), qui constitue une
branche importante de l’IA. Nous discuterons de la façon dont l’apprentissage automatique
permet aux ordinateurs d’accomplir efficacement des tâches sans programmation explicite.
En outre, nous mettrons en évidence les principes fondamentaux de la détection d’objets
par le biais du Deep Learning. Enfin, nous explorerons différentes méthodes de détection
d’objets qui ont émergé ces dernières années.

Le troisième et dernier chapitre de notre mémoire nous explorerons l’application de la

détection d’objets en utilisant le Deep Learning. Plus spécifiquement, nous mettrons en
œuvre les algorithmes SSD et Faster R-CNN pour créer notre propre détecteur d’ob-
jets. Enfin, nous analyserons les résultats obtenus en appliquant ce détecteur à différents
exemples d’images d’entrée.
Chapitre 1

Généralités sur la détection des

objets et les systèmes embarqués

3
1.1 Introduction 4

1.1 Introduction

De nos jours, nous assistons à une évolution de notre monde vers davantage d’intelligence,
et la technologie de traitement d’image se répand à travers le globe. Des applications telles
que la surveillance par caméra, le suivi d’objets ou encore la détection et la classification
des objets se multiplient. Cependant, la détection d’objets demeure l’un des éléments les
plus essentiels et spécifiques du traitement d’image. Les avantages de cette technique sont
que nous pouvons l’utiliser à de nombreux objectifs pour faciliter et accélérer nos travaux,
devenant ainsi plus facile et plus rapide que l’homme [2].

Dans ce chapitre, nous abordons les notions de base de la détection d’objets et expliquons
comment les systèmes embarqués jouent un rôle fondamental dans le domaine de la vision
par ordinateur.

1.2 Détection d’objets

La détection d’objets est l’un des domaines de recherche les plus actifs dans le monde
de la vision par ordinateur (CV). Elle englobe de manière simultanée la classification de
chaque objet présent dans une image ainsi que sa localisation précise. Remontant à l’année
2001, l’histoire de la détection d’objets est marquée par l’introduction emblématique des
fameuses cascades de Haar par Paul Viola et Michael Jones[3]. Depuis lors, son utilisation
s’est répandue de manière exponentielle dans diverses applications.

Cette popularité croissante a engendré un besoin pressant de développer des systèmes plus
précis et plus rapides [4]. Les nouveaux algorithmes continuent de repousser les limites en
termes de vitesse et de précision, surpassant constamment leurs prédécesseurs.

1.2.1 Principes de la détection d’objets

La détection d’objets englobe l’identification des zones potentiellement pourraient contenir

un objet au sein de l’image, à les extraire et à les classifier en utilisant un modèle de
classification d’images. Seules les régions ayant des résultats de classification optimaux
sont conservées, tandis que les autres sont rejetées. Ainsi, pour obtenir une méthode de
détection d’objets fiable, il est essentiel de disposer d’un algorithme de détection de régions
solide et d’un algorithme de classification d’images performant[5].
1.2 Détection d’objets 5

Figure 1.1 – Étapes de base de la mise en œuvre de la détection et de la classification d’objets.

1.2.2 Applications de la détection d’objet

Récemment plusieurs études ont démontré l’efficacité de la détection d’objets et son rôle
qui est très important dans divers domaines et large éventail, notamment :

– Vidéosurveillance
– Robotique
– Militaire
– Diagnostique d’images médicales
– Reconnaissance faciale
– Conduite autonome et Sécurité routière en prévenant les accidents potentiellement
causés par la fatigue au volant.

Ces applications démontrent l’importance cruciale de la détection d’objets dans différents

domaines et soulignent son potentiel à améliorer notre quotidien en termes de sécurité,
d’efficacité et de prise de décision.

1.2.3 Défis de la détection d’objets

La détection d’objets est une tâche complexe qui trouve son utilité dans de multiples
contextes liés au traitement d’images. Pour qu’un détecteur soit idéal, il doit avoir deux
caractéristiques clés :
– Haute précision de localisation et de reconnaissance : le détecteur doit être capable de
localiser et de reconnaı̂tre les objets dans les images avec précision.
– Haute efficacité en temps et en mémoire : la tâche de détection doit s’exécuter à une
fréquence d’images suffisante (fps) avec une utilisation de mémoire et de stockage ac-
ceptable.
Toutefois, la réalisation d’un tel détecteur n’est pas sans défis.
1.2 Détection d’objets 6

Vidéosurveillance Robotique Militaire

Diagnostique Reconnaissance faciale Conduite autonome

Figure 1.2 – Exemples d’applications diverses de la détection d’objet

L’un des principaux obstacles est la présence de variations intra-classe. Chaque catégorie
d’objet peut comporter de nombreuses instances d’objets qui diffèrent en fonctionnalités
telles que la couleur, la texture, la taille, la forme et la pose. Ces variations peuvent être
causées par une multitude de facteurs, tels que :

– Eclairage
– Multi-échelle
– Angle
– Conditions météorologiques
– Distribution non uniforme
– Changements d’échelle
– Occultations
– Déformations
– Mouvement d’objets ou de caméra
– Bruit et basse résolution
– Taille d’objet
– Arrière-plans et ombrage

Le deuxième défi consiste à assurer la détection en temps réel des objets. Cela nécessite
des performances élevées, qui peuvent parfois se faire au détriment de la précision pour
gagner en rapidité. De plus, nous devons développer un détecteur efficace qui fonctionne
de manière optimale sur des appareils ayant des ressources de calcul et de stockage limitées
1.2 Détection d’objets 7

Figure 1.3 – Exemples sur les défis pour la détection d’objets

[6].

1.2.4 État de l’Art sur la détection d’objets

Les méthodes de détection d’objets relèvent généralement d’approches basées sur l’ap-
prentissage automatique (Machine Learning) ou d’approches basées sur l’apprentissage
en profondeur (Deep Learning). Pour les approches d’apprentissage automatique, il de-
vient nécessaire de définir d’abord les entités en utilisant l’une des méthodes ci-dessous,
puis en utilisant une technique telle que la machine à vecteur de support (SVM) pour
effectuer la classification.

D’un autre côté, les techniques d’apprentissage en profondeur sont capables de détecter des
objets de bout en bout sans définir spécifiquement de caractéristiques, et sont généralement
basées sur des Réseaux de Neurones Convolutifs (CNN). Les réseaux de neurones convolu-
tifs ont contribué à une augmentation significative de la précision de la détection d’objets
et ont largement dépassé d’autres modèles classiques tels que le cadre Viola & Jones [3]et
les histogrammes de gradient orienté (HoG) [7].

– Approches d’apprentissage automatique (Machine Learning) :

– Viola & Jones - Cadres de détection d’objets basés sur les caractéristiques de Haar[3]
– SVM (Machine à Vecteurs de Support) - Classification des régions d’intérêt[8]
– SIFT (Scale-Invariant Feature Transform) - Transformation d’entité invariante à
l’échelle[9]
– HOG (Histogramme de Gradient Orienté) - Caractéristiques basées sur les gradients
orientés[7]
– Approches d’apprentissage en profondeur (Deep Learning) :
– R-CNN (Region-based Convolutional Neural Network) - Détection d’objets basée sur
des régions[10]
1.3 Systèmes Embarqués 8

– Fast R-CNN (Fast Region-based Convolutional Network) - Réseau de Neurones Convo-

lutifs Rapide avec Régions d’Intérêt[11]
– Faster R-CNN (Faster Region-based Convolutional Neural Network) - Réseau de
Neurones Convolutifs avec Régions d’Intérêt plus Rapide[12]
– YOLO (You Only Look Once) - Détection d’objets en une seule passe[13]
– SSD (Single Shot MultiBox Detector) - Détection de boı̂tes multiples en un seul
tir[14]
– ResNet (Residual Neural Network) - Réseau neuronal résiduel[15]
– DenseNet (Densely Connected Convolutional Networks) - Réseau de neurones dense
pour une détection d’objets améliorée[16]
– MobileNet (Efficient Convolutional Neural Networks for Mobile Vision Applications) -
Réseaux Neuronaux Convolutifs Efficients pour les Applications de Vision Mobile[17]
– EfficientNet (Rethinking Model Scaling for Convolutional Neural Networks) - Modèle
d’apprentissage en profondeur efficace pour la détection d’objets[18]
– RetinaNet (Focal Loss for Dense Object Detection) - Perte Focale pour la Détection
Dense d’Objets[19]
– DCN (Deformable Convolutional Networks) - Réseaux Convolutifs Déformables[20]
– CenterNet (Objects as Points) - Objets en tant que points[21]

1.3 Systèmes Embarqués

Un système embarqué est une combinaison de matériel informatique, de logiciels, et

éventuellement de composants supplémentaires, qu’ils soient mécaniques ou électroniques,
conçus pour accomplir une fonction dédiée. Un bon exemple est le four à micro-ondes.
Presque tous les foyers en possèdent un, et des dizaines de millions d’entre eux sont uti-
lisés chaque jour, mais très peu de personnes réalisent qu’un processeur informatique et
des logiciels sont impliqués dans la préparation de leur déjeuner ou dı̂ner.

La conception d’un système embarqué destiné à accomplir une fonction dédiée diffère di-
rectement de celle de l’ordinateur personnel. L’ordinateur personnel est lui aussi composé
de matériel informatique, de logiciels et de composants mécaniques (comme les disques
durs, par exemple). Cependant, un ordinateur personnel n’est pas conçu pour accomplir
une fonction spécifique.[22]
1.3 Systèmes Embarqués 9

1.3.1 Importance des systèmes embarqués dans les applications

en temps réel

Les systèmes embarqués jouent un rôle essentiel dans les applications en temps réel en
raison de leur capacité à fournir des fonctionnalités avancées et une réponse rapide aux
événements. Dans le domaine de la détection d’objets, il est crucial de pouvoir traiter en
temps réel les flux de données provenant de capteurs, tels que des caméras, et d’effectuer
des analyses instantanées pour détecter et reconnaı̂tre les objets d’intérêt.

Les systèmes embarqués offrent une plateforme compacte et économe en énergie qui peut
être utilisée pour exécuter des tâches de détection d’objets en temps réel. En intégrant des
algorithmes de détection d’objets basés sur le deep learning dans ces systèmes embarqués.
L’utilisation de systèmes embarqués pour la détection d’objets permet une exécution
rapide et précise des algorithmes de détection, offrant ainsi des avantages tels qu’une
meilleure réactivité, une faible latence et une consommation d’énergie réduite. Cette com-
binaison de performances en temps réel et de capacités embarquées ouvre la voie à de
nombreuses applications innovantes dans le domaine de la détection d’objets.[23]

1.3.2 Déploiement des systèmes embarqués

Les systèmes embarqués trouvent des applications dans divers domaines :

– Automobile : systèmes de freinage antiblocage, navigation GPS, systèmes d’infodiver-
tissement.
– Télécommunications : téléphones mobiles, modems, équipements de réseau.
– Électronique grand public : téléviseurs, lecteurs multimédias, montres intelligentes.
– Soins de santé : dispositifs médicaux, surveillance des signes vitaux.
– Industrie : systèmes de contrôle, automates programmables, robots industriels.
– Avionique : navigation, contrôle de vol, communication.
– Énergie : gestion de l’énergie, compteurs intelligents, panneaux solaires.
– Sécurité : surveillance vidéo, systèmes d’alarme, contrôle d’accès.
Les systèmes embarqués jouent un rôle essentiel dans notre société moderne, offrant des
solutions polyvalentes et puissantes pour diverses applications.

L’intégration de nos algorithmes dans un système embarqué revêt une importance cru-
ciale, car elle permet d’exploiter efficacement les ressources matérielles limitées tout en
garantissant des performances en temps réel.

Dans ce contexte, nous devons choisir une plateforme embarquée équipée d’une caméra
afin de créer un système compact et autonome.
1.3 Systèmes Embarqués 10

Ce système embarqué sera capable d’effectuer la détection des cibles en temps réel, tout
en capturant et en traitant la vidéo de manière fluide. Cette approche offre une flexibilité
et une portabilité accrues, ouvrant la voie à des applications potentiellement variées,
telles que la surveillance vidéo, la robotique ou encore la reconnaissance d’objets dans des
environnements dynamiques.

1.3.3 Contraintes en temps réel dans les systèmes embarqués

Lorsqu’il s’agit de systèmes embarqués pour la détection d’objets, il existe plusieurs

contraintes à prendre en compte. Voici quelques-unes des contraintes courantes associées
à la détection d’objets dans les systèmes embarqués :
– Contraintes de puissance de calcul : La détection d’objets peut nécessiter des algo-
rithmes de traitement d’image ou de vision par ordinateur complexes qui exigent une
puissance de calcul significative. Dans les systèmes embarqués, les ressources de calcul
peuvent être limitées, il est donc important de concevoir des algorithmes optimisés et
efficaces pour répondre à ces contraintes.
– Contraintes de mémoire : Les systèmes embarqués ont généralement une quantité li-
mitée de mémoire disponible. Les modèles de détection d’objets, tels que les réseaux de
neurones convolutifs (CNN), peuvent être volumineux et nécessiter une grande quan-
tité de mémoire pour stocker les paramètres du modèle. Il est crucial de sélectionner
ou de concevoir des modèles de détection d’objets qui sont adaptés aux contraintes de
mémoire des systèmes embarqués.
– Contraintes de latence : Dans certains cas, la détection d’objets doit être réalisée en
temps réel avec des délais de réponse très courts. Par exemple, dans les systèmes de
détection d’objets embarqués dans des véhicules autonomes, la latence doit être mini-
misée pour permettre des décisions rapides et réactives. Les algorithmes de détection
d’objets doivent être optimisés pour réduire la latence et respecter les contraintes tem-
porelles.
– Contraintes de consommation d’énergie : Les systèmes embarqués sont souvent ali-
mentés par des sources d’énergie limitées, telles que des batteries. La détection d’objets
peut être une tâche intensive en termes de consommation d’énergie, notamment en rai-
son du traitement d’images ou de flux vidéo en continu. Il est important de concevoir
des algorithmes économes en énergie et d’optimiser la consommation d’énergie pour
prolonger l’autonomie du système.
– Contraintes de robustesse et de précision : Les systèmes de détection d’objets embarqués
doivent être robustes et précis, même dans des environnements difficiles ou avec des
variations des conditions d’éclairage. Les algorithmes de détection d’objets doivent être
1.3 Systèmes Embarqués 11

capables de détecter les objets avec précision tout en étant résilients aux variations et
aux perturbations environnementales.
– Contraintes de taille et de poids : Les systèmes embarqués sont généralement conçus
pour être compacts et légers, ce qui impose des contraintes de taille et de poids. Les
solutions de détection d’objets doivent être adaptées à ces contraintes pour permettre
une intégration facile dans des dispositifs embarqués compacts.
En considérant ces contraintes, il est possible de concevoir des systèmes embarqués effi-
caces et performants pour la détection d’objets dans une variété d’applications telles que
la robotique, la surveillance, la sécurité, les véhicules autonomes, etc[24].

1.3.4 Types des systèmes embarqués

Les architectures de logiciels embarqués jouent un rôle crucial dans la conception et le

développement de systèmes efficaces et performants. Voici une liste raccourcie de différents
types d’architectures, avec des exemples représentatifs :
– Monolithique : Un système avec un seul bloc de code logiciel exécuté sur le système
embarqué. Exemple : Un système embarqué monolithique contrôlant les opérations
d’une machine industrielle.
– Modulaire : Une architecture où le logiciel est divisé en modules distincts, permettant
la réutilisation du code et des mises à jour ciblées. Exemple : Un système embarqué
modulaire pour la domotique, avec des modules distincts pour le contrôle de l’éclairage,
la surveillance de la température et la sécurité.
– Temps réel : Une architecture conçue pour répondre à des contraintes temporelles
strictes. Exemple : Un système embarqué temps réel pour le contrôle autonome des
véhicules, assurant une réponse précise et immédiate aux entrées des capteurs.
– Orienté objet : Une architecture basée sur des objets encapsulant des données et des
fonctionnalités. Exemple : Un système embarqué orienté objet pour la détection d’ob-
jets, utilisant le Raspberry Pi pour traiter les images et identifier les objets.
En choisissant judicieusement l’architecture de logiciel embarqué adaptée à chaque projet,
il est possible de créer des systèmes robustes, modulaires et réactifs, répondant aux besoins
spécifiques de chaque application. La diversité des architectures permet d’exploiter les
avantages du Raspberry Pi et d’autres plateformes pour des projets variés, de la domotique
à l’automatisation industrielle [25].
1.3 Systèmes Embarqués 12

1.3.5 Raspberry Pi

Un système embarqué Raspberry Pi est un système informatique complet qui intègre une
carte Raspberry Pi comme cœur du système. Le Raspberry Pi lui-même est une carte de
développement compacte et abordable, qui peut être utilisée comme un ordinateur à part
entière ou comme une unité de traitement centrale dans un système embarqué [26].

Le Raspberry Pi a été initialement créé pour encourager l’apprentissage de l’informatique

et de la programmation dans les écoles et les pays en développement. Cependant, il est
rapidement devenu populaire auprès des amateurs, des étudiants, des développeurs et des
passionnés de l’électronique.

le Raspberry Pi a conquis notre cœur grâce à son accessibilité, sa communauté et sa

flexibilité.

Raspberry Pi 4

Dans le cadre de notre projet de fin d’études, on a opté pour l’utilisation du Raspberry
Pi 4 comme plateforme principale. Avec ses performances améliorées par rapport aux
modèles précédents.

Le Raspberry Pi 4, l’un des modèles les plus récents de la série Raspberry Pi, comprend
les composants suivants :
– Processeur : Le Raspberry Pi 4 est équipé d’un processeur Broadcom BCM2711, qui est
un processeur ARM Cortex-A72 64 bits quad-core cadencé à 1,5 GHz. Cela offre une
puissance de calcul significativement plus élevée par rapport aux modèles précédents.
– Mémoire : Le Raspberry Pi 4 est disponible avec différentes options de mémoire vive
(RAM) : 2 Go, 4 Go ou 8 Go. La quantité de RAM dépend du modèle choisi et influence
les performances globales du système.
– Stockage : Le Raspberry Pi 4 utilise une carte microSD pour le stockage du système
d’exploitation et des données. Cependant, il dispose également de deux ports USB 3.0
qui peuvent être utilisés pour connecter des périphériques de stockage externes tels que
des disques durs ou des clés USB.
– Connectivité : Le Raspberry Pi 4 est doté de nombreuses options de connectivité. Il
dispose de deux ports USB 2.0 et deux ports USB 3.0, d’un port Ethernet Gigabit pour
la connexion réseau filaire, ainsi que d’une connectivité sans fil intégrée comprenant le
Wi-Fi 802.11ac et le Bluetooth 5.0.
– Ports d’E/S : Le Raspberry Pi 4 est équipé de plusieurs ports d’entrée/sortie, notam-
ment deux ports micro HDMI pour la sortie vidéo jusqu’à 4K, un port jack audio 3,5
mm, deux ports GPIO 40 broches pour la connexion de périphériques électroniques et
1.4 Conclusion 13

un port caméra CSI (Camera Serial Interface) pour connecter une caméra Raspberry
Pi.
– Alimentation : Le Raspberry Pi 4 est alimenté via un adaptateur secteur USB-C avec
une tension de 5 V.
– Système d’exploitation : Le Raspberry Pi 4 est compatible avec divers systèmes d’ex-
ploitation basés sur Linux, notamment Raspberry Pi OS (anciennement Raspbian),
Ubuntu, etc. Ces systèmes d’exploitation sont spécifiquement optimisés pour les archi-
tectures ARM et les fonctionnalités du Raspberry Pi 4.

Figure 1.4 – Les Composants Raspberry Pi 4 Model B [27]

Le Raspberry Pi 4 est un choix populaire pour une variété d’applications, y compris les
projets embarqués, les médias, l’automatisation domestique et bien d’autres [26].

1.4 Conclusion

Dans l’ensemble, ce chapitre a démontré le potentiel de l’apprentissage en profondeur et

des systèmes embarqués pour révolutionner le domaine de la vision par ordinateur. En
exploitant la puissance de ces technologies, nous pouvons créer des solutions innovantes
qui permettent la détection d’objets en temps réel dans une large gamme d’applications.
À mesure que nous avançons, il reste encore beaucoup à explorer et à améliorer dans ce
domaine.

Cependant, les avancées réalisées dans ce chapitre fournissent une base solide pour de
nouvelles recherches et développements, et nous sommes impatients de voir ce que l’avenir
réserve pour la détection d’objets embarquée avec l’apprentissage en profondeur.
Chapitre 2

Détection d’objets avec Deep Learing

14
2.1 Introduction 15

2.1 Introduction

Aujourd’hui, le Deep Learning, connu sous le nom d’apprentissage approfondi en français,

est utilisé par de nombreuses applications et technologies que nous utilisons au quotidien.
Il alimente des fonctionnalités variées, telles que la capacité de Google Maps à repérer
les numéros de rue sur une image, la reconnaissance faciale de Facebook sur les photos
d’amis, la compréhension vocale de Siri et l’adaptation de ses réponses aux demandes
des utilisateurs, ainsi que la traduction en temps réel de conversations orales sur des
applications comme Skype et Google Traduction, entre autres. On parle beaucoup du
Deep Learning aujourd’hui, et ce n’est pas sans raison.

Mais que se cache-t-il derrière ces deux mots ? Dans ce chapitre, nous allons explorer
le concept du Deep Learning, en commençant par l’apprentissage automatique (machine
learning) et et l’intelligence artificielle (IA) en général. Nous aborderons comment l’ap-
prentissage automatique permet aux ordinateurs d’effectuer efficacement des tâches sans
programmation explicite. De plus, nous mettrons en évidence les notions fondamentales
liées à la détection d’objets par le Deep Learning. Enfin, nous explorerons différentes
méthodes de détection d’objets proposées au cours des dernières années cité dans le cha-
pitre précédent.

2.2 Intelligence artcielle

L’intelligence artificielle (IA) est une discipline informatique qui permet aux machines de
simuler l’intelligence humaine. Elle a révolutionné de nombreux domaines en permettant
aux machines d’apprendre, de raisonner et de résoudre des problèmes de manière auto-
nome. Grâce à des algorithmes avancés, l’IA est capable d’analyser de grandes quantités
de données et d’extraire des informations pertinentes. Cette technologie a des applica-
tions variées, allant des assistants virtuels aux voitures autonomes, en passant par les
systèmes de recommandation. Cependant, elle soulève également des questions éthiques
et sociétales. Dans cette étude, nous explorerons les bases de l’intelligence artificielle, ses
applications et les défis qui l’accompagnent [28].

2.3 Machine Learning

Le machine learning, ou apprentissage automatique, est une branche de l’intelligence ar-

tificielle qui permet aux machines d’apprendre à partir des données et d’améliorer leurs
2.3 Machine Learning 16

Figure 2.1 – Intelligence Artficielle, Machine Learning et Deep Learning [28].

performances sans être explicitement programmées. Il s’agit d’une approche basée sur
l’exploitation de modèles statistiques et d’algorithmes afin de permettre aux machines de
reconnaı̂tre des schémas, de détecter des tendances et de prendre des décisions autonomes.
Le processus de machine learning implique généralement plusieurs étapes : la collecte et la
préparation des données, la sélection et l’entraı̂nement d’un modèle, et enfin, l’évaluation
et l’optimisation de ce modèle. En utilisant les données d’entraı̂nement, les machines ap-
prennent à généraliser et à faire des prédictions sur de nouvelles données, en établissant
des règles et des relations à partir des exemples fournis comme la montre la figure 2.2
Cela permet d’automatiser des tâches complexes et de réaliser des prédictions précises.

Figure 2.2 – Machine learning : un nouveau paradigme de programmation.

L’apprentissage dans le domaine de l’intelligence artificielle se réfère à un processus par

lequel un système ou une machine acquiert des connaissances et des compétences à partir
2.4 Deep Learning 17

de l’expérience ou des données.

Les types d’apprentissage comprennent l’apprentissage supervisé, où les modèles sont en-
traı̂nés sur des données étiquetées, l’apprentissage non supervisé, qui trouve des structures
dans les données non étiquetées, l’apprentissage par renforcement, où un agent apprend à
travers des interactions avec un environnement, et l’apprentissage semi-supervisé, qui uti-
lise à la fois des données étiquetées et non étiquetées pour l’apprentissage. L’apprentissage
par transfert permet de transférer des connaissances d’une tâche à une autre.

Ces approches permettent aux machines d’apprendre et de s’adapter à des problèmes

complexes dans divers domaines de l’intelligence artificielle.

2.4 Deep Learning

Le deep learning, également connu sous le nom d’apprentissage profond, est une branche de
l’intelligence artificielle qui se concentre sur l’utilisation de réseaux de neurones artificiels
profonds pour apprendre et effectuer des tâches complexes à partir de données brutes. Le
terme ”profond” fait référence à la structure en couches multiples des réseaux neuronaux
utilisés dans cette approche.

Figure 2.3 – Réseau neuronal profond.

La différence principale entre le machine learning et le deep learning est que le machine
learning utilise diverses techniques pour apprendre à partir des données, tandis que le deep
learning est une approche plus avancée qui utilise des réseaux de neurones profonds pour
extraire automatiquement des caractéristiques hiérarchiques des données brutes, offrant
ainsi une capacité plus puissante pour résoudre des problèmes d’intelligence artificielle.
2.4 Deep Learning 18

Figure 2.4 – Différence entre l’apprentissage automatique et l’apprentissage profond.

2.4.1 Concept du Deep Learning

La spécification de ce qu’une couche fait à ses données d’entrée est stockée dans les
poids de la couche. En termes techniques, on pourrait dire que la transformation mise en
œuvre par une couche est paramétrée par ses poids (voir figure 2.5). Dans ce contexte,
l’apprentissage signifie trouver un ensemble de valeurs pour les poids de toutes les couches
d’un réseau, de sorte que le réseau puisse mapper correctement les entrées d’exemple à
leurs cibles associées. Mais voici le problème : un réseau neuronal profond peut contenir
des dizaines de millions de paramètres. Trouver la valeur correcte pour chacun d’entre
eux peut sembler une tâche intimidante.

Figure 2.5 – Un réseau neuronal est paramétré par ses poids [28]

Pour contrôler quelque chose, il est d’abord nécessaire de pouvoir l’observer. Pour contrôler
la sortie d’un réseau neuronal, il faut être capable de mesurer à quel point cette sortie
diffère de ce que l’on attendait. C’est le rôle de la fonction de perte du réseau, également
appelée fonction objectif. La fonction de perte prend les prédictions du réseau et la vraie
2.4 Deep Learning 19

cible et calcule un score de distance, qui mesure à quel point le réseau a réussi sur cet
exemple spécifique (voir figure 2.6) Le truc fondamental dans le deep learning est d’utiliser

Figure 2.6 – Une fonction de perte mesure la qualité de la sortie du réseau [28]

ce score comme un signal de rétroaction pour ajuster légèrement la valeur des poids, dans
une direction qui réduira le score de perte pour l’exemple actuel (voir figure 2.7). Cette
adaptation est le rôle de l’optimiseur, qui met en œuvre ce qu’on appelle l’algorithme de
rétropropagation (Backpropagation). Initialement, les poids du réseau sont assignés à des

Figure 2.7 – Le score de perte est utilisé comme signal de rétroaction pour ajuster les poids[28]

valeurs aléatoires, de sorte que le réseau ne fait que mettre en œuvre une série de trans-
formations aléatoires. Naturellement, sa sortie est loin de ce qu’elle devrait idéalement
être, et le score de perte est en conséquence très élevé. Mais à chaque exemple que le
réseau traite, les poids sont ajustés légèrement dans la bonne direction, et le score de
perte diminue. C’est la boucle d’apprentissage.
2.4 Deep Learning 20

2.4.2 L’avantage du Deep Learning

Dans le domaine de l’intelligence artificielle, l’apprentissage profond présente de nombreux

avantages par rapport aux approches classiques de l’apprentissage machine. Parmi ces
avantages, nous pouvons souligner :

– Automatisation : Les algorithmes d’apprentissage profond peuvent générer de nouvelles

fonctionnalités à partir de données d’entraı̂nement limitées, sans intervention humaine,
ce qui permet des déploiements d’applications plus rapides et une précision supérieure.
– Bonne adaptation aux données non structurées : L’apprentissage profond excelle dans
l’analyse de données non structurées telles que le texte, les images et la voix, permettant
aux entreprises de tirer parti de précieuses données non structurées pour l’optimisation.
– Meilleures capacités d’auto-apprentissage : Les modèles d’apprentissage profond ap-
prennent des caractéristiques complexes et effectuent des tâches intensives de manière
plus efficace, car ils peuvent apprendre à partir des erreurs, vérifier les prédictions et
apporter les ajustements nécessaires de manière autonome.
– Prise en charge d’algorithmes parallèles et distribués : Les algorithmes parallèles et
distribués accélèrent l’entraı̂nement des modèles d’apprentissage profond, offrant une
évolutivité et une formation plus rapides à l’aide de plusieurs machines ou GPU.
– Rentabilité : Bien que l’entraı̂nement des modèles d’apprentissage profond puisse être
coûteux, ils aident les entreprises à réaliser des économies à long terme en réduisant les
marges d’erreur et en surpassant les modèles d’apprentissage automatique classiques.
– Analyses avancées : L’apprentissage profond améliore la science des données en four-
nissant une analyse plus précise et fiable, alimentant des logiciels de prédiction dans
divers domaines tels que le marketing, les ventes, la finance, etc.
– Évolutivité : L’apprentissage profond est hautement évolutif, capable de traiter de
grands ensembles de données et d’effectuer des calculs de manière efficace, permet-
tant un déploiement plus rapide, une modularité et une portabilité des modèles d’en-
traı̂nement.

En bref, l’apprentissage profond offre des avantages considérables en automatisation, ana-

lyse de données non structurées, auto-apprentissage et rentabilité, faisant de lui une ap-
proche essentielle pour l’intelligence artificielle et l’innovation.

2.4.3 Applications du Deep Learning

Dans le cadre de l’analyse de données volumineuses, l’apprentissage profond offre de nom-

breuses applications pratiques, notamment :
2.4 Deep Learning 21

– Reconnaissance d’images et de la parole : Les algorithmes d’apprentissage profond

peuvent analyser et comprendre les images et la parole, permettant des applications
telles que la reconnaissance faciale, la détection d’objets et les assistants vocaux.
– Traitement du langage naturel (NLP) : Les modèles d’apprentissage profond peuvent
traiter et comprendre le langage humain, permettant des tâches telles que l’analyse des
sentiments, la traduction de langues et les chatbots.
– Détection et prévention de la fraude : L’apprentissage profond peut aider à identifier les
schémas et les anomalies dans de grands ensembles de données, permettant la détection
d’activités frauduleuses dans des domaines tels que les transactions par carte de crédit,
les demandes d’assurance et la cybersécurité.
– Systèmes de recommandation : Les algorithmes d’apprentissage profond peuvent analy-
ser le comportement et les préférences des utilisateurs pour fournir des recommandations
personnalisées pour des produits, des films, de la musique, les résaux sociaux .
Aujourd’hui, les médias sociaux exploitent largement ces systèmes de recommanda-
tion pour fournir des suggestions personnalisées en fonction des comportements et des
préférences des utilisateurs.
– Maintenance prédictive dans la fabrication : En analysant les données des capteurs des
machines, l’apprentissage profond peut prédire quand une maintenance est nécessaire,
aidant ainsi à prévenir les pannes coûteuses et à optimiser les calendriers de mainte-
nance.
– Santé et diagnostic médical : L’apprentissage profond peut aider à l’analyse d’images
médicales, au diagnostic de maladies et à la découverte de médicaments, améliorant
ainsi la précision et l’efficacité des soins de santé.
– Analyse financière et trading : Les modèles d’apprentissage profond peuvent analyser les
données financières, prédire les tendances du marché et aider à élaborer des stratégies
de trading algorithmique.
– Véhicules autonomes et robotique : L’apprentissage profond joue un rôle crucial dans
la conduite autonome des voitures et des robots autonomes en traitant les données des
capteurs, en reconnaissant les objets et en prenant des décisions en temps réel.

Ces applications sont rendues possibles grâce à la capacité de l’apprentissage profond

à extraire des représentations abstraites des données, permettant ainsi de découvrir des
modèles et des relations complexes qui seraient difficiles à détecter avec des méthodes
traditionnelles d’analyse de données [28].
2.5 Les Neurones 22

Figure 2.8 – Difference application du deep learning.

2.5 Les Neurones

Les réseaux de neurones peuvent être définis comme des modèles de calcul qui apprennent,
généralisent et organisent des données. Ils déduisent des propriétés émergentes qui per-
mettent de résoudre des problèmes complexes. Leur mécanisme s’inspire des cellules ner-
veuses humaines, appelées neurones.

Un neurone biologique est constitué d’un corps cellulaire entouré de dendrites et d’un
axone qui transmet l’influx nerveux. Les neurones sont connectés les uns aux autres par
le biais de synapses.

Figure 2.9 – Neurone biologique.

2.5 Les Neurones 23

2.5.1 les Neurones artificiels

Plus formellement, nous pouvons situer l’idée derrière les neurones artificiels dans le
contexte d’une tâche de classification binaire où nous désignons nos deux classes comme 1
(classe positive) et -1 (classe négative) pour simplifier. Nous pouvons ensuite définir une
fonction d’activation ϕ(z) qui prend une combinaison non-linéaire de certaines valeurs
d’entrée, x, et d’un poids correspondant [29].

Figure 2.10 – Schéma d’un réseau de neurones monocouche [30]

vecteur, w, où z est ce qu’on appelle l’entrée nette z = w1 x1 + w2 x2 + . . . + wm xm

   
w1 x1
 .   . 
   
w =  ..  , x =  ..  (2.1)
   
wm xm

Maintenant, si l’entrée nette d’un exemple particulier, x (i) , est supérieure à un seuil défini,
θ, nous prédisons la classe 1, et la classe -1 sinon. Dans l’algorithme du perceptron, la
fonction de décision, ϕ(·), est une variante d’une fonction d’étape unitaire :



 1 if z ≥ θ,
ϕ(z) = (2.2)
 −1

otherwise.

De plus, nous avons défini la fonction d’activation ϕ(·) de la manière suivante :

ϕ(z) = z = a (2.3)

Ici, l’entrée nette, z , est une combinaison linéaire des poids qui relient la couche d’entrée
à la couche de sortie :
2.5 Les Neurones 24

xj w j = w T x
X
z= (2.4)
j

Alors que nous avons utilisé l’activation ϕ(z) pour calculer la mise à jour du gradient,
nous avons implémenté une fonction seuil pour convertir la sortie à valeur continue en
étiquettes de classes binaires pour la prédiction :


 1 if g(z) ≥ 0,
ŷ = (2.5)
 −1

otherwise.

La figure 2.18 illustre comment l’entrée nette z = wT x est réduite à une sortie binaire (–1
ou 1) par la fonction de décision du perceptron.

Figure 2.11 – Illustration de la fonction de décision du perceptron et de la séparabilité linéaire

[29]

La règle d’apprentissage du perceptron consiste à initialiser les poids à 0 ou à de

petites valeurs aléatoires. Pour chaque exemple d’entraı̂nement représenté par x (i) , les
étapes suivantes sont réalisées :
– Calculer la valeur de sortie prédite, ŷ.
– Mettre à jour les poids du perceptron.

wj+1 = wj − η∇J(wj ) (2.6)

En résumé, le perceptron reçoit les entrées d’un exemple, x, et les combine avec les
poids, w, pour calculer l’entrée nette. L’entrée nette est ensuite transmise à la fonction
de seuil, qui génère une sortie binaire de -1 ou +1 - l’étiquette de classe prédite de
l’exemple. Pendant la phase d’apprentissage, cette sortie est utilisée pour calculer l’erreur
de prédiction et mettre à jour les poids.
2.5 Les Neurones 25

2.5.2 Fonctions d’Activation

La particularité de la fonction d’activation est qu’elle est non linéaire. Cette non-linéarité
permet de changer la représentation des données, d’avoir une nouvelle approche sur ces
données. Ce changement de représentation ne serait pas possible avec une transformation
linéaire. Chaque neurone d’une couche va appliquer la fonction d’activation de la couche
sur les données. Quelques exemples de certaines des fonctions d’activation populaires
utilisées dans les réseaux de neurones pour les tâches de classification sont données comme
suit :

Unité linéaire rectifiée (ReLU)

La couche d’unité linéaire rectifiée (en anglais ”rectified linear unit layer”) est l’une des
fonctions d’activation les plus couramment utilisées dans l’apprentissage en profondeur,
et elle est calculée comme suit :

f (x) = max(0, x) (2.7)

Figure 2.12 – Schéma d’Unité linéaire rectifiée (ReLU)

Les fonctions d’activation ReLU sont très populaires pour la création d’un réseau non
linéaire. Cette fonction permet d’effectuer un filtre sur nos données. Elle laisse passer les
valeurs positives x > 0 dans les couches suivantes du réseau de neurones. Elle est utilisée
presque partout mais surtout pas dans la couche finale, elle est utilisée dans les couches
intermédiaires.

La Fonction Sigmoı̈de

La fonction d’activation sigmoı̈de est une fonction mathématique utilisée dans les réseaux
de neurones. Elle transforme les valeurs d’entrée en une sortie continue entre 0 et 1.
Cette fonction est couramment utilisée pour représenter des probabilités ou normaliser
les valeurs dans un réseau de neurones. La fonction sigmoıde est définie comme suit :
2.5 Les Neurones 26

1
σ(z) = (2.8)
1 + e−x

Figure 2.13 – Schéma de la fonction Sigmoı̈de

Un avantage de la fonction sigmoı̈de est qu’elle produit une sortie continue dans la plage
de 0 à 1, ce qui la rend particulièrement adaptée pour représenter des probabilités. Elle
permet également une différenciation facile, ce qui est crucial pour les algorithmes d’ap-
prentissage automatique basés sur le gradient. De plus, la fonction sigmoı̈de est symétrique
par rapport à son point médian, ce qui peut être bénéfique dans certains scénarios d’ap-
prentissage.

La Fonction Tanh

La fonction d’activation tangente hyperbolique (tanh) est une fonction mathématique

utilisée dans les réseaux de neurones. Elle transforme les valeurs d’entrée en une sortie
continue entre -1 et 1. La fonction tanh est similaire à la fonction sigmoı̈de, mais elle est
centrée autour de zéro, ce qui lui permet de mieux capturer les valeurs négatives. Elle est
couramment utilisée pour modéliser des données qui peuvent être symétriques par rapport
à zéro. La fonction tanh est définie comme suit :

ex − e−x
tanh(x) = x (2.9)
e + e−x

Figure 2.14 – Schéma de la fonction tangente hyperbolique (tanh)

2.5 Les Neurones 27

la Fonction Softmax

La fonction Softmax permet-elle de transformer un vecteur réel en vecteur de probabilité.

On l’utilise souvent dans la couche finale d’un mod‘ele de classification, notamment pour
les problèmes en multiclasse.

exi
softmax(xi ) = Pn (2.10)
j=1 exj

Figure 2.15 – Schéma de la fonction Softmax

2.5.3 Architectures des réseaux de neurone

L’architecture d’un réseau neuronal désigne la structure et l’organisation des différents

composants qui le composent. Cela inclut le nombre de couches, le nombre de neurones
dans chaque couche, ainsi que les connexions entre les neurones. L’architecture d’un réseau
neuronal est déterminante pour sa capacité à apprendre et à résoudre des problèmes
spécifiques. En choisissant une architecture adaptée, il est possible d’optimiser les perfor-
mances du réseau et d’obtenir des résultats précis et efficaces pour une tâche donnée.

Réseau de neurone a une seule couche

Un réseau de neurones à une seule couche, également appelé réseau de neurones mono-
couche, est une architecture simple où tous les neurones sont organisés dans une seule
couche. Cette couche est souvent appelée couche de sortie, car elle génère les sorties du
réseau. Chaque neurone de cette couche est connecté à toutes les entrées du réseau et
effectue un calcul pondéré suivi d’une fonction d’activation pour générer sa sortie. Les
réseaux de neurones à une seule couche sont couramment utilisés pour des tâches simples
de classification ou de régression.

Les S neurones d’une même couche sont tous branchés aux R entrées, on dit alors que la
couche est totalement connectée. On obtient la matrice x comme suit :
2.5 Les Neurones 28

Figure 2.16 – Schéma d’un réseau de neurones à une seule couche [30]

 
w11 · · · w1R
 .. ... .. 

w= . . 

(2.11)
 
wS1 · · · wSR

Architecture de réseau neuronal multicouche

Un réseau de neurones multicouches, également appelé réseau de neurones profond, est une
architecture composée de plusieurs couches de neurones interconnectées. Chaque couche,
à l’exception de la couche d’entrée, est constituée de nombreux neurones qui transmettent
les informations aux neurones de la couche suivante. Les neurones d’une couche reçoivent
des entrées pondérées, effectuent un calcul et appliquent une fonction d’activation pour
générer leur sortie. Les couches intermédiaires, appelées couches cachées, permettent au
réseau de capturer des caractéristiques et des représentations de plus en plus abstraites à
mesure que l’information se propage. La dernière couche, appelée couche de sortie, produit
les résultats finaux du réseau. La figure 2.17 illustre le concept d’un MLP (Multi-Layer
Perceptron) composé de trois couches :

Figure 2.17 – Schéma d’un réseau de neurones multicouche [31]

2.6 Entraı̂ner un réseau de neurones artificiels 29

Les réseaux de neurones multicouches sont capables de modéliser des relations complexes
et sont largement utilisés dans des domaines tels que la vision par ordinateur, le traitement
du langage naturel et d’autres tâches d’apprentissage automatique. Comme le montre la
(l)
figure précédente, nous désignons l’unité d’activation ith dans la couche l comme ai .
   
(in)
a0   1 
 (in)   (in) 
a1  x1 
a(in) = . =
 
 . 

(2.12)
 .   . 
 .   . 
   
a(in)
m x(in)
m

2.6 Entraı̂ner un réseau de neurones artificiels

Maintenant que nous avons examiné l’architecture d’un réseau neuronal, il est temps d’ap-
profondir certains concepts tels que la fonction de coût, l’algorithme de rétropropagation
et les algorithmes d’optimisation que nous mettons en œuvre pour l’apprentissage des
paramètres.

2.6.1 La fonction de cout

La fonction de coût est une mesure utilisée pour évaluer la performance d’un modèle
d’apprentissage automatique. Elle quantifie l’écart entre les prédictions du modèle et les
valeurs réelles des données. L’objectif est de minimiser cette fonction de coût afin d’obtenir
les meilleures prédictions possibles. Différentes fonctions de coût peuvent être utilisées en
fonction du problème et du type d’apprentissage, telles que l’erreur quadratique moyenne
(MSE) pour la régression ou l’entropie croisée pour la classification :

n
y (i) log(a(i) ) + (1 − y (i) ) log(1 − a(i) )
X
J(w) = − (2.13)
i=1

Ici, a(i) est l’activation fonction du ième échantillon dans l’ensemble de données :

a(i) = ϕ(z (i) ) (2.14)

N’oublions pas que notre objectif est de minimiser la fonction de coût J(W) ; ainsi, nous
devons calculer la dérivée partielle des paramètres W par rapport à chaque poids pour
chaque couche du réseau (rétropropagation) :
2.6 Entraı̂ner un réseau de neurones artificiels 30

∂
(l)
J(w) (2.15)
∂wji

Mettre à jour les poids :

wj+1 = wj − η∇J(wj ) (2.16)

Dans la prochaine section, nous parlerons de l’algorithme d’optimisation, qui nous permet
de trouver les valeurs optimales des paramètres du modèle afin de minimiser la fonction
de coût.

2.6.2 les algorithmes d’optimisation

Les algorithmes d’optimisation en apprentissage automatique sont des méthodes utilisées

pour ajuster les paramètres d’un modèle de manière itérative afin de minimiser la fonction
de coût associée à la tâche d’apprentissage. Leur objectif principal est de réduire la fonction
de coût en trouvant les valeurs optimales des paramètres qui permettent d’obtenir les
meilleures performances du modèle. Ces algorithmes utilisent différentes stratégies pour
ajuster les paramètres du modèle de manière itérative. Voici quelques-uns des algorithmes
d’optimisation couramment utilisés :

Descente de gradient (Gradient Descent)

L’algorithme de descente de gradient utilise le gradient de la fonction de coût par rapport

aux paramètres pour déterminer la direction dans laquelle les paramètres doivent être
ajustés. Il ajuste les paramètres itérativement en suivant la direction opposée au gradient,
de sorte que la fonction de coût diminue à chaque itération. Pour calculer le gradient de

Figure 2.18 – Illustration de la descre de gradient.

2.6 Entraı̂ner un réseau de neurones artificiels 31

la fonction de coût, nous devons calculer la dérivée partielle de la fonction de coût par
rapport à chaque poids, wj

∂J (i)
= − (y (i) − ϕ(z (i) ))xj
X
(2.17)
∂wj

Puisque nous mettons à jour tous les poids simultanément :

wj+1 = wj − η∇J(wj ) (2.18)

La descente de gradient peut être réalisée avec différentes variantes, telles que la descente
de gradient stochastique (SGD) qui utilise un échantillon aléatoire à chaque itération,
la descente de gradient par lot (batch gradient descent) qui utilise tous les exemples
d’entraı̂nement à chaque itération, ou la descente de gradient mini-batch qui utilise un
sous-ensemble d’exemples d’entraı̂nement.

Momentum

Le momentum est un algorithme d’optimisation conçu pour accélérer la convergence de

la descente de gradient en utilisant un terme d’inertie. L’idée principale derrière le mo-
mentum est d’accumuler une moyenne pondérée des gradients précédents et de l’utiliser
pour guider les mises à jour des poids du modèle. Pour un poids wj à l’itération t :

vt = µvt−1 − lr · η∇J(wj ) (2.19)

ou :
w j = w j + vt (2.20)

– η est le taux d’apprentissage (learning rate), qui contrôle la taille des mises à jour des
poids.
– ∇J(wj ) est le gradient de la fonction de coût par rapport au poids wj .
– vt est la variable de momentum à l’itération t.
– µ est le coefficient de momentum..

RMSprop (Root Mean Square Propagation)

L’algorithme RMSprop utilise les estimations des carrés des gradients précédents pour
mettre à jour les taux d’apprentissage. Il favorise une convergence plus rapide et une
meilleure adaptation des taux d’apprentissage aux différentes caractéristiques des données.
2.6 Entraı̂ner un réseau de neurones artificiels 32

gt = ∇J(wj ) (gradient du poids wj ) (2.21)

vt = γvt−1 + (1 − γ)gt2 (mise à jour du deuxième moment) (2.22)

gt
wj = wj − η √ (mise à jour du poids) (2.23)
vt +

Adam (Adaptive Moment Estimation)

Adam est un algorithme d’optimisation couramment utilisé dans l’apprentissage auto-

matique. Il combine les avantages du momentum et de RMSprop en adaptant les taux
d’apprentissage pour chaque paramètre du modèle. Pour un poids wj à l’itération t :

gt = ∇J(wj ) (gradient du poids wj ) (2.24)

mt = β1 mt−1 + (1 − β1 )gt (mise à jour du premier moment) (2.25)

vt = β2 vt−1 + (1 − β2 )gt2 (mise à jour du deuxième moment) (2.26)

mt
m̂t = (correction du premier moment biaisé) (2.27)
1 − β1t

vt
v̂t = (correction du deuxième moment biaisé) (2.28)
1 − β2t

m̂t
wj = wj − η √ (mise à jour du poids) (2.29)
v̂t +

L’algorithme Adam ajuste les taux d’apprentissage de manière adaptative en utilisant

les estimations du premier moment et du deuxième moment, corrige les biais introduits
par l’initialisation des moments et effectue les mises à jour des poids en utilisant ces
estimations adaptées. L’utilisation de l’algorithme Adam permet généralement d’améliorer
la vitesse de convergence, la robustesse du modèle et la capacité à s’adapter à différentes
situations d’optimisation.
2.6 Entraı̂ner un réseau de neurones artificiels 33

2.6.3 Underfitting and Overfitting

Si le modèle commet de nombreuses erreurs sur les données d’entraı̂nement, nous disons
que le modèle a un biais élevé ou qu’il présente un sous-apprentissage. Ainsi, le sous-
apprentissage correspond à l’incapacité du modèle à prédire correctement les étiquettes
des données sur lesquelles il a été entraı̂né. La figure 2.19 présente les résultats de l’ap-
prentissage sous forme de trois graphiques distincts.

Underfitting Good fit Overfitting

(Sur-Apprentissage) (Bon ajustement) (Sous-Apprentissage)
Figure 2.19 – Exemples de sous-apprentissage (modèle linéaire), bon ajustement (modèle qua-
dratique) et surapprentissage (polynôme de degré 15)[32]

Il peut y avoir plusieurs raisons au Underfiting (sous-apprentissage), dont les plus im-
portantes sont les suivantes :
– La première raison est facile à illustrer dans le cas de la régression unidimensionnelle :
l’ensemble de données peut ressembler à une ligne courbée, mais notre modèle est une
ligne droite.
– La deuxième raison peut être illustrée comme ceci : supposons que vous souhaitez
prédire si un patient a un cancer, et les caractéristiques dont vous disposez sont la
taille, la pression artérielle et la fréquence cardiaque. Ces trois caractéristiques ne sont
clairement pas de bons prédicteurs du cancer, donc notre modèle ne sera pas en mesure
d’apprendre une relation significative entre ces caractéristiques et l’étiquette.
La solution au problème de sous-apprentissage est d’essayer un modèle plus complexe ou
d’élaborer des caractéristiques ayant un pouvoir prédictif plus élevé.

Overfitting se produit lorsque le modèle devient trop complexe et s’adapte excessive-

ment aux données d’entraı̂nement spécifiques, en mémorisant les bruits et les variations
aléatoires. Cela se traduit par une excellente performance sur les données d’entraı̂nement,
mais une performance médiocre sur de nouvelles données. Plusieurs solutions sont pos-
sibles pour résoudre le problème de overfitting (surapprentissage) :
– Essayez un modèle plus simple
– Réduisez la dimensionnalité des exemples dans le jeu de données.
2.6 Entraı̂ner un réseau de neurones artificiels 34

– Ajoutez davantage de données d’entraı̂nement, si possible.

– Appliquer une régularisation sur le modèle.
La régularisation et le dropout est l’approche la plus couramment utilisée pour prévenir
le surapprentissage.

2.6.4 Gérer le overfitting par la régularisation

La régularisation est un terme générique qui englobe des méthodes qui obligent l’algo-
rithme d’apprentissage à construire un modèle moins complexe. En pratique, cela en-
traı̂ne souvent un biais légèrement plus élevé mais réduit considérablement la variance.
Ce problème est connu dans la littérature sous le nom biais-variance tradeoff. Parmi
les différentes méthodes de régularisation, nous pouvons citer L1 et L2 regularization,
dropout, data augmentation.

L1/L2 regularization

Les deux types de régularisation les plus couramment utilisés sont appelés régularisation
L1 et régularisation L2. L’idée est assez simple. Pour créer un modèle régularisé, nous
modifions la fonction objective en ajoutant un terme de pénalisation dont la valeur est
plus élevée lorsque le modèle est plus complexe. Dans la régularisation L1, les coefficients
de régression sont obtenus en minimisant la fonction de perte L1, exprimée comme suit :
n
(ŷ (i) − y (i) )2 + αkwk1
X
J(w)L1 = (2.30)
i=1

ou : m
X
kwk1 = |wj | (2.31)
j=1

Dans la régularisation L2, les coefficients de régression sont obtenus en minimisant la

fonction de perte L1, exprimée comme suit :
n
(ŷ (i) − y (i) )2 + αkwk22
X
J(w)L2 = (2.32)
i=1

ou : m
kwk22 = wj2
X
(2.33)
j=1
2.6 Entraı̂ner un réseau de neurones artificiels 35

Dropout

Dropout est une technique de régularisation spécifique aux réseaux de neurones. Pendant
l’entraı̂nement, des neurones aléatoires sont abandonnés ou désactivés avec une certaine
probabilité. Cela oblige le réseau à apprendre de manière plus robuste en évitant de trop
dépendre de certains neurones spécifiques, ce qui réduit le risque de surajustement.

Figure 2.20 – Schéma de la technique de dropout.

Data augmentation

La data augmentation est une technique qui consiste à augmenter la taille du jeu de
données d’entraı̂nement en générant de nouveaux exemples synthétiques. Elle joue un rôle
important dans la régularisation du modèle en introduisant de la variabilité et en aidant
le modèle à mieux généraliser. En appliquant des transformations aléatoires ou contrôlées
sur les exemples existants. Voici quelques-unes des techniques couramment utilisées :
– Translations et rotations
– Miroir (symétrie)
– Ajustement du contraste la luminosité
– Ajout de bruit
– Recadrage et redimensionnement

Figure 2.21 – Exemples des différentes techniques d’augmentation de données.

2.6 Entraı̂ner un réseau de neurones artificiels 36

La data augmentation permet d’améliorer la capacité du modèle à s’adapter à des données

nouvelles et inconnues, tout en réduisant la sensibilité aux variations mineures des données
d’entrée.

2.6.5 Réseau neuronal convolutif

Les réseaux de neurones convolutionnels (CNN) sont un type de modèle d’apprentissage

automatique utilisé principalement pour l’analyse d’images et de données structurées. Ils
sont largement utilisés dans des domaines tels que la vision par ordinateur, la reconnais-
sance d’objets, la classification d’images et la détection d’anomalies.

Comme vous pouvez le voir dans la figure 2.22, un réseau de neurones convolutif (CNN)
calcule des cartes de caractéristiques à partir d’une image d’entrée, où chaque élément
provient d’un patch local de pixels dans l’image d’entrée.

Figure 2.22 – Exemple d’un réseau de neurones convolutif (CNN) pour la génération de cartes
de caractéristiques

– La connectivité parcimonieuse (sparse connectivity) : se réfère au fait que

chaque neurone dans une couche convolutive est connecté uniquement à un sous-ensemble
restreint de neurones de la couche précédente, appelé champ récepteur local. Cela réduit
la complexité du modèle tout en capturant les motifs locaux importants de l’image.
– Partage des paramètres (parameter-sharing) : Les mêmes poids sont utilisés pour
différents patches de l’image d’entrée.

2.6.6 Architecture du réseau neuronal convolutif

Un CNN (réseau de neurones convolutif) comprend généralement trois couches : une

couche convolutive, une couche de pooling et une couche entièrement connectée. La figure
2.23 illustre une exemple d’architecture d’un CNN :
2.6 Entraı̂ner un réseau de neurones artificiels 37

Figure 2.23 – Exemples d’Architecture d’un réseau neuronal convolutif

Couche convolutif

La couche convolutive extrait les caractéristiques d’une image ou d’une entrée spatiale en
appliquant des filtres de convolution. Ces filtres permettent de détecter des motifs visuels
locaux tels que des bords, des textures et des formes, ce qui permet au réseau de neurones
convolutif (CNN) de reconnaı̂tre des objets et des structures plus complexes.
La figure 2.24 illustre la convolution 2D d’une matrice d’entrée de taille 8 × 8 à l’aide
d’un noyau de taille 3 × 3. La matrice d’entrée est rembourrée de zéros avec p = 1. En
conséquence, la sortie de la convolution 2D aura une taille de 8 × 8 :

Figure 2.24 – Exemple de convolution 2D avec rembourrage (padding)

Si nous avons une entrée de taille W x W x D avec Dout nombres de noyaux d’une taille
spatiale de F, avec un pas de S et un padding de P, alors la taille du volume de sortie
peut être déterminée par la formule 2.34 :

W − F + 2P
Wout = +1 (2.34)
S

En résumé, la couche convolutive dans un CNN effectue une opération de convolution

sur l’image ou l’entrée spatiale pour extraire des caractéristiques significatives, ce qui est
2.6 Entraı̂ner un réseau de neurones artificiels 38

crucial pour la capacité du réseau à comprendre et à traiter les données visuelles.

Couche de pooling

Dans une couche de pooling, une fenêtre de pooling (généralement de taille 2 × 2) se

déplace sur la carte des caractéristiques de la couche précédente avec un pas spécifié. À
chaque position, le pooling effectue une opération d’agrégation, généralement une fonction
de maximum (max pooling) ou de moyenne (average pooling), en prenant la valeur maxi-
male ou moyenne des éléments dans la fenêtre. La figure suivante illustre le max pooling
2D d’une matrice d’entrée de taille 8 × 8. Si nous avons une carte d’activation de taille

Figure 2.25 – Exemple de max pooling 2D.

W x W x D, un noyau de pooling de taille spatiale F et un pas S, alors la taille du volume

de sortie peut être déterminée par la formule 2.35 :

W −F
Wout = +1 (2.35)
S

En résumé, la couche de pooling dans un CNN réduit la taille spatiale des caractéristiques
en effectuant une opération d’agrégation, aidant ainsi à réduire la complexité du modèle,
à améliorer l’efficacité computationnelle et à introduire une certaine invariance aux trans-
lations locales.

Couche entièrement connectée :

La couche entièrement connectée, également appelée couche dense, est une composante
essentielle d’un réseau de neurones. Elle est utilisée pour effectuer la classification ou
la prédiction finale en prenant en compte les caractéristiques extraites par les couches
précédentes.La figure 2.26 représente une couche entièrement connectée (fully connected
layer) avec une fonction d’activation softmax :
En résumé, la couche entièrement connectée dans un réseau de neurones est responsable
de la combinaison des caractéristiques extraites et de la prise de décision finale pour la
classification ou la prédiction des données.
2.6 Entraı̂ner un réseau de neurones artificiels 39

Figure 2.26 – Exemple d’une couche entièrement connectée

2.6.7 Les architectures CNN les plus courantes

Il existe plusieurs architectures de réseaux de neurones convolutionnels. Dans notre travail,

nous nous intéressons à quatre architectures CNN les plus performantes (SqueezeNet,
VGG16, ResNet50, InceptionV3).

SqueezeNet est le nom d’un réseau neuronal profond lancé en 2016. Il a été développé par
des chercheurs de DeepScale, de l’Université de Californie à Berkeley et de l’Université
de Stanford. L’objectif des auteurs lors de la conception de SqueezeNet était de créer un
réseau de neurones plus petit avec moins de paramètres, qui pourrait facilement s’intégrer
dans la mémoire de l’ordinateur et être transmis plus facilement sur un réseau informa-
tique. SqueezeNet est un réseau neuronal convolutif de 18 couches de profondeur, avec
une taille d’entrée d’image de 227 par 227.

VGG16 est un modèle de réseau neuronal convolutif proposé par K. Simonyan et A. Zis-
serman de l’Université d’Oxford dans l’article intitulé ”Very Deep Convolutional Networks
for Large-Scale Image Recognition”. Ce modèle atteint une précision de 92,7% dans le top
5 des tests d’ImageNet et est l’un des modèles les plus célèbres soumis à l’ILSVRC [14].
VGG-16 est un réseau de 16 couches de profondeur, avec une taille d’entrée d’image de
224 par 224.

Le réseau résiduel (ResNet50) a été développé par Kaiming He et al. Il a remporté l’ILS-
VRC 2015 en apprenant des représentations de fonctionnalités riches pour un large éventail
d’images. ResNet-50 est un réseau neuronal convolutif de 50 couches de profondeur, avec
une taille d’entrée d’image de 224 par 224.

Inception V3 est un modèle de reconnaissance d’images capable d’obtenir une précision

significative. Il est le résultat de nombreuses idées développées par plusieurs chercheurs
au fil des années. Il est basé sur l’article original intitulé ”Rethinking the Inception Ar-
chitecture for Computer Vision” de C. Szegedy et al . InceptionV3 est un réseau neuronal
2.7 Modèles de détection d’objets 40

convolutif de 48 couches de profondeur, avec une taille d’entrée d’image de 299 par 299.
Le tableau 2.1 montre la comparaison entre les quatre architectures CNN.

Architecture Nombre de couche Taille d’entrée d’image

SqueezeNet 18 227*227*3
VGG16 16 224*224*3
InceptionV3 50 224*224*3
ResNet 48 299*299*3

Table 2.1 – Comparaison entre les quatre architectures CNN

2.7 Modèles de détection d’objets

Les modèles de détection d’objets sont des outils puissants dans le domaine de la vision
par ordinateur qui permettent de localiser et d’identifier différents objets dans des images
ou des vidéos.

L’objectif principal des modèles de détection d’objets est de comprendre et d’analyser

les informations visuelles contenues dans une scène afin d’identifier les objets qui y sont
présents. Ils sont capables de détecter et de localiser différents types d’objets.

Figure 2.27 – Exemples des types de modèles de détection d’objets

2.7.1 Modèles à un seul stage (Single-Stage Models)

Les modèles à un seul stage sont conçus pour détecter et classifier les objets en une
seule passe, sans nécessiter d’étapes supplémentaires de proposition de régions d’intérêt.
2.7 Modèles de détection d’objets 41

Ils effectuent la détection directement sur la grille de localisation de l’image en utilisant

des techniques telles que les ancres (anchors) ou les boı̂tes englobantes (bounding boxes)
prédéfinies. Ces modèles effectuent généralement des prédictions pour chaque position de
la grille et chaque ancre, en estimant la probabilité d’objet présent, les coordonnées de
la boı̂te englobante et les classes associées. Les modèles à un seul stage, tels que YOLO
(You Only Look Once) et SSD (Single Shot MultiBox Detector) et CenterNet, sont réputés
pour leur vitesse de traitement rapide et leur capacité à détecter efficacement des objets
de différentes tailles et formes.

SSD

Le SSD est un modèle de détection d’objets à un seul stage largement utilisé en vision
par ordinateur. Il permet d’identifier et de localiser des objets spécifiques dans une image
en une seule passe, sans nécessiter d’étapes supplémentaires de proposition de régions
d’intérêt [14]

Tout d’abord, nous décrivons comment le SSD détecte les objets à partir d’une seule
couche. En réalité, il utilise plusieurs couches (cartes de caractéristiques multi-échelles)
pour détecter les objets de manière indépendante. À mesure que le CNN réduit pro-
gressivement la dimension spatiale, la résolution des cartes de caractéristiques diminue
également. Le SSD utilise des couches de résolution plus basse pour détecter des objets
à plus grande échelle. Par exemple, la figure 2.28 présente les cartes de caractéristiques
de 4 × 4 sont utilisées pour les objets à plus grande échelle. Le SSD ajoute 6 couches de

Figure 2.28 – Les cartes de caractéristiques de résolution inférieure (à droite) détectent des
objets à plus grande échelle [33]

convolution auxiliaires supplémentaires après le VGG16. Cinq d’entre elles seront ajoutées
pour la détection d’objets. voir figure 2.29, Dans trois de ces couches, nous effectuons 6
2.7 Modèles de détection d’objets 42

prédictions au lieu de 4. Au total, le SSD effectue 8732 prédictions en utilisant 6 couches.

Figure 2.29 – SSD : Détecteur multi-boı̂tes en une seule passe

Les cartes de caractéristiques multi-échelles (Multi-scale feature maps) améliorent considérablement

la précision. la table 3.1 présente la précision obtenue en fonction du nombre de couches
de cartes de caractéristiques utilisées pour la détection d’objets

Prediction source layers from mAP # Boxes

38 x 38 19 x 19 10 x 10 5 x 5 3 x 3 1x1 Yes No
x x x x x x 74.3 63.4 8732
x x x 70.7 69.2 9864
x 62.4 64.0 8664

Table 2.2 – Expérience avec des cartes de caractéristiques à échelles multiples

En conclusion, le SSD est un modèle efficace et rapide pour la détection d’objets. Il

offre une détection en une seule passe, une vitesse élevée et une précision satisfaisante
pour de nombreux scénarios d’application. Le SSD a révolutionné la détection d’objets en
combinant efficacement vitesse et précision.

CenterNet

CenterNet est un modèle de détection d’objets qui se distingue par son approche novatrice
basée sur la prédiction des centres d’objets. Au lieu de se concentrer sur la détection de
boı̂tes englobantes, CenterNet vise à localiser précisément les centres des objets dans une
image [21]
2.7 Modèles de détection d’objets 43

Figure 2.30 – CenterNet régresse les centres des objets ainsi que leurs attributs (largeur et
hauteur pour la détection d’objets en 2D) [34]

Dans le modèle de détection d’objets CenterNet, plusieurs éléments clés sont utilisés pour
localiser et décrire les objets détectés.

Tout d’abord, il utilise une carte de chaleur (heatmap) pour prédire les centres des objets
avec précision.

Chaque pixel de la carte de chaleur indique la probabilité qu’il soit le centre d’un objet.

Ensuite, CenterNet prédit la taille et la forme des objets en utilisant des informations de
taille (object size).

Cela permet d’estimer la taille exacte des objets détectés. Enfin, le modèle utilise des
décalages locaux (local offset) pour ajuster les coordonnées des boı̂tes englobantes par
rapport aux centres détectés, ce qui permet une localisation plus précise des objets dans
l’image.voir la figure 2.30, Ensemble, ces éléments, la carte de chaleur, la taille des objets
et les décalages locaux, contribuent à la précision et à l’exactitude de la détection d’objets
dans le modèle CenterNet. CenterNet traite les entrées en passant l’image par un réseau
de neurones convolutifs pour extraire des caractéristiques, puis utilise ces caractéristiques
pour prédire la carte de chaleur (heatmap head), la taille des objets (Dimension head)
et les décalages locaux (Offset Head). L’architecture de traitement du modèle CenterNet
est présentée dans la figure 2.31. Ces informations sont ensuite utilisées pour extraire les
résultats de détection d’objets voir la figure 2.31.

Le backbone (feature extractor) du modèle CenterNet est constitué d’un réseau de neu-
rones convolutifs pré-entraı̂né, tel que ResNet ou Hourglass ou DLA.Il est responsable de
l’extraction des caractéristiques de l’image, ce qui contribue à la capacité de CenterNet à
détecter et localiser précisément les objets.

En conclusion, le modèle CenterNet est une approche avancée et précise pour la détection
d’objets, utilisant des cartes de chaleur, des informations sur la taille et les décalages
locaux. Il offre une combinaison optimale de précision et d’efficacité, et peut être appliqué
à diverses applications de vision par ordinateur.
2.7 Modèles de détection d’objets 44

Figure 2.31 – Schéma d’entraı̂nement de CenterNet [34]

2.7 Modèles de détection d’objets 45

2.7.2 Modèles à deux étapes (Two-Stage Models)

Les modèles à deux étapes sont basés sur une approche en cascade avec deux étapes
principales. La première étape consiste à générer un ensemble de propositions de régions
d’intérêt potentielles à partir de l’image en utilisant des techniques comme les régions
d’intérêt (RoI) ou les régions de recherche (Region Proposal). Ces régions sont ensuite
alignées et adaptées pour correspondre plus précisément aux objets présents dans l’image.
Dans la deuxième étape, les régions proposées sont classifiées et étiquetées pour déterminer
la présence ou l’absence d’objets spécifiques, ainsi que leurs classes correspondantes. Les
modèles à deux étapes, tels que R-CNN (Region-based Convolutional Neural Network),
Fast R-CNN et Faster R-CNN, sont appréciés pour leur précision de détection élevée, en
particulier pour les petits objets ou les scènes complexes.

Faster R-CNN

Faster R-CNN est un modèle de détection d’objets basé sur des réseaux de neurones
convolutifs (CNN) qui propose une approche en deux étapes pour détecter et localiser les
objets dans une image. Il utilise une région de proposition (Region Proposal Network -
RPN) pour générer des régions d’intérêt potentielles, puis applique un réseau de neurones
convolutifs pour classer et raffiner ces régions d’intérêt.voir figure 2.32. Faster R-CNN a
introduit le concept d’apprentissage de la région de proposition, ce qui lui permet d’être
plus rapide et plus précis par rapport aux approches précédentes. Il est largement utilisé
dans les tâches de détection d’objets, offrant une performance élevée et une flexibilité dans
la détection d’objets de différentes tailles et catégories.

Figure 2.32 – Architecture Faster R-CNN [35]

Le choix du backbone peut varier, mais des architectures populaires telles que VGG16, Re-
sNet, et Inception sont couramment utilisées. figure 2.33 présente architecture de VGG16.
Le backbone du modèle Faster R-CNN est responsable de l’extraction des caractéristiques
2.8 Conclusion 46

à partir de l’image en appliquant des opérations de convolution, de regroupement (poo-

ling) et d’autres opérations non linéaires. Il s’agit d’une partie essentielle du modèle qui
permet de capturer des informations de bas niveau et de haut niveau à partir de l’image,
permettant ainsi une détection précise des objets.

Figure 2.33 – Architecture VGG16. [36]

En résumé, le modèle Faster R-CNN traite les données en utilisant un RPN pour générer
des régions d’intérêt, puis utilise un réseau de neurones convolutifs pour classer et localiser
précisément les objets dans ces régions. Cette approche en deux étapes permet au modèle
de détecter efficacement les objets dans des images complexes tout en conservant une
précision élevée.

2.8 Conclusion

En conclusion, ce chapitre a permis de mettre en évidence l’importance croissante du

Deep Learning dans de nombreux domaines, notamment la vision par ordinateur et la
détection d’objets. Les réseaux neuronaux convolutifs se sont avérés être une approche
puissante pour extraire des caractéristiques significatives à partir d’images, permettant
ainsi des tâches de classification et de localisation précises. Les méthodes de détection
d’objets, telles que SSD, RCNN et centerNet, ont été présentées comme des avancées si-
gnificatives dans le domaine de la détection précise et rapide des objets dans des images
ou des vidéos. Chaque méthode a ses propres particularités et avantages, adaptés à
des scénarios d’utilisation spécifiques. En résumé, ce chapitre a posé les bases pour la
compréhension des concepts clés du Deep Learning, des réseaux neuronaux convolutifs et
des méthodes de détection d’objets. Il ouvre la voie vers une analyse plus approfondie et
des expérimentations futures dans votre mémoire.
Chapitre 3

Résultats et analyses

47
3.1 Introduction 48

3.1 Introduction

Dans ce chapitre, nous verrons comment appliquer la détection d’objets à l’aide Deep
Learning. Plus précisément, nous allons utiliser les algorithmes SSD-Mobilenet et Faster
R-CNN-ResNet50 pour construire notre détecteur d’objets. A la fin, nous examinerons les
résultats de l’application du détecteur à des exemples d’images d’entrées.

3.2 Outils et environement de développement

Notre projet de fin d’études portait sur la détection d’objets, et pour cela on a uti-
lisé Python, TensorFlow et Keras comme principaux outils de développement voir figure
3.1 (a) (b) (c). Python, un langage de programmation polyvalent, et TensorFlow, une
bibliothèque d’apprentissage automatique open-source, nous a permis de créer et d’en-
traı̂ner efficacement des modèles de détection d’objets. On a également utilisé Keras,
une bibliothèque haut niveau intégrée à TensorFlow, qui a simplifié la création et l’en-
traı̂nement de réseaux de neurones convolutifs. Pour la réalisation de notre projet, On a
utilisé Raspberry Pi 4 comme plateforme de déploiement, ce qui a permis une exécution
en temps réel et une portabilité accrue voir figure 3.1 (d). L’ensemble de ces outils et
environnements de développement nous a permis de développer un modèle de détection
d’objets précis et efficace, tout en offrant une interface conviviale pour le développement
et l’entraı̂nement des modèles.

(a) Python [37] (b) TensorFlow [38]

(c) Keras [39] (d) Raspberry pi [27]

Figure 3.1 – Logos des outils et environnements utilisés
3.3 Dataset utilisée 49

3.3 Dataset utilisée

Dans le cadre de notre recherche sur la détection de drones, on a utilisé une dataset
provenant de Kaggle, une plateforme en ligne populaire pour les ensembles de données et
les compétitions en apprentissage automatique, voir la figure 3.2. La source de données
provenant de Kaggle a fourni une base solide pour notre projet.

Figure 3.2 – Logo de Kaggle [40]

L’avantage d’utiliser une dataset de Kaggle est qu’elle est souvent prétraitée et bien or-
ganisée, ce qui m’a permis de gagner du temps et de me concentrer davantage sur le
développement de notre modèle. De plus, la possibilité de télécharger des ensembles de
données provenant de Kaggle a élargi mes options et m’a offert une diversité d’exemples
pour former notre modèle de détection de drones.

Figure 3.3 – Exemples d’images utilisées comme dataset [41]

On a divisé notre ensemble de données pour la détection de drones en deux parties : un

ensemble d’entraı̂nement avec 128 images (80%) et un ensemble de test avec 26 images
(20%) voir figure 3.4. L’ensemble d’entraı̂nement a été utilisé pour former le modèle,
tandis que l’ensemble de test a servi à évaluer ses performances. Cette division permet
3.3 Dataset utilisée 50

Dossier d’entraı̂nement. Dossier de test.

Figure 3.4 – Les données utilisées dans l’entraı̂nement et le test.

d’évaluer la capacité du modèle à généraliser et à détecter les drones dans des situations
réelles.

L’utilisation d’un ensemble d’entraı̂nement plus grand (dans ce cas, 80% des images)
permet au modèle d’apprendre à partir d’un plus grand nombre d’exemples et d’ajuster
ses paramètres en conséquence. Cela peut améliorer les performances du modèle et sa
capacité à capturer les relations entre les caractéristiques des données.

D’autre part, l’ensemble de test plus petit (dans ce cas, 20% des images) est utilisé pour
évaluer les performances du modèle de manière indépendante, en mesurant son exactitude
sur des données qu’il n’a pas vues auparavant. Cela permet de fournir une estimation
réaliste de la performance du modèle sur de nouvelles données.

3.3.1 Pretraitement des donnees

L’image labeling est un processus d’attribution d’étiquettes ou d’annotations aux images

pour fournir des informations spécifiques aux modèles d’apprentissage automatique. Cela
permet aux modèles de détecter, de segmenter ou de classifier des objets ou des régions
d’intérêt dans les images.Bien qu’il ait été nécessaire de consacrer du temps et des efforts
à l’étiquetage manuel.
3.3 Dataset utilisée 51

Figure 3.5 – Exemples d’images utilisées comme dataset

Pour l’étiquetage manuel des images de drones, on a utilisé l’outil LabelImg voir la fi-
gure précédente. LabelImg est un logiciel open-source largement utilisé pour l’annotation
d’images dans le domaine de la vision par ordinateur. Cet outil convivial offre une inter-
face graphique intuitive permettant de marquer facilement les régions d’intérêt dans les
images. Voici les étapes pour étiqueter les images de drones en utilisant l’outil LabelImg :
1. Installation : Commencez par installer l’outil LabelImg sur votre ordinateur.

Figure 3.6 – Installation de l’outil LabelImg à l’aide de Jupyter Notebook

2. Chargement d’une image : Dans LabelImg, cliquez sur ”Open” ou ”Ouvrir” pour
charger une image à étiqueter depuis le dossier contenant vos images de drones.

Figure 3.7 – Chargement d’une image

3. Annotation d’une région : Utilisez la souris pour dessiner un rectangle de délimitation

3.3 Dataset utilisée 52

autour du drone dans l’image. Ajustez la taille et la position du rectangle pour qu’il
englobe précisément le drone.

Figure 3.8 – Annotation d’une région à l’aide de LabelImg

4. Attribution d’une classe : Une fois que vous avez annoté la région du drone,
sélectionnez la classe correspondante dans la liste déroulante des classes prédéfinies
(par exemple, ”Drone” ou ”Drones”) dans l’interface LabelImg.

Figure 3.9 – Attribution d’une classe à l’aide de LabelImg

5. Sauvegarde de l’annotation : Cliquez sur le bouton ”Save” ou ”Enregistrer” pour

sauvegarder l’annotation de l’image. L’outil LabelImg créera automatiquement un
fichier XML ou un fichier de texte contenant les informations d’annotation corres-
pondantes.

Figure 3.10 – Sauvegarde de l’annotation dans LabelImg

3.4 Apprentissage et détection du drone 53

6. Répétition du processus : Répétez les étapes précédentes pour chaque image de

votre dataset, en annotant toutes les régions de drones visibles.

3.4 Apprentissage et détection du drone

Durant notre projet, nous avons utilisé Jupyter Notebook comme IDE. et Jupyter No-
tebook est une application web open-source qui vous permet de créer et partager des
documents contenant du code en direct, des équations, des visualisations et du texte
explicatif. Il offre un environnement computationnel interactif où vous pouvez combiner
l’exécution de code, la visualisation de données et le texte explicatif. Le nom ”Jupyter” est
un mélange des langages de programmation Julia, Python et R, qui étaient les langages
originaux pris en charge par le projet.

Figure 3.11 – Logo de Jypter Notebook [42]

Notre programme de détection d’objets repose sur une série d’étapes bien définies qui per-
mettent d’identifier et de localiser des objets spécifiques dans des images ou des vidéos.
En utilisant des techniques d’apprentissage automatique et des modèles de détection d’ob-
jets pré-entraı̂nés, notre programme est capable de reconnaı̂tre et de classifier différentes
classes d’objets, y compris les drones. voici les étapes clés de notre programme :

1. Configuration des paramètres et des fichiers essentiels du modèle de détection d’ob-

jets.

Figure 3.12 – Configuration des paramètres et des fichiers à l’aide de Jupyter Notebook

2. Configuration des chemins et des répertoires nécessaires pour le modèle de détection

d’objets.
3.4 Apprentissage et détection du drone 54

Figure 3.13 – Configuration des chemins et des répertoires à l’aide de Jupyter Notebook

3. Création des répertoires nécessaires pour le modèle de détection d’objets.

Figure 3.14 – Création des répertoires à l’aide de Jupyter Notebook

4. Installer Tensorflow Object Detection

Figure 3.15 – Installation de Tensorflow Object Detection à l’aide de Jupyter Notebook

5. Créer Label Map

Figure 3.16 – Création de Label Map à l’aide de Jupyter Notebook

6. Créer TF records

Figure 3.17 – Création de TF records à l’aide de Jupyter Notebook

3.5 Perte dans la détection d’objet 55

7. Mettre à jour la configuration pour le transfert d’apprentissage.

Figure 3.18 – Mise à jour de la configuration à l’aide de Jupyter Notebook

8. Apprentissage du modèle

Figure 3.19 – Apprentissage du modèle à l’aide de Jupyter Notebook

9. Evaluer le modèle

Figure 3.20 – Evaluation du modèle

En conclusion, notre programme de détection d’objets offre une solution efficace

pour identifier et localiser des objets spécifiques dans des images ou des vidéos. En
utilisant des techniques d’apprentissage automatique et des modèles pré-entraı̂nés,
nous avons créé un système capable de détecter des drones avec précision

3.5 Perte dans la détection d’objet

Dans la détection d’objets, la perte joue un rôle essentiel pour évaluer la précision du
modèle dans la localisation et la classification des objets. La perte est une mesure qui
3.5 Perte dans la détection d’objet 56

quantifie l’écart entre les prédictions du modèle et les vérités terrain (ground truths) des
objets. Elle guide l’optimisation du modèle en ajustant les poids pour minimiser cette
erreur. En utilisant différentes composantes de perte telles que la perte de classification,
la perte de localisation et la perte de régularisation.

3.5.1 La perte de classification

La perte de classification est une mesure utilisée pour évaluer la précision des prédictions
de classification d’un modèle par rapport aux étiquettes réelles des classes. Elle quantifie
l’écart entre les prédictions du modèle et les valeurs cibles. L’équation de la perte de
classification :

N X C
1 X
Lclassification =− yij log(pij ) (3.1)
N i=1 j=1

Cette équation calcule la perte de classification en utilisant la fonction de perte de l’en-

tropie croisée. Elle mesure l’écart entre les prédictions du modèle et les valeurs cibles pour
chaque classe et chaque échantillon. La somme des pertes pour tous les échantillons et
toutes les classes est ensuite normalisée par le nombre total d’échantillons N .

3.5.2 La perte de localisation

La perte de localisation est généralement calculée en utilisant une distance ou une métrique
appropriée pour mesurer l’écart entre les prédictions des boı̂tes englobantes (bounding
boxes) et les boı̂tes englobantes réelles des objets. La perte de localisation, également
connue sous le nom de perte de régression, mesure l’écart entre les prédictions de locali-
sation et les véritables annotations de localisation dans un modèle de détection d’objets.
La formule générale de la perte de localisation dépend du problème spécifique et de l’al-
gorithme utilisé.

N X M
1 X
Llocalisation = Loss(yi,j , ŷi,j ) (3.2)
N i=1 J=1

3.5.3 La perte de regularization

La perte de régularisation, également appelée perte de poids (weight regularization), est

une composante ajoutée à la fonction de perte. L’équation générale pour calculer la perte
de régularisation L2 est formulée comme suit :
3.6 Modèle SSD-Mobilenet 57

λX
Lregularization = ||wi ||2 (3.3)
2 i

Elle vise à prévenir le surajustement (overfitting) en limitant les valeurs extrêmes des
poids et en favorisant des solutions plus simples.

3.5.4 La perte total

La perte totale (total loss) est la somme des différentes composantes de perte dans un
modèle d’apprentissage automatique. Elle représente l’erreur globale du modèle lors de
son entraı̂nement et est utilisée pour guider l’optimisation du modèle.

Ltotal = Llocalisation + Lclassification + Lregularization (3.4)

La perte totale est utilisée pour ajuster les poids du modèle pendant l’entraı̂nement, en
minimisant l’erreur globale et en améliorant les performances du modèle sur les données
d’entraı̂nement. L’objectif est d’obtenir une perte totale minimale, ce qui indique que le
modèle s’ajuste efficacement aux données et est capable de généraliser correctement sur
de nouvelles données.

3.6 Modèle SSD-Mobilenet

Dans le cadre de notre projet de détection de drones, nous avons décidé d’explorer et
d’évaluer l’utilisation du modèle SSD MobileNet pour cette tâche. L’objectif est de tester
les performances de ce modèle dans la détection précise et rapide des drones dans des
images ou des vidéos.

Après l’entraı̂nement du modèle, nous avons réalisé des tests et des évaluations appro-
fondies pour mesurer ses performances. Nous avons utilisé des images et des vidéos de
différents scénarios, comprenant diverses conditions d’éclairage, des angles de vue variés
et des situations réalistes de présence de drones voici les résultats que nous avons obtenu :
3.6 Modèle SSD-Mobilenet 58

La perte de classification La perte de localisation

La perte de régularisation La perte totale

Figure 3.21 – Analyses des pertes dans le modèles SSD-Mobilenet

La perte de classification mesure l’écart entre les prédictions du modèle et les étiquettes
réelles des classes. Un résultat de 0.05 après 2000 steps indique de bonnes performances,
avec une précision de classification relativement élevée.
La perte de localisation mesure la précision de localisation du modèle. Un résultat de
0.025 après 2000 steps indique de bonnes performances, avec une précision de localisation
relativement élevée.
La perte de régularisation mesure l’ajustement et la généralisation du modèle. Un
résultat de 0.1465 après 2000 steps indique une régularisation adéquate, favorisant un
modèle plus robuste et moins susceptible de surajustement.
La perte totale est la somme des différentes composantes de perte, telles que la perte de
classification, la perte de localisation et la perte de régularisation.0.225 après 2000 steps
représente l’erreur globale accumulée par le modèle.
3.7 Modèle Faster R-CNN-ResNet50 59

Pas Perte de classification Perte de localisation Perte de régularisation Perte totale

600 0.14 0.1 0.154 0.40
1k 0.11 0.08 0.152 0.35
1.4k 0.9 0.07 0.150 0.30
2k 0.05 0.03 0.147 0.23

Table 3.1 – Analyses quantitative des graphiques des modèles SSD-Mobilenet

Figure 3.22 – Résultats obtenue du modèles SSD-Mobilenet

Sur la première photo de détection de drone, le modèle a obtenu une précision de 98%
pour détecter la présence de drones. Quant à la deuxième photo, le modèle a obtenu une
précision de 97% pour la détection de drones. Une précision de 98% et 97% est un résultat
solide, témoignant de la capacité du modèle à repérer efficacement les drones dans des
scénarios variés.

3.7 Modèle Faster R-CNN-ResNet50

Dans le cadre de notre projet de détection de drones, nous avons exploré et évalué l’uti-
lisation du modèle Faster R-CNN avec l’architecture ResNet50. Notre objectif était de
tester les performances de ce modèle en termes de détection précise et rapide des drones
dans des images et des vidéos.

Après avoir entraı̂né le modèle, nous avons procédé à des tests et à des évaluations ap-
profondies pour évaluer ses performances. Nous avons utilisé différentes images et vidéos
représentant une variété de scénarios, comprenant des conditions d’éclairage variées, des
angles de vue différents et des situations réalistes impliquant la présence de drones.Les
résultats obtenus ont été encourageants, démontrant la capacité du modèle Faster R-CNN
avec l’architecture ResNet50 à détecter avec précision les drones dans différents contextes,
voici les résultats que nous avons obtenu :
3.7 Modèle Faster R-CNN-ResNet50 60

La perte de classification La perte de localisation

La perte de régularisation La perte totale

Figure 3.23 – Analyses des pertes dans le modèles Faster RCNN ResNet50

La perte de classification mesure l’écart entre les prédictions du modèle et les étiquettes
réelles des classes. Un résultat de 0.11 après 2000 steps indique de bonnes performances,
avec une précision de classification relativement élevée.

La perte de localisation mesure la précision de localisation du modèle. Un résultat de

0.055 après 2000 steps indique de bonnes performances, avec une précision de localisation
relativement élevée.

La perte de régularisation mesure l’ajustement et la généralisation du modèle. Un

résultat de 0.1526 après 2000 steps indique une régularisation adéquate, favorisant un
modèle plus robuste et moins susceptible de surajustement.

La perte totale est la somme des différentes composantes de perte, telles que la perte
de classification, la perte de localisation et la perte de régularisation.0.31 après 2000 steps
représente l’erreur globale accumulée par le modèle.
3.8 Comparaison de la méthode SSD et Faster R-CNN 61

Pas Perte de classification Perte de localisation Perte de régularisation Perte totale

600 0.24 0.15 0.155 0.53
1k 0.21 0.16 0.155 0.53
1.4k 0.13 0.1 0.154 0.39
2k 0.1 0.06 0.151 0.3

Table 3.2 – Analyses quantitative des graphiques des modèles Faster R-CNN ResNet50

Figure 3.24 – Résultats obtenue du modèles Faster R-CNN ResNet50

Sur la première photo de détection de drone, le modèle a obtenu une précision de 92%
pour détecter la présence de drones. Quant à la deuxième photo, le modèle a obtenu une
précision de 90% pour la détection de drones. Une précision de 92% et 90% est un résultat
solide, témoignant de la capacité du modèle à repérer efficacement les drones dans des
scénarios variés.

3.8 Comparaison de la méthode SSD et Faster R-

CNN

Dans cette section, nous avons mené une étude comparative entre deux méthodes de
détection d’objets par Deep Learning : SSD et Faster R-CNN. L’objectif était de démontrer
l’efficacité de ces méthodes et d’évaluer leurs performances. Nous avons constaté que la
méthode SSD est plus rapide et plus fiable que Faster R-CNN pour les applications en
temps réel. En effet, la méthode SSD permet de détecter et d’entraı̂ner des objets en
même temps, ce qui la rend plus efficace pour les applications en temps réel. En revanche,
Faster R-CNN nécessite un temps d’exécution plus élevé, ce qui la rend moins adaptée
pour les applications en temps réel. En conclusion, la méthode SSD est plus rapide, plus
fiable et plus efficace que Faster R-CNN pour la détection d’objets par Deep Learning.
3.9 Conclusion 62

3.9 Conclusion

Dans ce troisième chapitre de notre mémoire, nous avons abordé les outils et l’environne-
ment de développement utilisés dans notre projet, tels que Python, Raspberry Pi, Keras
et TensorFlow. Nous avons ensuite présenté la source de notre jeu de données sur les
drones, provenant de Kaggle, et expliqué le processus d’étiquetage manuel des images.

Ensuite, nous avons comparé les performances des modèles RCNN (Régions avec Convo-
lutional Neural Network) et SSD (Single Shot MultiBox Detector) dans la détection des
drones. Après une évaluation approfondie, nous avons constaté que le modèle SSD offre de
meilleurs résultats de détection des drones par rapport au modèle RCNN. Cette conclusion
met en évidence l’efficacité et la précision du modèle SSD dans cette tâche spécifique.

Ces résultats sont d’une grande importance, car ils montrent que le modèle SSD est plus
adapté à la détection des drones dans les images ou les vidéos. Cela suggère que le SSD
pourrait être un choix optimal pour des applications pratiques nécessitant une détection
précise et rapide des drones.

En conclusion, ce chapitre nous a fourni une compréhension approfondie des outils et de

l’environnement de développement utilisés, de la préparation des données, de l’étiquetage
manuel et des performances comparatives des modèles RCNN et SSD dans la détection
des drones. Ces informations sont essentielles pour la suite de notre projet de détection
des drones et contribuent à l’avancement des connaissances dans ce domaine.
Conclusion Générale

Dans l’ensemble, les trois chapitres de ce mémoire ont permis d’explorer et de présenter
différentes facettes de la détection d’objets et de l’apprentissage en profondeur.

Dans le premier chapitre, nous avons mis en évidence le potentiel de l’apprentissage en

profondeur et des systèmes embarqués pour révolutionner le domaine de la vision par
ordinateur. Nous avons souligné l’importance de ces technologies pour la détection d’objets
en temps réel dans diverses applications, et nous avons noté qu’il reste encore beaucoup
à explorer et à améliorer dans ce domaine.

Le deuxième chapitre nous a permis de plonger plus en profondeur dans le fonctionnement

des réseaux neuronaux convolutifs et des méthodes de détection d’objets, telles que SSD,
RCNN et centerNet. Nous avons analysé les outils et l’environnement de développement
utilisés, la préparation du jeu de données du drone et l’étiquetage manuel des images. En
comparant les performances des modèles RCNN et SSD, nous avons conclu que le modèle
SSD offre de meilleurs résultats de détection des drones.

Enfin, dans le troisième chapitre, nous avons examiné les résultats obtenus en utilisant
le modèle SSD pour la détection des drones. Nous avons constaté une précision élevée
dans nos tests, confirmant l’efficacité du modèle dans cette tâche spécifique. Ces résultats
démontrent l’importance du choix du modèle et l’impact des différentes étapes du proces-
sus, de la préparation des données à l’évaluation des performances.

En conclusion, ce mémoire a contribué à notre compréhension des concepts clés, des outils
et des méthodes de détection d’objets dans le contexte de la détection des drones. Il a
posé les bases pour de futures recherches et développements, offrant des perspectives
intéressantes pour l’amélioration des performances des modèles et leur déploiement dans
des applications pratiques.

Pour terminer, nous espérons que ce travail servira de référence et d’inspiration pour
d’autres chercheurs et praticiens qui s’intéressent à la détection d’objets et à l’apprentis-
sage en profondeur, ou plus spécifiquement à la détection des drones.

63
Bibliographie

[1] C. Tang, Y. Ling, X. Yang, W. Jin, and C. Zheng, “Multi-view object detection based
on deep learning,” Appl. Sci., vol. 8, no. 9, 2018.
[2] A. c. Saaod M .Rasheed1, “Deep learning,” International Journal of Innovative Re-
search in Science Engineering and Technology, May 2019.
[3] P. Viola and M. Jones, “Rapid object detection using a boosted cascade of simple
features,” in IEEE Conf Comput Vis Pattern Recognit, pp. I–511, Feb 2001.
[4] P. F. Felzenszwalb, R. B. Girshick, D. McAllester, and D. Ramanan, “Object detec-
tion with discriminatively trained part-based models,” IEEE Trans. Pattern Anal.
Mach. Intell., vol. 32, pp. 1627–1645, Sept. 2010.
[5] A. IA, “Segmentation et détection d’objets en temps réel avec ten-
sorflow.” https://www.actuia.com/contribution/jeancharlesrisch/
segmentation-et-detection-dobjets-en-temps-reel-avec-tensorflow/,
October 26 2019. Consulté le 13 juin 2023.
[6] “ICA2IT 2019 : International Conference on Artificial Intelligence and Informa-
tion Technology.” http://wikicfp.com/cfp/servlet/event.showcfp?eventid=
77191&copyownerid=119134, March 2019. Consulté le 13 juin 2023.
[7] N. Dalal and B. Triggs, “Histograms of oriented gradients for human detection,” in
2005 IEEE Computer Society Conference on Computer Vision and Pattern Recogni-
tion (CVPR’05), pp. 886–893 vol. 1, June 2005.
[8] C. Cortes and V. Vapnik, “Support-vector networks,” Mach. Learn., vol. 20, pp. 273–
297, September 1995.
[9] D. Lowe, “Distinctive image features from scale-invariant keypoints,” Int. J. Comput.
Vis., vol. 60, p. 91, November 2004.
[10] R. Girshick, J. Donahue, T. Darrell, and J. Malik, “Rich feature hierarchies for accu-
rate object detection and semantic segmentation.” arXiv, October 22 2014. Consulté
le 14 juin 2023.
[11] R. Girshick, “Fast r-cnn.” arXiv, September 27 2015. Consulté le 14 juin 2023.
[12] S. Ren, K. He, R. Girshick, and J. Sun, “Faster R-CNN : Towards real-time object
detection with region proposal networks.” arXiv, January 6 2016. Consulté le 14 juin
2023.
[13] J. Redmon, S. Divvala, R. Girshick, and A. Farhadi, “You only look once : Uni-
fied, real-time object detection,” in 2016 IEEE Conference on Computer Vision and
Pattern Recognition (CVPR), pp. 779–788, June 2016.

64
BIBLIOGRAPHIE 65

[14] W. Liu and et al., “SSD : Single shot multibox detector,” in Proceedings of the
European Conference on Computer Vision (ECCV), pp. 21–37, 2016.
[15] K. He, X. Zhang, S. Ren, and J. Sun, “Deep residual learning for image recognition,”
in 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR),
pp. 770–778, June 2016.
[16] G. Huang, Z. Liu, L. van der Maaten, and K. Weinberger, “Densely connected convo-
lutional networks,” 2017 IEEE Conference on Computer Vision and Pattern Recog-
nition (CVPR), pp. 2261–2269, 2017.
[17] A. G. Howard and et al., “Mobilenets : Efficient convolutional neural networks for
mobile vision applications.” arXiv, April 16 2017. Consulté le 14 juin 2023.
[18] M. Tan and Q. V. Le, “Efficientnet : Rethinking model scaling for convolutional
neural networks.” arXiv, September 11 2020. Consulté le 14 juin 2023.
[19] T.-Y. Lin, P. Goyal, R. Girshick, K. He, and P. Dollár, “Focal loss for dense object
detection,” in 2017 IEEE International Conference on Computer Vision (ICCV),
pp. 2999–3007, October 2017.
[20] A. IA, “Deformable convolutional networks,” pp. 764–773, October 2017. Consulté
le 13 juin 2023.
[21] K. He, G. Gkioxari, P. Dollár, and R. Girshick, “Objects as points,” in Proceedings of
the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR),
June 2019.
[22] M. Barr and A. Massa, Programming Embedded Systems : With C and GNU Deve-
lopment Tools. O’Reilly Media, Inc., 2006.
[23] A. B. Tucker, ed., Computer Science Handbook. Boca Raton, FL : Chapman &
Hall/CRC, 2nd ed., 2004.
[24] J. W. Liu, Real-Time Systems. Prentice Hall, 2000.
[25] B. Daniel, “What are embedded systems ?.” https://www.trentonsystems.com/
blog/what-are-embedded-systems. Consulté le 2 juillet 2023.
[26] “Raspberry pi documentation - raspberry pi hardware.” https://www.raspberrypi.
com/documentation/computers/raspberry-pi.html. Consulté le 3 juillet 2023.
[27] Raspberry Pi Foundation, “Raspberry pi 4 model b.” https://
www.raspberrypi.com/products/raspberry-pi-4-model-b/?variant=
raspberry-pi-4-model-b-8gb. Accessed on [Insert Date].
[28] F. Chollet, Deep Learning with Python. Manning Publications, 2017.
[29] S. Raschka and V. Mirjalili, Python Machine Learning : Machine Learning and Deep
Learning with Python, scikit-learn, and TensorFlow 2. Packt Publishing, 3rd ed.,
2019.
[30] E. Davalo and P. Naı̈m, Des réseaux de neurones. Edition Eyrolle, 2 ed., 1990.
[31] M. Sauget, Parallélisation de problèmes d’apprentissage par réseaux neuronaux artifi-
ciels. Application en radiothérapie externe. PhD thesis, Université de Franche-Comté,
2007.
[32] A. Burkov, The Hundred-Page Machine Learning Book. Andriy Burkov, 2019.
BIBLIOGRAPHIE 66

[33] Jonathan Hui, “Ssd : Single shot multibox detector for

real-time processing.” https://jonathan-hui.medium.com/
ssd-object-detection-single-shot-multibox-detector-for-real-time-processing-9bd8d
Accessed on 2nd July 2023 at 17 :36.
[34] VisionWizard, “Centernet : Objects as points - a com-
prehensive guide.” https://medium.com/visionwizard/
centernet-objects-as-points-a-comprehensive-guide-2ed9993c48bc. Acces-
sed on 2nd July 2023 at 17 :31.
[35] Towards Data Science, “Faster r-cnn object detection.” https://
towardsdatascience.com/faster-rcnn-object-detection-f865e5ed7fc4.
Accessed on 2nd July 2023 at 17 :26.
[36] Towards Data Science, “Step-by-step vgg16 implementation
in keras for beginners.” https://towardsdatascience.com/
step-by-step-vgg16-implementation-in-keras-for-beginners-a833c686ae6c.
Accessed on 2nd July 2023 at 17 :26.
[37] “Python logo.” https://www.python.org/community/logos/. Accessed on [Insert
Date].
[38] Google, “Tensorflow.” https://www.tensorflow.org/?hl=fr. Accessed on [Insert
Date].
[39] Keras Team, “Keras.” https://keras.io/. Accessed on [Insert Date].
[40] “Kaggle.” https://www.kaggle.com/. Accessed on [Insert Date].
[41] Dasmehdixtr, “Drone dataset (uav).” https://www.kaggle.com/datasets/
dasmehdixtr/drone-dataset-uav. Accessed on [Insert Date].
[42] “Jupyter.” https://jupyter.org/. Accessed on [Insert Date].

Vous aimerez peut-être aussi

Détection d'objets avec TensorFlow
Pas encore d'évaluation
Détection d'objets avec TensorFlow
142 pages
LOKINGA Memoire ULK-2
Pas encore d'évaluation
LOKINGA Memoire ULK-2
83 pages
Pfa2 20
Pas encore d'évaluation
Pfa2 20
61 pages
Classification Vidéo par Deep Learning
Pas encore d'évaluation
Classification Vidéo par Deep Learning
66 pages
Rapport Pos
Pas encore d'évaluation
Rapport Pos
31 pages
Rapport sur la reconnaissance d'objets
Pas encore d'évaluation
Rapport sur la reconnaissance d'objets
52 pages
Détection d'intrusions IoT par ML
Pas encore d'évaluation
Détection d'intrusions IoT par ML
226 pages
Rapport PFE Chamsi Salimi Nmili
Pas encore d'évaluation
Rapport PFE Chamsi Salimi Nmili
67 pages
Inf IA 01-21
Pas encore d'évaluation
Inf IA 01-21
92 pages
Main5 PDF
Pas encore d'évaluation
Main5 PDF
87 pages
Énergie intelligente IOT pour l'industrie
Pas encore d'évaluation
Énergie intelligente IOT pour l'industrie
86 pages
2020 Antoine D Acremont
Pas encore d'évaluation
2020 Antoine D Acremont
157 pages
Surveillance intelligente des maladies cardiaques
Pas encore d'évaluation
Surveillance intelligente des maladies cardiaques
26 pages
Mémoire de Fin D'étude: École Supérieure en Informatique - 08 Mai 1945-Sidi Bel Abbès
Pas encore d'évaluation
Mémoire de Fin D'étude: École Supérieure en Informatique - 08 Mai 1945-Sidi Bel Abbès
121 pages
2018 Master Thesis Ignace Randrianarivony
100% (1)
2018 Master Thesis Ignace Randrianarivony
71 pages
Memoire 1
Pas encore d'évaluation
Memoire 1
101 pages
Prédiction Sémantique d'Anomalies IoT
Pas encore d'évaluation
Prédiction Sémantique d'Anomalies IoT
106 pages
MALLOUK Otmane - Inconnu (E)
Pas encore d'évaluation
MALLOUK Otmane - Inconnu (E)
80 pages
Détection d'objets par Machine Learning
Pas encore d'évaluation
Détection d'objets par Machine Learning
53 pages
API REST pour classifier images médicales
Pas encore d'évaluation
API REST pour classifier images médicales
104 pages
M2iar20 Elkhbir
Pas encore d'évaluation
M2iar20 Elkhbir
53 pages
PFE Version Final
Pas encore d'évaluation
PFE Version Final
65 pages
Rapport 1 Final
Pas encore d'évaluation
Rapport 1 Final
75 pages
PFE DDoSAttacksDetection
Pas encore d'évaluation
PFE DDoSAttacksDetection
58 pages
MEMOIRE
Pas encore d'évaluation
MEMOIRE
61 pages
These 2024 MATHSTICBO Informatique NGADI Hamza
Pas encore d'évaluation
These 2024 MATHSTICBO Informatique NGADI Hamza
169 pages
Samy V2
Pas encore d'évaluation
Samy V2
65 pages
Master BHC
Pas encore d'évaluation
Master BHC
59 pages
Remerciements et dédicaces thèse
Pas encore d'évaluation
Remerciements et dédicaces thèse
129 pages
Stagerprt
Pas encore d'évaluation
Stagerprt
94 pages
Reconnaissance de panneaux routiers IA
Pas encore d'évaluation
Reconnaissance de panneaux routiers IA
30 pages
Fake News Detection Using Machine Learning
Pas encore d'évaluation
Fake News Detection Using Machine Learning
70 pages
IA pour la Conduite Assistée
Pas encore d'évaluation
IA pour la Conduite Assistée
86 pages
Dédicaces et remerciements du projet
Pas encore d'évaluation
Dédicaces et remerciements du projet
52 pages
Avoce Jesutin Jonas 2021 Memoire
Pas encore d'évaluation
Avoce Jesutin Jonas 2021 Memoire
91 pages
Rapprt Pfe Facial Detection
Pas encore d'évaluation
Rapprt Pfe Facial Detection
112 pages
Ziou Abderrezzag1603561207
Pas encore d'évaluation
Ziou Abderrezzag1603561207
96 pages
Cyber Physiq
Pas encore d'évaluation
Cyber Physiq
184 pages
Détection Et Comptage Des Véhicules Avec Deep Learning
Pas encore d'évaluation
Détection Et Comptage Des Véhicules Avec Deep Learning
63 pages
Détection d'anomalies vidéo par deep learning
Pas encore d'évaluation
Détection d'anomalies vidéo par deep learning
126 pages
Classification d'images par CNN
0% (1)
Classification d'images par CNN
62 pages
Enp Pfe Template
Pas encore d'évaluation
Enp Pfe Template
34 pages
Réseaux de neurones pour la parole
Pas encore d'évaluation
Réseaux de neurones pour la parole
192 pages
Rapport PFA1
Pas encore d'évaluation
Rapport PFA1
36 pages
MOUKO Adan Wealth Sy
Pas encore d'évaluation
MOUKO Adan Wealth Sy
69 pages
Bentrioua Naziha (Conception Et Déploiement D'une GED Munie D'un Outil D'extraction
Pas encore d'évaluation
Bentrioua Naziha (Conception Et Déploiement D'une GED Munie D'un Outil D'extraction
109 pages
Cours IA PDF
Pas encore d'évaluation
Cours IA PDF
100 pages
Ingénierie de la cognition et IA
Pas encore d'évaluation
Ingénierie de la cognition et IA
100 pages
Book FR
Pas encore d'évaluation
Book FR
60 pages
Mediscan AI Par Jenovic Kabongo
Pas encore d'évaluation
Mediscan AI Par Jenovic Kabongo
24 pages
Imagerie Médicale: Représentation Uniforme
Pas encore d'évaluation
Imagerie Médicale: Représentation Uniforme
190 pages
Final Project
100% (1)
Final Project
56 pages
Memoire Baimi Full
Pas encore d'évaluation
Memoire Baimi Full
70 pages
Guinee PPT 2
Pas encore d'évaluation
Guinee PPT 2
38 pages
Copd
Pas encore d'évaluation
Copd
50 pages
Fiche L'ART OPERATIF Guerre de La Corée Issam
Pas encore d'évaluation
Fiche L'ART OPERATIF Guerre de La Corée Issam
3 pages
1-2 Adler - Vers Une Nouvelle Theorie de La Guerre 2001
Pas encore d'évaluation
1-2 Adler - Vers Une Nouvelle Theorie de La Guerre 2001
9 pages
Résolution ONU
Pas encore d'évaluation
Résolution ONU
2 pages
COPD Light
Pas encore d'évaluation
COPD Light
15 pages
Conception D'un Raccordement Sans Fil Des Objets Connectés D'une Université Intelligente
Pas encore d'évaluation
Conception D'un Raccordement Sans Fil Des Objets Connectés D'une Université Intelligente
127 pages
Analyse Des Menaces Aériennes Et Évaluat
Pas encore d'évaluation
Analyse Des Menaces Aériennes Et Évaluat
19 pages
Memoire Complet
Pas encore d'évaluation
Memoire Complet
57 pages
Part 3
Pas encore d'évaluation
Part 3
7 pages
DIH-16 End Me Last
Pas encore d'évaluation
DIH-16 End Me Last
62 pages
Part1 v1
Pas encore d'évaluation
Part1 v1
71 pages
Conclusion
Pas encore d'évaluation
Conclusion
13 pages
Intro
Pas encore d'évaluation
Intro
10 pages
Part 2
Pas encore d'évaluation
Part 2
4 pages
Acc Roche
Pas encore d'évaluation
Acc Roche
2 pages
Transportabilité Du Leadership de Mahathir Dans Les Armées Modernes
Pas encore d'évaluation
Transportabilité Du Leadership de Mahathir Dans Les Armées Modernes
4 pages
Plan Best
Pas encore d'évaluation
Plan Best
5 pages
Plan Structuré Et Cohérent
Pas encore d'évaluation
Plan Structuré Et Cohérent
26 pages
Introduction A La Methode de Raisonnement Generale
Pas encore d'évaluation
Introduction A La Methode de Raisonnement Generale
9 pages
Les Défis Géostratégiques Mondiaux Des Etats-Unis
Pas encore d'évaluation
Les Défis Géostratégiques Mondiaux Des Etats-Unis
22 pages
Madiba
Pas encore d'évaluation
Madiba
53 pages
Eisenhower03 12 2024
Pas encore d'évaluation
Eisenhower03 12 2024
41 pages
TD 6 Bien-Être
Pas encore d'évaluation
TD 6 Bien-Être
23 pages
7
Pas encore d'évaluation
7
279 pages
La Famille
Pas encore d'évaluation
La Famille
34 pages
Le Vent
Pas encore d'évaluation
Le Vent
2 pages
Zaki
Pas encore d'évaluation
Zaki
7 pages
Introduction À La Franc-Maçonnerie. SF Rufso Journal
Pas encore d'évaluation
Introduction À La Franc-Maçonnerie. SF Rufso Journal
10 pages
Programme Anglais Équipage Cabine
Pas encore d'évaluation
Programme Anglais Équipage Cabine
4 pages
Fiche-Prep Voyage D'oregon
Pas encore d'évaluation
Fiche-Prep Voyage D'oregon
8 pages
Relationnel: Clé des Soins Infirmiers Efficaces
Pas encore d'évaluation
Relationnel: Clé des Soins Infirmiers Efficaces
3 pages
Article de Philosophie
Pas encore d'évaluation
Article de Philosophie
3 pages
Programme d'Anatomie en 1 Mois
Pas encore d'évaluation
Programme d'Anatomie en 1 Mois
4 pages
Épistémologie et linguistique
Pas encore d'évaluation
Épistémologie et linguistique
2 pages
Organisation administrative de la CI
Pas encore d'évaluation
Organisation administrative de la CI
3 pages
Je Lis Je Comprends Cm1
100% (1)
Je Lis Je Comprends Cm1
103 pages
Erraissi Icfpta
Pas encore d'évaluation
Erraissi Icfpta
3 pages
Fournitures Myp 5 2nd 1
Pas encore d'évaluation
Fournitures Myp 5 2nd 1
4 pages
These de Doctorat
Pas encore d'évaluation
These de Doctorat
404 pages
Promotion de la lecture en Afrique Noire
Pas encore d'évaluation
Promotion de la lecture en Afrique Noire
90 pages
Ressources TDAH Adulte (Franco-Anglophones)
Pas encore d'évaluation
Ressources TDAH Adulte (Franco-Anglophones)
4 pages
Lempathie
Pas encore d'évaluation
Lempathie
22 pages
Travaux Pratiques sur Capteurs Industriels
Pas encore d'évaluation
Travaux Pratiques sur Capteurs Industriels
17 pages
Configuration de Systèmes Mécatroniques 1
Pas encore d'évaluation
Configuration de Systèmes Mécatroniques 1
19 pages
Calcul Littéral : Techniques et Applications en Mathématiques
Pas encore d'évaluation
Calcul Littéral : Techniques et Applications en Mathématiques
6 pages
Résumé Général Sur Les Cours D'asservissement
Pas encore d'évaluation
Résumé Général Sur Les Cours D'asservissement
17 pages
Theorie Comptable
Pas encore d'évaluation
Theorie Comptable
3 pages
Centre D'orientation Académique Et Professionnelle Pour Les Étudiants
Pas encore d'évaluation
Centre D'orientation Académique Et Professionnelle Pour Les Étudiants
7 pages
Mathematiques 9eme - PDF
Pas encore d'évaluation
Mathematiques 9eme - PDF
27 pages
Cours Sainte Anne Brochure Primaire 2025 2026
Pas encore d'évaluation
Cours Sainte Anne Brochure Primaire 2025 2026
13 pages
Systématisation des temps verbaux en français
Pas encore d'évaluation
Systématisation des temps verbaux en français
6 pages
Rentrée UTC : Infos Clés Étudiants
Pas encore d'évaluation
Rentrée UTC : Infos Clés Étudiants
24 pages