0% ont trouvé ce document utile (0 vote)
197 vues22 pages

Comprendre les Réseaux de Neurones Convolutifs

Transféré par

ilias sa
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
197 vues22 pages

Comprendre les Réseaux de Neurones Convolutifs

Transféré par

ilias sa
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd

les CNN (Convolutional

Neural Networks)
Comment les réseaux de neurones convolutifs apprennent à voir

(AI)
01 Qu'est-ce qu'un CNN ?

Les CNN (Convolutional Neural Networks) sont des réseaux de


neurones spécialement conçus pour traiter des données
structurées en grille, comme les images. Ils utilisent
des couches de convolution et des couches de pooling

(AI)
Applications des
CNN:
• Classification d'images.

• Détection d'objets.

• Segmentation d'images .
Architecture d'un
CNN
• Couches principales :

• Couche d'entrée : Reçoit l'image brute.

• Couches de convolution : Extraient des caractéristiques locales.

• Couches de pooling : Réduisent la dimension spatiale.

• Couches fully connected (FC) : Combinent les caractéristiques pour


la classification.

• Couche de sortie : Produit les prédictions finales.


02
La convolution
Détecter des motifs dans l'image

(AI)
la Convolution :
1. Définition de la Convolution :
La convolution est une opération mathématique qui applique un filtre (ou noyau)
à une région locale de l'image.
Le filtre est une petite matrice (par exemple, 3x3 ou 5x5) qui parcourt l'image
pour extraire des caractéristiques locales.

2. Objectif de la Convolution :
Détecter des motifs spécifiques dans l'image, comme des bords, des textures, ou
des formes.
Chaque filtre est conçu pour détecter un type particulier de caractéristique.
1. Comment ça marche ? :
1. Le filtre est appliqué à chaque région de l'image en effectuant
une multiplication élément par élément entre les valeurs du
filtre et les pixels de l'image.

2. Les résultats sont ensuite additionnés pour produire une seule


valeur dans la carte de caractéristiques (feature map).
● Exemple Concret

Image d'entrée (5x5) :


[1, 0, 1, 0, 1]
[0, 1, 0, 1, 0]
[1, 0, 1, 0, 1]
[0, 1, 0, 1, 0]
[1, 0, 1, 0, 1]

Filtre (3x3) :
[1, 0, -1]
[1, 0, -1]
[1, 0, -1]
Application du filtre :
• Le filtre est placé sur la première région de l'image (en haut à gauche).
• Multiplication élément par élément et sommation :

(1*1) + (0*0) + (1*-1) +


(0*1) + (1*0) + (0*-1) +
(1*1) + (0*0) + (1*-1) = 0

• Résultat final :
• Le filtre parcourt toute l'image pour produire une carte de
caractéristiques de taille réduite (par exemple, 3x3).
Paramètres de la Convolution

1. Taille du filtre (kernel size) :


Détermine la taille de la région sur laquelle le filtre est appliqué (par
exemple, 3x3, 5x5).
2. Nombre de filtres :
Chaque filtre détecte un type de caractéristique différent.
Plus de filtres permettent de capturer plus de motifs.
3. Pas (stride) :
Détermine le déplacement du filtre sur l'image.
Un pas de 1 signifie que le filtre se déplace d'un pixel à la fois.
Un pas de 2 signifie que le filtre saute un pixel.
4. Remplissage (padding) :
Ajoute des zéros autour de l'image pour conserver la taille de la sortie.
Padding "same" : La carte de caractéristiques a la même taille que
l'image d'entrée.
Padding "valid" : Aucun remplissage, la carte de caractéristiques est
plus petite.
04
Fonction d'Activation
(ReLU)
(AI)
la Fonction
d'Activation : d'Activation :
1. Définition de la Fonction
Une fonction d'activation introduit de la non-linéarité dans le réseau de
neurones.
Sans elle, un CNN serait simplement une combinaison de transformations
linéaires, ce qui limiterait sa capacité à apprendre des motifs complexes.

2. La Fonction ReLU (Rectified Linear Unit) :


Formule : ReLU(x)=max⁡(0,x).
Comportement :
Si x>0, ReLU retourne x.
Si x≤0, ReLU retourne 0.
la Fonction
d'Activation
Carte de caractéristiques:avant ReLU :
[ 0.5, -1.2, 2.3]
[-0.7, 1.1, -0.9]
[ 0.8, -0.4, 1.5]

Application de ReLU : Remplacer toutes les valeurs négatives par zéro.

Résultat :
[0.5, 0.0, 2.3]
[0.0, 1.1, 0.0]
[0.8, 0.0, 1.5]
05
Le Pooling :
Réduire la Dimension Spatiale

(AI)
1. Définition du Pooling :
1. Le pooling est une opération qui réduit la dimension spatiale des cartes
de caractéristiques tout en conservant les informations les plus
importantes.
2. Il est généralement appliqué après une couche de convolution et une
fonction d'activation (comme ReLU).
1. Types de Pooling :
Max Pooling : Prend la valeur maximale dans chaque fenêtre.
Average Pooling : Prend la moyenne des valeurs dans chaque fenêtre.
Max Pooling est le plus couramment utilisé car il conserve les
caractéristiques les plus fortes.

2. Paramètres du Pooling :
Taille de la fenêtre : Détermine la région sur laquelle le pooling est appliqué
(par exemple, 2x2).
Pas (stride) : Détermine le déplacement de la fenêtre
Exemple

1. carte de caractéristiques avant Pooling (4x4) :


[1, 2, 3, 4]
[5, 6, 7, 8]
[9, 10, 11, 12]
[13, 14, 15, 16]

Max Pooling avec une fenêtre de 2x2 et un pas de 2 :


[6, 8]
[14, 16]
Pourquoi le Pooling est-il Important ?

1. Réduction de la dimension :
Diminue la quantité de données à traiter, ce qui accélère l'entraînement.

2. Invariance aux petites translations :


Le réseau devient moins sensible aux petites variations dans la position des
objets.

3. Extraction des caractéristiques dominantes :


Seules les caractéristiques les plus fortes sont conservées, ce qui améliore la
généralisation.
Répétition des Couches
1. Pourquoi Répéter les Couches ? :
Les CNN utilisent une séquence de couches pour extraire des
caractéristiques de plus en plus complexes et abstraites.

Chaque couche apprend à détecter des motifs de plus en plus sophistiqués :


Premières couches : Détectent des motifs simples (bords, textures).
Couches intermédiaires : Détectent des motifs plus complexes
(formes, parties d'objets).
Dernières couches : Détectent des objets entiers ou des concepts
globaux.
06
Aplatissement

(AI)
1. Définition de l'Aplatissement :

L'aplatissement (Flattening) est une opération qui convertit les cartes de


caractéristiques 3D (hauteur x largeur x nombre de filtres) en un vecteur
1D.
Cette étape prépare les données pour les couches fully connected (FC) qui
suivent.

2. Comment ça marche ? :
Les valeurs de toutes les cartes de caractéristiques sont concaténées en un
seul vecteur.
Par exemple, si vous avez 64 cartes de caractéristiques de taille 5x5, le
vecteur résultant aura une taille de 64×5×5=1600.
● Pourquoi l'Aplatissement est-il Important ?

1. Transition entre Convolution et Fully Connected :


Les couches de convolution travaillent avec des données spatiales, tandis que
les couches fully connected travaillent avec des vecteurs.
L'aplatissement permet de faire le lien entre ces deux types de couches.
2. Préparation pour la Classification :
Les couches fully connected utilisent le vecteur aplati pour combiner les
caractéristiques et produire des prédictions.
3. Simplicité :
L'aplatissement est une opération simple mais essentielle pour structurer les
données.

Vous aimerez peut-être aussi