0% ont trouvé ce document utile (0 vote)

48 vues10 pages

Deep Learning

Deep learning, pour les débutants

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats RTF, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

48 vues10 pages

Deep Learning

Deep learning, pour les débutants

Transféré par

m3114811

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats RTF, PDF, TXT ou lisez en ligne sur Scribd

DEEP LEARNING

Au lieu de développer l'un des modèles qu'on a vu plus tôt(arbre de décision, etc) on développe un
réseau de neurones.

1)À son invention,À l'intérieur de chaque fonction(neurone) on trouve 2 étapes:

--L'aggregation: où obtient une fonction de la forme : f=w1x1+w2x2+w3x3+...+b étant le biais

--Activation: y=1 si f≥0 ou y=0

2)plus tard un autre inventa le perception ,qui y ajouta un algorithme d'apprentissage capable d'ajourner
les valeurs des paramètres w pour une [Link] perceptron est enfaite un model linéaire dû à sa
fonction d'agrégation f(une droite),est donc n'est pas suffisant.

3) Puis des années plus tard a été inventé le perceptron multicouche composé de trois neurones (les
deux premiers donne des sorties y1 et y2) et le troisième calcul une fonction d'agrégation à partir de ces
valeurs qui n'est plus un model liné[Link] il y a donc deux couches

Pour entraîner ce model multi-couche(c'est-à-dire déterminer les bons paramètres pour chaque
fonction) l'une des techniques est la back-propagation qui consiste à déterminer comment la sortie du
model varie en fonction des paramètres(W,b) dans chaque [Link] cela on calcule une suite de
gradients qui nous permet de savoir comment la sortie varie en fonction de la dernière couche,
comment la dernière couche varie en fonction de l'avant dernière et ainsi de [Link]âce aux gradients
on peut alors mettre à jour les paramètres(W,b) de telle sorte qu'il minimise l'erreur entre la sortie et la
réponse attendue

En résumé voici le cycle utilisé pour développer des réseaux de neurones artificiels:

1) forward propagation (on obtient une sortie)

2) On calcule une fonction de coût (Cost function)

3)Backward propagation

4) Gradient descent. Puis on recommence avec des paramètres optimisés

PERCEPTRON

Il est unité de base des réseaux de [Link] s'agit d'un modèle de classification binaire capable de
séparer linéairement deux classes de [Link] fonction d'activation la plus simple étant la fonction
sigmoïde(logistique) nous permet d'accompagner chaque prédiction d'une probabilité d'appartenir a la
classe 1(plus c'est proche de la frontière plus la probabilité est basse) dont l'expression est

a(z)= 1/(1+e^(-z)) , z étant la sortie.

Le but:Maximiser la vraisemblance L en minimisant la fonction -log(L).

Descente de Gradient

minimiser la Fonction Coût (Log Loss).

Consiste à ajuster les paramètres W et b de façon à minimiser les erreurs du modèle, c'est-à-dire à

Pour ça, il faut déterminer comment est-ce que cette fonction varie en fonction des différents
paramètres.

Descente de Gradient

minimiser la Fonction Coût (Log Loss).

Consiste à ajuster les paramètres W et b de façon à minimiser les erreurs du modèle, c'est-à-dire à

Pour ça, il faut déterminer comment est-ce que cette fonction varie en fonction des différents
paramètres.

C'est pourquoi on calcule le Gradient (ou la dérivée) de la Fonction Coût.

Descente de Gradient**

Formule :

Wt+1 = Wt - α ∂L/∂Wt*

- Wt+1 :Paramètre W à l'instant t+1

- Wt :Paramètre W à l'instant t

- α :Pas d'apprentissage positif

∂L/∂Wt : Gradient à l'instant t

Fonction Convexe :

RESEAUX DE NEURONES ARTIFICIELS

Qui ne contient qu'un seul minimum.

Au lieu de faire du feature engineering,on va améliorer le model en y ajoutant

d'autres neurones.L'idée est de laisser la machine apprendre à faire son propre
feature engineering,en lui allouant des neurones dédiés à cela

Wij: paramètre associé au neurone i (Zi/Ai)et en prévenance du l'entrée j( xj)

bi: biais associé au neurone i

d'où:

z1[1]=w11[1]x1+w12x2[1]+b1[1]

a1[1]=1/(1+e^(-z1[1]))

z2[1]=w21[1]x1+w22[1]x2+b2[1]

a2[1]=1/(1+e^(-z2[1])) ce qui est entre crochets indique le numéro de la couche

NB: Dans Cette couche,on peut mettre autant de neurone qu'on le veut,plus on en
mettra plus le model sera puissant mais il sera aussi plus lent à entraîner

Pour la deuxième couche les entrées serons remplacées par les fonctions
d'activation de la première couche

Z1[2]= w11a1[1]+w12a2[1]+b1[2]

A1[2]=1/(1+e^(-Z1[2]))

On peut ajouter plus de neurones sur la deuxième couche et même ajouter plus de
couches juste en prenant les activations de la couche précédente en entré[Link] le
réseau est profond plus il est capable d'apprendre des choses compliquées mais il
est en même temps plus long à entraîner d'où il faut trouver le juste équilibre.

Pour implémenter de tels modèles il n'est pas pratique d'écrire les équations de
chaque [Link] va donc vectoriser ces équations afin de représenter chaque
couche par une matrice.
Z[1]=W[1] . X + b[1]

W: matrice contenant les paramteres w a pour dimension(nombre de neurones

dans la couche n[1] * nombre d'entree n[0])

X: matrice contenant les entrees a pour dimension (m*n)

b: vecteur de biais a pour dimensions(nombre de neurones n[1]*1)

A[1]=1/(1+e-Z[1]) de dimension nombre de neurones n[1] * n[0]( meme dimension que

Z[1],d'ou le les deux fonctions du neurones ont les memes dimensions)

Z[2]=W[2] .A[1]+b[2]

W[2]: dimension nombre de neurones dans la couche 2 n[2] * nombre de neurones

dans la couche 1 n[1]

b[2]: dimension nombre de neurones dans la couche 2 n[2] * 1

et ainsi de suite

si on veut ajouter un neurone dans une couche suuffit de modifier W et b

Tous ca c'est qu'on appelle la forward propagation

BACK PROPAGATION
On doit transposer nos datasets avant de travailler pour que ce soit adapter a cette
demarche(qui est plus belle)

Consite a reracer comment la fonction cout evolue de la dernierre equation jusqu'a

l premiere

1. Définir une fonction coût

L = - (1/m) Σ [ y × log(A²) + (1 - y) × log(1 - A²) ]

2. Calculer les dérivées partielles

En retracant en arriere ca donne (A² ,Z² ,A¹,Z¹)

Formules principales :

∂L/∂W� = ∂L/∂A� � ∂A�/∂Z� � ∂Z�/∂W�

∂L/∂b� = ∂L/∂A� � ∂A�/∂Z� � ∂Z�/∂b�

∂L/∂W� = ∂L/∂A� � ∂A�/∂Z� � ∂Z�/∂A� � ∂A�/∂Z� � ∂Z�/∂W�

∂L/∂b� = ∂L/∂A� � ∂A�/∂Z� � ∂Z�/∂A� � ∂A�/∂Z� � ∂Z�/∂b�

3. Mettre � jour les param�tres W et b

Mise � jour des poids :

W� = W� - α (∂L/∂W�)

Mise � jour des biais :

b� = b� - α (∂L/∂b�)

4. Calcul interm�diaire des d�riv�es

�tapes interm�diaires :

dZ� = ∂L/∂A� � ∂A�/∂Z�

∂L/∂W� = dZ� � ∂Z�/∂W�

∂L/∂b� = dZ� � ∂Z�/∂b�

dZ� = dZ� � ∂Z�/∂A� � ∂A�/∂Z�

∂L/∂W� = dZ� � ∂Z�/∂W�

∂L/∂b� = dZ� � ∂Z�/∂b�

FORMULES FINALES

dZ2 = A[2] - y

∂L/∂W[2] = (1/m) * dZ2 * A[1]^T

∂L/∂b[2] = (1/m) * Σ dZ2

dZ1 = W[2]^T * dZ2 * A[1] * (1 - A[1])

∂L/∂W[1] = (1/m) * dZ1 * X^T

∂L/∂b[1] = (1/m) * Σ dZ1

D'OU ON TIRE LES FORMULES GENERALES:

Ne pas oubliez de transposez les matrices X et y(notre dataset) avant de
commencer
1)l'initialisation des parametres

W[C] dimension n[c],n[c-1]

b[c] dimension n[c],1

2) forward propagation

Z[C]= W[C].A[C-1]+b[c]

A[C]=1/(1+e-Z[C]) on pose A[0]=X

3) La back propagation( calcul des gradients)

dZ[C FINAL]=A[C FINAL]- y

dW[C]= 1/m * dZ[C].A[C-1].T

db[c]=1/m * ∑ dZ[C] somme sur l'axe1

dZ[C-1]= W[C].T . dZ[C] * A[C-1](1-A[C-1])

4) Mise a jour des parametres

W[C]= W[C]- alpha *dW[C]

b[c] = b[c]-alpha * db[c]

import numpy as np

# Fonction d'initialisation des paramètres

parametres = {}

C = len(dimensions) # Nombre de couches (y compris entrée et sortie)

for c in range(1, C):

parametres['W' + str(c)] = [Link](dimensions[c], dimensions[c -

1])

parametres['b' + str(c)] = [Link](dimensions[c], 1)

return parametres
# Fonction de propagation avant

def forward_propagation(X, parametres):

activations = {'A0': X}

C = len(parametres) // 2 # Nombre de couches cachées

for c in range(1, C + 1):

Z = parametres['W' + str(c)].dot(activations['A' + str(c - 1)]) + parametres['b'

+ str(c)]

activations['A' + str(c)] = 1 / (1 + [Link](-Z)) # Fonction d'activation

sigmoïde

return activations

# Fonction de rétropropagation

def back_propagation(y, activations, parametres):

m = [Link][1]

C = len(parametres) // 2

dZ = activations['A' + str(C)] - y

gradients = {}

for c in reversed(range(1, C + 1)):

gradients['dW' + str(c)] = 1 / m * [Link](dZ, activations['A' + str(c - 1)].T)

gradients['db' + str(c)] = 1 / m * [Link](dZ, axis=1, keepdims=True)

if c > 1:

dZ = [Link](parametres['W' + str(c)].T, dZ) * activations['A' + str(c - 1)] *

(1 - activations['A' + str(c - 1)])

return gradients
# Fonction de mise à jour des paramètres

def update(gradients, parametres, learning_rate):

C = len(parametres) // 2

for c in range(1, C + 1):

parametres['W' + str(c)] = parametres['W' + str(c)] - learning_rate *

gradients['dW' + str(c)]

parametres['b' + str(c)] = parametres['b' + str(c)] - learning_rate *

gradients['db' + str(c)]

return parametres

import numpy as np

import [Link] as plt

from [Link] import accuracy_score

def neural_network(X, y, hidden_layers=(32, 32, 32), learning_rate=0.1,

n_iter=1000):

[Link](0)

# Initialisation des dimensions et des paramètres

dimensions = list(hidden_layers)

[Link](0, [Link][0]) # Ajouter la dimension d'entrée

[Link]([Link][0]) # Ajouter la dimension de sortie

parameters = initialization(dimensions)

train_loss = []
train_acc = []

for i in range(n_iter):

# Propagation avant

activations = forward_propagation(X, parameters)

# Rétropropagation

gradients = back_propagation(y, activations, parameters)

# Mise à jour des paramètres

parameters = update(gradients, parameters, learning_rate)

if i % 10 == 0: # Enregistrer les métriques toutes les 10 itérations

C = len(parameters) // 2

train_loss.append(log_loss(y, activations["A" + str(C)]))

y_pred = predict(X, parameters)

current_accuracy = accuracy_score([Link](), y_pred.flatten())

train_acc.append(current_accuracy)

# Visualisation des résultats

fig, ax = [Link](nrows=1, ncols=2, figsize=(18, 4))

ax[0].plot(train_loss, label="train_loss")

ax[0].legend()

ax[1].plot(train_acc, label="train_acc")

ax[1].legend()

visualisation(X, y, parameters, ax)

[Link]()
return parameters

Vous aimerez peut-être aussi

Introduction aux réseaux de neurones
Pas encore d'évaluation
Introduction aux réseaux de neurones
16 pages
DL Bi
Pas encore d'évaluation
DL Bi
22 pages
II Deuxième Partie: Réseaux de Neurones Artificiels
Pas encore d'évaluation
II Deuxième Partie: Réseaux de Neurones Artificiels
11 pages
Introduction au Deep Learning et Perceptrons
Pas encore d'évaluation
Introduction au Deep Learning et Perceptrons
46 pages
Resume IAA
Pas encore d'évaluation
Resume IAA
7 pages
ML RN 6 French
Pas encore d'évaluation
ML RN 6 French
22 pages
RNN Recherche
Pas encore d'évaluation
RNN Recherche
5 pages
Réseaux de Neurones
Pas encore d'évaluation
Réseaux de Neurones
27 pages
IA Et Big Data Part1
Pas encore d'évaluation
IA Et Big Data Part1
24 pages
CR Ai
Pas encore d'évaluation
CR Ai
6 pages
Module: Logique Floue & RNA Travaux Pratique N°3:: Initiation Aux Réseaux de Neurones
Pas encore d'évaluation
Module: Logique Floue & RNA Travaux Pratique N°3:: Initiation Aux Réseaux de Neurones
8 pages
Introduction aux Réseaux de Neurones Artificiels
Pas encore d'évaluation
Introduction aux Réseaux de Neurones Artificiels
5 pages
Annexe Python
Pas encore d'évaluation
Annexe Python
13 pages
Cours Perceptron
100% (1)
Cours Perceptron
58 pages
R Eseaux de Neurones Artificiels
Pas encore d'évaluation
R Eseaux de Neurones Artificiels
57 pages
Chapitre 4
Pas encore d'évaluation
Chapitre 4
30 pages
Data Mining Cours 7
Pas encore d'évaluation
Data Mining Cours 7
39 pages
Learning Objectives: General Information
Pas encore d'évaluation
Learning Objectives: General Information
17 pages
Support - Réseau de Neurones - Diapo Theo
Pas encore d'évaluation
Support - Réseau de Neurones - Diapo Theo
26 pages
Réseaux Neurones : Histoire et Applications
Pas encore d'évaluation
Réseaux Neurones : Histoire et Applications
56 pages
Deep Lera Ning
Pas encore d'évaluation
Deep Lera Ning
112 pages
TutoPython&KerasLesréseauxdeneurones-TutorielPython 1683742635968 PDF
Pas encore d'évaluation
TutoPython&KerasLesréseauxdeneurones-TutorielPython 1683742635968 PDF
23 pages
Introduction au Deep Learning
Pas encore d'évaluation
Introduction au Deep Learning
121 pages
Projetrseauxdeneurones V3
Pas encore d'évaluation
Projetrseauxdeneurones V3
62 pages
Perceptron Multicouche et XOR
Pas encore d'évaluation
Perceptron Multicouche et XOR
35 pages
RNA - CH - III - Perceptron Multicouches
Pas encore d'évaluation
RNA - CH - III - Perceptron Multicouches
48 pages
Perceptron Python : Code et Explications
Pas encore d'évaluation
Perceptron Python : Code et Explications
8 pages
Le Réseau de Neurones Artificiel: PR A. Majda - FST - Fes
Pas encore d'évaluation
Le Réseau de Neurones Artificiel: PR A. Majda - FST - Fes
82 pages
Perceptron Multicouche
Pas encore d'évaluation
Perceptron Multicouche
6 pages
Wa0044.
Pas encore d'évaluation
Wa0044.
35 pages
Cours Le Perceptron Multicouches (Tchi Drive)
Pas encore d'évaluation
Cours Le Perceptron Multicouches (Tchi Drive)
7 pages
Introduction aux réseaux de neurones
Pas encore d'évaluation
Introduction aux réseaux de neurones
31 pages
Réseaux Neuronaux pour Images
Pas encore d'évaluation
Réseaux Neuronaux pour Images
8 pages
3 Apprentissage Profond PB
Pas encore d'évaluation
3 Apprentissage Profond PB
2 pages
Introduction au Perceptron et Réseaux de Neurones
Pas encore d'évaluation
Introduction au Perceptron et Réseaux de Neurones
220 pages
Réseaux Neurones: Concepts et Applications
100% (2)
Réseaux Neurones: Concepts et Applications
39 pages
Réseaux de Neurones Artificiels
Pas encore d'évaluation
Réseaux de Neurones Artificiels
11 pages
Réseaux de Neurones en Profondeur
Pas encore d'évaluation
Réseaux de Neurones en Profondeur
64 pages
Reseaux de Neurones 1
Pas encore d'évaluation
Reseaux de Neurones 1
8 pages
Introduction Au Deep Learning (Notes de Cours)
Pas encore d'évaluation
Introduction Au Deep Learning (Notes de Cours)
51 pages
Chap2 - Reseaux Neurones Profonds
Pas encore d'évaluation
Chap2 - Reseaux Neurones Profonds
34 pages
Deep Learning
Pas encore d'évaluation
Deep Learning
18 pages
Aziz Khamjane
Pas encore d'évaluation
Aziz Khamjane
56 pages
Ai Chap4
Pas encore d'évaluation
Ai Chap4
26 pages
Tp2: Deep Learning: Tensorflow
Pas encore d'évaluation
Tp2: Deep Learning: Tensorflow
9 pages
4 ML Réseaux de Neurones
Pas encore d'évaluation
4 ML Réseaux de Neurones
57 pages
Frameworks IA pour Web et Mobile
Pas encore d'évaluation
Frameworks IA pour Web et Mobile
208 pages
Méthodes Neuronales RCP208 : Perceptron
Pas encore d'évaluation
Méthodes Neuronales RCP208 : Perceptron
9 pages
Chap03 ANNs Part1 Overview
Pas encore d'évaluation
Chap03 ANNs Part1 Overview
58 pages
Neurones Biologiques Ou Artificiels
Pas encore d'évaluation
Neurones Biologiques Ou Artificiels
6 pages
Chapitre III Deep Learning
Pas encore d'évaluation
Chapitre III Deep Learning
141 pages
TP 5 Les Reseaux de Neurones Artificiels
100% (1)
TP 5 Les Reseaux de Neurones Artificiels
6 pages
07 MLP 2pages
Pas encore d'évaluation
07 MLP 2pages
69 pages
TD 2 Correction
Pas encore d'évaluation
TD 2 Correction
10 pages
Catalyseurs de L'intelligence Artificielle Et L'ecosystème Des Framework de Machines Et Deep Learning
Pas encore d'évaluation
Catalyseurs de L'intelligence Artificielle Et L'ecosystème Des Framework de Machines Et Deep Learning
46 pages
Réseaux de neurones multicouches expliqués
Pas encore d'évaluation
Réseaux de neurones multicouches expliqués
6 pages
TP Premier MLP Xor
Pas encore d'évaluation
TP Premier MLP Xor
10 pages
Introduction à l'IA pour Réseaux
Pas encore d'évaluation
Introduction à l'IA pour Réseaux
33 pages
Séance 6 - Les Réseaux Multi-Couches
Pas encore d'évaluation
Séance 6 - Les Réseaux Multi-Couches
26 pages
Serpents Constricteurs
Pas encore d'évaluation
Serpents Constricteurs
1 page
Serpents Non Dangereux
Pas encore d'évaluation
Serpents Non Dangereux
1 page
Introduction aux Champs Quantiques
Pas encore d'évaluation
Introduction aux Champs Quantiques
3 pages
RDC
Pas encore d'évaluation
RDC
4 pages
Bulletin 4ème Vangu
Pas encore d'évaluation
Bulletin 4ème Vangu
1 page
mrn3 Enl
Pas encore d'évaluation
mrn3 Enl
9 pages
Analyse Numérique TD3 Ben Msik
Pas encore d'évaluation
Analyse Numérique TD3 Ben Msik
2 pages
Algos Python Programmes CPGE 2022
Pas encore d'évaluation
Algos Python Programmes CPGE 2022
14 pages
2021 Correction
Pas encore d'évaluation
2021 Correction
6 pages
Fiche Sur Le Second Degré
Pas encore d'évaluation
Fiche Sur Le Second Degré
1 page
Maths 2ndec
Pas encore d'évaluation
Maths 2ndec
2 pages
Algorithmes d'optimisation avancés
Pas encore d'évaluation
Algorithmes d'optimisation avancés
3 pages
TD2 - Recursivité
Pas encore d'évaluation
TD2 - Recursivité
4 pages
Exercice 34 REVISION CONTROLE Dérivation 1 STMG 2019
Pas encore d'évaluation
Exercice 34 REVISION CONTROLE Dérivation 1 STMG 2019
1 page
TP - N°00) Zitouni Hamza
0% (1)
TP - N°00) Zitouni Hamza
3 pages
Formulation de la Programmation Linéaire
Pas encore d'évaluation
Formulation de la Programmation Linéaire
49 pages
Série 7 Révision
Pas encore d'évaluation
Série 7 Révision
2 pages
My TIPE
Pas encore d'évaluation
My TIPE
30 pages
Cours Programmation Linéaire INSEA (Partie I)
Pas encore d'évaluation
Cours Programmation Linéaire INSEA (Partie I)
147 pages
Programmation Dynamique et Graphes
Pas encore d'évaluation
Programmation Dynamique et Graphes
57 pages
Lakrib AN PDF
0% (1)
Lakrib AN PDF
5 pages
Algorithmes de tri : sélection et insertion
Pas encore d'évaluation
Algorithmes de tri : sélection et insertion
6 pages
Devoir Libre 23 24
Pas encore d'évaluation
Devoir Libre 23 24
2 pages
Introduction 251019 230638
Pas encore d'évaluation
Introduction 251019 230638
8 pages
2015 2023
Pas encore d'évaluation
2015 2023
10 pages
RATTEXAMROLGTR
Pas encore d'évaluation
RATTEXAMROLGTR
1 page
Analyse Asymptotique et Comparaison des Suites
Pas encore d'évaluation
Analyse Asymptotique et Comparaison des Suites
18 pages
TD2 Analysenum 2015 BTP
Pas encore d'évaluation
TD2 Analysenum 2015 BTP
2 pages
Fiche 31
Pas encore d'évaluation
Fiche 31
2 pages
Transformée de Fourier Discrète et FFT
100% (1)
Transformée de Fourier Discrète et FFT
10 pages
Optimisation par Branch and Bound
Pas encore d'évaluation
Optimisation par Branch and Bound
47 pages
Tutorial 1
Pas encore d'évaluation
Tutorial 1
2 pages
TP 01 (Rappel) : TP Analyse Numérique 2
Pas encore d'évaluation
TP 01 (Rappel) : TP Analyse Numérique 2
15 pages
Correction RO Sujet D Exo1 1ère Session 2025
Pas encore d'évaluation
Correction RO Sujet D Exo1 1ère Session 2025
4 pages
SupportPolyEndom22 9 21exporter
Pas encore d'évaluation
SupportPolyEndom22 9 21exporter
1 page