0% ont trouvé ce document utile (0 vote)

30 vues48 pages

Cours 4

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

30 vues48 pages

Cours 4

Transféré par

oussamaelazzouzi03

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Traitement des séquences en

utilisant des réseaux de neurones

récurrents

Groupe des étudiants : Licence d’Excellence

Intelligence Artificielle et Ingénierie des Données

Noureddine MOHTARAM
E-Mail : [email protected]
Réseaux de neurones récurrents
(RNN, Recurrent Neural Network)

2 Deep Learning [email protected]

Séquence
▪ Une séquence est une donnée qui suit un ordre bien précis

Source : https://www.coursera.org/lecture/nlp-sequence-models/why-sequence-models-0h7gT

3 Deep Learning [email protected]

Séquence
▪ Une séquence est une donnée qui suit un ordre bien précis

▪ L'ordre d'une séquence doit être conservé au moment

de l'apprentissage et au moment de la prédiction
L'utilisation des MLP ou des
CNN n'est pas possible
▪ Les séquences peuvent avoir des tailles différentes

4 Deep Learning [email protected]

Séquence
▪ Une séquence est une donnée qui suit un ordre bien précis

▪ L'ordre d'une séquence doit être conservé au moment

de l'apprentissage et au moment de la prédiction
L'utilisation des MLP ou des
CNN n'est pas possible
▪ Les séquences peuvent avoir des tailles différentes

Solution

Utilisation des réseaux de neurones

récurrents (RNN : Recurrent Neural Network)

5 Deep Learning [email protected]

RNN (Recurrent Neural Network)
● RNN avec un simple neurone

6 Deep Learning [email protected]

RNN (Recurrent Neural Network)
● RNN avec un simple neurone ● RNN avec plusieurs neurones

7 Deep Learning [email protected]

RNN (Recurrent Neural Network)
● RNN avec un simple neurone ● RNN avec plusieurs neurones

● Une couche de plusieurs RNN

8 Deep Learning [email protected]

RNN (Recurrent Neural Network)
▪ Sortie d'une couche de RNN pour une instance
Fonction d'activation

▪ Sortie d'une couche de RNN pour tous les instances d'un batch

9 Deep Learning [email protected]

Apprentissage d'un RNN
▪ Les RNNs réalisent leur apprentissage via la stratégie backpropagation through time
(BPTT) = similaire qu'un MLP ou un CNN

Fonction de coût

Forward
Backward

10 Deep Learning [email protected]

RNN (Recurrent Neural Network)

● RNN en Keras

Nombre de neurones
dans chaque cellule

model = keras.models.Sequential([
keras.layers.SimpleRNN(1, input_shape =[None, 1])
])

La fonction d'activation utilisée par défaut

est la tangente hyperbolique → Elle résout
le problème de l'explosion et de la
disparition du gradient

11 Deep Learning [email protected]

Flexibilité des RNNs

Seq-to-seq
Exemple : prédire le
future prix d'un stock

12 Deep Learning [email protected]

Flexibilité des RNNs

Seq-to-seq
Exemple : prédire le Seq-to-vec
future prix d'un stock Exemple : score
d'un tweet

13 Deep Learning [email protected]

Flexibilité des RNNs

Seq-to-seq
Exemple : prédire le Seq-to-vec
future prix d'un stock Exemple : score
d'un tweet

Vec-to-seq
Exemple : description
d'une image

14 Deep Learning [email protected]

Flexibilité des RNNs

Seq-to-seq
Exemple : prédire le Seq-to-vec
future prix d'un stock Exemple : score
d'un tweet

Vec-to-seq
Exemple : description Encoder-Decoder
d'une image Exemple : traduction
des phrases

Seq-to-vec Vec-to-seq

15 Deep Learning [email protected]

RNN profond
▪ Un RNN profond est un RNN avec plusieurs couches de cellule

Couches

16 Deep Learning [email protected]

RNN profond

Couches

model = keras.models.Sequential([
keras.layers.SimpleRNN(3, return_sequences = True, input_shape =[ None, 1]),
keras.layers.SimpleRNN(3, return_sequences = True),
keras.layers.Dense(1)
])

17 Deep Learning [email protected]

RNN profond
Nombre de neurones
▪ RNN en Keras dans chaque cellule
Problématique : SimpleRNN n'est pas adapté au traitement des longues
séquences à cause du problème Short-Term Memory

La fonction d'activation utilisée par défaut

▪ Un RNN profond est un RNN avec plusieurs couches est la tangente hyperbolique → Elle résout
de cellule le problème de l'explosion et de la
disparition du gradient

model = keras.models.Sequential([
keras.layers.SimpleRNN(3, return_sequences = True, input_shape =[ None, 1]),
keras.layers.SimpleRNN(3, return_sequences = True),
keras.layers.Dense(1)
])
Solution :
- Utilisation du LSTM (Long short-term memory)

18 Deep Learning [email protected]

Long short-term memory (LSTM)

19 Deep Learning [email protected]

LSTM
▪ La méthode Long Short-Term Memory (LSTM) [1] a été proposée par Sepp Hochreiter et
Jürgen Schmidhuber.
▪ Cellule LSTM :

[1] Hochreiter, Sepp, and Jürgen Schmidhuber. "Long short-term memory." Neural computation 9.8 (1997): 1735-1780.
20 Deep Learning [email protected]
Cellule LSTM
● Le réseau peut apprendre ce qu'il faut stocker dans h(t), ce qu'il faut jeter et ce qu'il faut en lire.

Long-term state

Short-term state

21 Deep Learning [email protected]

Cellule LSTM
Supprime quelques Ajoute quelques Filtrage des mémoires
mémoires mémoires

Long-term state

Short-term state

22 Deep Learning [email protected]

Cellule LSTM
Output gate :
quelle partie
doit être lue

Long-term state

Short-term state
Forget gate :
quelle partie
de la cellule
doit être
supprimée

Input gate :
quelle partie de
g(t) doit être FC = Fully Connected Layer
ajoutée à c(t)
23 Deep Learning [email protected]
Cellule LSTM

24 Deep Learning [email protected]

LSTM en Keras

model = tf.keras.Sequential([
tf.keras.layers.LSTM(32, return_sequences=True, input_shape=[None, 5]),
tf.keras.layers.Dense(14)
])