0% ont trouvé ce document utile (0 vote)

64 vues8 pages

Cours RNN

Ce document présente les réseaux neuronaux et leur application dans le traitement automatique des langues (TAL), en abordant leurs fondements, architectures, et applications pratiques telles que la traduction automatique et l'analyse de sentiments. Il décrit également les défis et perspectives futurs dans ce domaine, tout en proposant des exercices d'application pour renforcer l'apprentissage. En conclusion, les réseaux neuronaux ont transformé le TAL, mais leur utilisation soulève des défis techniques et éthiques.

Transféré par

zina.lamrani.pers

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

64 vues8 pages

Cours RNN

Transféré par

zina.lamrani.pers

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Comprendre le concept des réseaux

neuronaux et leur utilisation dans le

traitement automatique des langues

Mai 2025

Table des matières

1 Introduction 3
1.1 Objectifs pédagogiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Fondements des réseaux neuronaux 3

2.1 Structure d’un neurone artificiel . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Architecture d’un réseau neuronal . . . . . . . . . . . . . . . . . . . . 3
2.3 Apprentissage : La rétropropagation . . . . . . . . . . . . . . . . . . . 4

3 Réseaux neuronaux pour le TAL 4

3.1 Représentation des mots : Word Embeddings . . . . . . . . . . . . . . 4
3.2 Réseaux récurrents (RNN) . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.3 LSTM et GRU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

4 Architectures avancées pour le TAL 5

4.1 Transformers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
4.2 BERT (Bidirectional Encoder Representations from Transformers) . 5
4.3 GPT (Generative Pre-trained Transformer) . . . . . . . . . . . . . . . . 5

5 Applications en TAL 5
5.1 Traduction automatique . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
5.2 Analyse de sentiments . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
5.3 Génération de texte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

6 Défis et perspectives 6
6.1 Défis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
6.2 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

7 Exercices d’application 6
7.1 Exercice 1 : Analyse de sentiments avec un RNN . . . . . . . . . . . . 6
7.2 Exercice 2 : Traduction automatique avec Seq2Seq . . . . . . . . . . . 7

8 Conclusion 8

1
9 Références 8

2
1 Introduction
Le traitement automatique des langues (TAL) est un domaine de l’intelligence
artificielle qui vise à permettre aux machines de comprendre, interpréter et gé-
nérer le langage humain. Les réseaux neuronaux, grâce à leur capacité à modé-
liser des relations complexes, sont devenus des outils fondamentaux dans ce do-
maine. Ce cours explore les principes des réseaux neuronaux, leurs architectures
spécifiques pour le TAL, et leurs applications pratiques, comme la traduction au-
tomatique ou l’analyse de sentiments.

1.1 Objectifs pédagogiques

— Comprendre les bases des réseaux neuronaux.
— Explorer les architectures adaptées au TAL.
— Analyser des applications concrètes en TAL.
— Découvrir les défis et limites actuels.

2 Fondements des réseaux neuronaux

Un réseau neuronal artificiel est un modèle informatique inspiré du cerveau
humain. Il est composé de nœuds (neurones) organisés en couches, connectés
par des poids qui modulent l’information.

2.1 Structure d’un neurone artificiel

Un neurone artificiel prend des entrées x1 , x2 , . . . , xn , applique des poids w1 , w2 , . . . , wn ,
ajoute un biais b, et produit une sortie via une fonction d’activation f :
( n )
∑
y=f w i xi + b
i=1

Les fonctions d’activation courantes incluent la sigmoïde, ReLU (f (x) = max(0, x)),
et la tangente hyperbolique.

2.2 Architecture d’un réseau neuronal

Un réseau neuronal typique comprend :
— Couche d’entrée : Reçoit les données brutes.
— Couches cachées : Effectuent des transformations non linéaires.
— Couche de sortie : Produit le résultat final.
w1 w2
x1 h1 y
figureSchéma simplifié d’un réseau
neuronal.

3
2.3 Apprentissage : La rétropropagation
L’apprentissage consiste à ajuster les poids pour minimiser une fonction de
perte, comme l’erreur quadratique moyenne :

1∑
n
L= (yi − ŷi )2
n i=1

La rétropropagation utilise la descente de gradient pour mettre à jour les poids :

∂L
w ←w−η
∂w
où η est le taux d’apprentissage.

3 Réseaux neuronaux pour le TAL

Le TAL traite des données textuelles, qui sont séquentielles et contextuelles.
Les réseaux neuronaux doivent donc modéliser les dépend ances temporelles et
sémantiques.

3.1 Représentation des mots : Word Embeddings

Les mots sont représentés sous forme de vecteurs denses dans un espace continu.
Les méthodes comme Word2Vec ou GloVe capturent les relations sémantiques,
par exemple :

vecteur(roi) − vecteur(homme) + vecteur(femme) ≈ vecteur(reine)

3.2 Réseaux récurrents (RNN)

Les RNN sont conçus pour les données séquentielles. À chaque pas de temps
t, un RNN met à jour son état caché ht :

ht = f (Wh ht−1 + Wx xt + b)

Cependant, les RNN souffrent du problème de disparition du gradient.

3.3 LSTM et GRU

Les unités à mémoire longue à court terme (LSTM) et les unités récurrentes
à porte (GRU) résolvent ce problème en introduisant des portes qui contrôlent le
flux d’information. Une LSTM a trois portes :
— Porte d’oubli : Décide quoi oublier.
— Porte d’entrée : Décide quoi ajouter.
— Porte de sortie : Décide quoi produire.

4
4 Architectures avancées pour le TAL
4.1 Transformers
Introduits dans l’article Attention is All You Need (Vaswani et al., 2017), les
Transformers reposent sur le mécanisme d’attention. L’attention calcule l’impor-
tance relative des mots dans une séquence :
( )
QK T
Attention(Q, K, V ) = softmax √ V
dk

Les Transformers sont à la base de modèles comme BERT et GPT.

4.2 BERT (Bidirectional Encoder Representations from Trans-

formers)
BERT est pré-entraîné sur de vastes corpus pour comprendre le contexte bi-
directionnel. Il est fine-tuné pour des tâches spécifiques comme la classification
de texte.

4.3 GPT (Generative Pre-trained Transformer)

GPT utilise une architecture unidirectionnelle pour générer du texte. Ses ver-
sions, comme GPT-3, excellent dans la génération de texte naturel.

5 Applications en TAL
5.1 Traduction automatique
Les modèles comme Seq2Seq (encodeur-décodeur) traduisent une phrase d’une
langue à une autre. Exemple :
— Entrée : ”J’aime programmer.”
— Sortie : ”I love programming.”

5.2 Analyse de sentiments

Un modèle peut classer un texte comme positif, négatif ou neutre. Exemple
avec un RNN :
1 import tensorflow as tf
2 from [Link] import Sequential
3 from [Link] import LSTM, Dense, Embedding
4

5 model = Sequential([
6 Embedding(vocab_size, 100),
7 LSTM(128),
8 Dense(1, activation=’sigmoid’)

5
9 ])
10 [Link](optimizer=’adam’, loss=’binary_crossentropy’)

5.3 Génération de texte

Les modèles comme GPT peuvent générer des histoires ou des dialogues. Exemple :
— Invite : ”Il était une fois...”
— Sortie : ”Il était une fois un robot qui rêvait de devenir humain.”

6 Défis et perspectives
6.1 Défis
— Besoin en données : Les modèles nécessitent de grandes quantités de don-
nées annotées.
— Biais : Les modèles peuvent reproduire des biais présents dans les données.
— Complexité computationnelle : Les Transformers demandent des ressources
importantes.

6.2 Perspectives
— Modèles plus efficaces (par exemple, DistilBERT).
— Intégration multimodale (texte, image, son).
— TAL éthique et inclusif.

7 Exercices d’application
Cette section propose deux exercices pour appliquer les concepts abordés
dans le cours. Les exercices sont conçus pour être réalisés avec des outils comme
Python et TensorFlow, mais peuvent être adaptés à d’autres environnements.

7.1 Exercice 1 : Analyse de sentiments avec un RNN

Objectif : Construire un modèle de classification de sentiments utilisant un
réseau récurrent (RNN) pour prédire si un commentaire est positif ou négatif.
Consignes :
1. Téléchargez un jeu de données de commentaires annotés, par exemple le
jeu de données IMDB (disponible via [Link]).
2. ItoiPrétravaillez les données :
— Convertissez les commentaires en séquences d’indices de mots.
— Rembourrez (padding) les séquences pour qu’elles aient la même lon-
gueur.

6
3. Construisez un modèle avec l’architecture suivante :
— Une couche Embedding (dimension 100).
— Une couche SimpleRNN avec 64 unités.
— Une couche Dense avec activation sigmoïde pour la classification bi-
naire.
4. Compilez le modèle avec l’optimiseur adam et la perte binaryc [Link]
5.
5. Testez le modèle sur un commentaire personnalisé, par exemple : ”Ce film
est incroyable !”
Code de départ :
1 import tensorflow as tf
2 from [Link] import Sequential
3 from [Link] import Embedding, SimpleRNN, Dense
4 from [Link] import pad_sequences
5

6 # Charger et préparer les données

7 (x_train, y_train), (x_test, y_test) = [Link].
load_data(num_words=10000)
8 x_train = pad_sequences(x_train, maxlen=200)
9 x_test = pad_sequences(x_test, maxlen=200)
10

11 # Définir le modèle
12 model = Sequential([
13 Embedding(10000, 100, input_length=200),
14 SimpleRNN(64),
15 Dense(1, activation=’sigmoid’)
16 ])
17

18 # Compiler et entraîner
19 [Link](optimizer=’adam’, loss=’binary_crossentropy’, metrics=[
’accuracy’])
20 [Link](x_train, y_train, epochs=10, validation_data=(x_test,
y_test))
Question bonus : Comment pourriez-vous améliorer la précision du modèle
en utilisant une couche LSTM à la place de SimpleRNN ? Testez et comparez les
résultats.

7.2 Exercice 2 : Traduction automatique avec Seq2Seq

Objectif : Concevoir un modèle Seq2Seq simple pour traduire des phrases
courtes du français vers l’anglais.
Consignes :
1. Créez un petit jeu de données de paires de phrases, par exemple :
— Français : ”Je mange une pomme.” → Anglais : ”I eat an apple.”
— Français : ”Il lit un livre.” → Anglais : ”He reads a book.”
2. Prétravaillez les données :
— Tokenisez les phrases en mots.

7
— Créez des vocabulaires pour les deux langues.
— Convertissez les phrases en séquences d’indices.
3. Construisez un modèle Seq2Seq avec :
— Un encodeur : Une couche LSTM (128 unités) qui prend la séquence
source.
— Un décodeur : Une couche LSTM (128 unités) qui génère la séquence
cible.
— Une couche Dense pour prédire les mots du vocabulaire cible.
4. Entraînez le modèle pour minimiser la perte categoricalc rossentropy.T estezlemodleentraduisa
”Ellechanteunechanson.”
Schéma conceptuel :

État caché
Encodeur LSTM Décodeur LSTM Dense
5.
figureArchitecture Seq2Seq pour la traduction.

Question bonus : Comment le mécanisme d’attention pourrait-il améliorer

ce modèle ? Décrivez les modifications nécessaires pour intégrer l’attention.

8 Conclusion
Les réseaux neuronaux ont révolutionné le TAL, permettant des avancées
dans la traduction, la génération de texte, et bien plus. Les exercices proposés
illustrent comment appliquer ces concepts à des problèmes concrets. Cependant,
leur développement nécessite de relever des défis techniques et éthiques. Ce cours
offre une base pour comprendre ces technologies et explorer leurs applications.

9 Références
— Vaswani, A., et al. (2017). Attention is All You Need. NeurIPS.
— Devlin, J., et al. (2018). BERT : Pre-training of Deep Bidirectional Transformers
for Language Understanding. arXiv.
— Goodfellow, I., Bengio, Y., Courville, A. (2016). Deep Learning. MIT Press.

Vous aimerez peut-être aussi

Traitement de texte avec réseaux de neurones
Pas encore d'évaluation
Traitement de texte avec réseaux de neurones
6 pages
Ingénierie des Prompts en IA
Pas encore d'évaluation
Ingénierie des Prompts en IA
58 pages
TPE SIA 417 Version 1.0
Pas encore d'évaluation
TPE SIA 417 Version 1.0
28 pages
Cours sur les Transformers en IA
100% (1)
Cours sur les Transformers en IA
3 pages
Introduction aux Réseaux de Neurones Récurrents
Pas encore d'évaluation
Introduction aux Réseaux de Neurones Récurrents
66 pages
Introduction aux Réseaux de Neurones Récurrents
Pas encore d'évaluation
Introduction aux Réseaux de Neurones Récurrents
68 pages
Cours Jour 03
Pas encore d'évaluation
Cours Jour 03
10 pages
Fonctionne L'intelligence Artificielle Générative
Pas encore d'évaluation
Fonctionne L'intelligence Artificielle Générative
4 pages
Transformers
Pas encore d'évaluation
Transformers
36 pages
8 - Deep Learning - FR
Pas encore d'évaluation
8 - Deep Learning - FR
42 pages
Module 1 WEEK1
Pas encore d'évaluation
Module 1 WEEK1
2 pages
Génie Électrique3
Pas encore d'évaluation
Génie Électrique3
3 pages
2023-04-06 Eclairage Sur CHATGPT FR
Pas encore d'évaluation
2023-04-06 Eclairage Sur CHATGPT FR
15 pages
NLP Natural Language Processing
Pas encore d'évaluation
NLP Natural Language Processing
2 pages
Chapter 3 Text Mining RNN
Pas encore d'évaluation
Chapter 3 Text Mining RNN
51 pages
NLP
100% (1)
NLP
4 pages
nlp07 RNN
Pas encore d'évaluation
nlp07 RNN
37 pages
Chatbot IA : Automatisation et Modélisation
Pas encore d'évaluation
Chatbot IA : Automatisation et Modélisation
2 pages
BOUKLI HACENE - Ghouthi
Pas encore d'évaluation
BOUKLI HACENE - Ghouthi
30 pages
Cours de Deep Learning: Master Big Data Et Cloud Computing Préparé Par: Mohamed Ouazze
Pas encore d'évaluation
Cours de Deep Learning: Master Big Data Et Cloud Computing Préparé Par: Mohamed Ouazze
116 pages
Chatgpt 1
Pas encore d'évaluation
Chatgpt 1
25 pages
07 RNN 2020
Pas encore d'évaluation
07 RNN 2020
40 pages
Ia 3
Pas encore d'évaluation
Ia 3
1 page
TP Réseaux de Neurones en Matlab
Pas encore d'évaluation
TP Réseaux de Neurones en Matlab
2 pages
2réseaux de Neurones Récurrents PB
Pas encore d'évaluation
2réseaux de Neurones Récurrents PB
5 pages
Mémoire Licence 2021 - Nemiche Assia
Pas encore d'évaluation
Mémoire Licence 2021 - Nemiche Assia
30 pages
Introduction au Deep Learning
Pas encore d'évaluation
Introduction au Deep Learning
20 pages
Deep Learning
Pas encore d'évaluation
Deep Learning
15 pages
Cours DL
Pas encore d'évaluation
Cours DL
42 pages
Réseau Neuronal Recurrent "Recurrent Neural Network" (RNN)
Pas encore d'évaluation
Réseau Neuronal Recurrent "Recurrent Neural Network" (RNN)
9 pages
TB Lucas - Gulen
Pas encore d'évaluation
TB Lucas - Gulen
92 pages
NLP 6
Pas encore d'évaluation
NLP 6
5 pages
Apprentissage Par R Seaux de Neurones Profonds: BENAISSI Sellami S.benaissi@univ-Bouira - DZ
Pas encore d'évaluation
Apprentissage Par R Seaux de Neurones Profonds: BENAISSI Sellami S.benaissi@univ-Bouira - DZ
51 pages
Cha 3 RNN
Pas encore d'évaluation
Cha 3 RNN
21 pages
Projets IA pour Étudiants GSEII
Pas encore d'évaluation
Projets IA pour Étudiants GSEII
2 pages
Fcihe Machie Learning II
Pas encore d'évaluation
Fcihe Machie Learning II
20 pages
Image Captioning
Pas encore d'évaluation
Image Captioning
34 pages
TP 2
Pas encore d'évaluation
TP 2
6 pages
Series Exercices RNN
Pas encore d'évaluation
Series Exercices RNN
2 pages
Fake News Detection
Pas encore d'évaluation
Fake News Detection
51 pages
Introduction au Deep Learning
Pas encore d'évaluation
Introduction au Deep Learning
6 pages
1b - RNN Et LSTM
100% (1)
1b - RNN Et LSTM
56 pages
Recherches de L'exposé Sur Ia
Pas encore d'évaluation
Recherches de L'exposé Sur Ia
4 pages
Devoir IA
Pas encore d'évaluation
Devoir IA
2 pages
Eugene Charniak - Introduction Au Deep Learning (2021) FR
100% (2)
Eugene Charniak - Introduction Au Deep Learning (2021) FR
173 pages
Cardio
Pas encore d'évaluation
Cardio
5 pages
Partie2CoursTALN UM6SS MasterBD-IA 2022
Pas encore d'évaluation
Partie2CoursTALN UM6SS MasterBD-IA 2022
33 pages
BERT
Pas encore d'évaluation
BERT
19 pages
Structured Fiche Evaluation
Pas encore d'évaluation
Structured Fiche Evaluation
2 pages
Introduction aux Réseaux Récurrents (RNN)
Pas encore d'évaluation
Introduction aux Réseaux Récurrents (RNN)
58 pages
Deep Learning
Pas encore d'évaluation
Deep Learning
4 pages
TP2 RS Ic
Pas encore d'évaluation
TP2 RS Ic
2 pages
Réseaux de neurones pour la parole
Pas encore d'évaluation
Réseaux de neurones pour la parole
192 pages
Cours IA Gen 04 12 2023
Pas encore d'évaluation
Cours IA Gen 04 12 2023
13 pages
Introduction Aux Réseaux de Neurones
Pas encore d'évaluation
Introduction Aux Réseaux de Neurones
2 pages
Les RNN (Recurent Neural Networks)
Pas encore d'évaluation
Les RNN (Recurent Neural Networks)
16 pages
IA Générative : Concepts et Modèles
Pas encore d'évaluation
IA Générative : Concepts et Modèles
23 pages
Plan Projets Time Series
Pas encore d'évaluation
Plan Projets Time Series
7 pages
IDR Blier
Pas encore d'évaluation
IDR Blier
13 pages
Tableau Des Compétences Techniques
Pas encore d'évaluation
Tableau Des Compétences Techniques
5 pages
Rapport Pos
Pas encore d'évaluation
Rapport Pos
31 pages
Le Systeme DInference Neuro Flou Adaptatif ANFIS Un Pont Entre Logique Floue Et Reseaux de Neurones
Pas encore d'évaluation
Le Systeme DInference Neuro Flou Adaptatif ANFIS Un Pont Entre Logique Floue Et Reseaux de Neurones
10 pages
Comprendre Lintelligence Artificielle Le Guide Ultime Pour Maîtriser Les Bases, Les Concepts Et Les Applications de l'IA... (Barco, Romain)
Pas encore d'évaluation
Comprendre Lintelligence Artificielle Le Guide Ultime Pour Maîtriser Les Bases, Les Concepts Et Les Applications de l'IA... (Barco, Romain)
22 pages
Modèles vs Algorithmes en Deep Learning
Pas encore d'évaluation
Modèles vs Algorithmes en Deep Learning
3 pages
RNA HSe FR 2324
Pas encore d'évaluation
RNA HSe FR 2324
50 pages
05 RN Corrigé
Pas encore d'évaluation
05 RN Corrigé
22 pages
Guide Apprendre l'IA
Pas encore d'évaluation
Guide Apprendre l'IA
6 pages
Théorie D'approximation Des Réseaux de Neurones Artificiels, Application À La Résolution Des Équations Différentielles Fractionn
Pas encore d'évaluation
Théorie D'approximation Des Réseaux de Neurones Artificiels, Application À La Résolution Des Équations Différentielles Fractionn
149 pages
TP SGD
Pas encore d'évaluation
TP SGD
5 pages
Gradteam TP
Pas encore d'évaluation
Gradteam TP
14 pages
ML - cours-LE-D3SI-ABBASSI
Pas encore d'évaluation
ML - cours-LE-D3SI-ABBASSI
16 pages
Chap03 ANNs Part1 Overview
Pas encore d'évaluation
Chap03 ANNs Part1 Overview
58 pages
MALLOUK Otmane - Inconnu (E)
Pas encore d'évaluation
MALLOUK Otmane - Inconnu (E)
80 pages
DL Ch1
Pas encore d'évaluation
DL Ch1
34 pages
Solution Examen2024
Pas encore d'évaluation
Solution Examen2024
2 pages
Ethos Spec Technique en Francais
Pas encore d'évaluation
Ethos Spec Technique en Francais
10 pages
Présentation PowerPoint Sur Les Réseaux de Neurones
Pas encore d'évaluation
Présentation PowerPoint Sur Les Réseaux de Neurones
23 pages
Rapport PFE BAHRIChiraz
Pas encore d'évaluation
Rapport PFE BAHRIChiraz
54 pages
Chapitre 02 Réseaux de Neurones Et Apprentissage.
Pas encore d'évaluation
Chapitre 02 Réseaux de Neurones Et Apprentissage.
8 pages
00 - Support de Cours - DL & Transfert LEarning1
Pas encore d'évaluation
00 - Support de Cours - DL & Transfert LEarning1
152 pages