0% ont trouvé ce document utile (0 vote)

59 vues5 pages

Article

Ce mini-projet explore l'optimisation des modèles de descente de gradient pour la classification d'images de chiffres manuscrits en utilisant le jeu de données MNIST. Les résultats montrent que les méthodes RMSProp et Adam surpassent les autres techniques en termes de convergence et de précision, avec Adam atteignant une perte de zéro. Le projet souligne l'importance du choix de l'algorithme d'optimisation dans l'apprentissage profond et propose des pistes pour des travaux futurs.

Transféré par

kaoutarbahan

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

59 vues5 pages

Article

Transféré par

kaoutarbahan

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Université Sultan Moulay Slimane

Faculté polydisciplinaire-Béni Mellal

A.U: 2024-2025

Compte Rendu du Mini-Projet : Optimisation des Modèles

de Descente de Gradient

Introduction

L'objectif de ce mini-projet est d'implémenter et de comparer différentes variantes de

la descente de gradient sur un problème de classification d'images de chiffres manuscrits, en
utilisant le jeu de données MNIST. Ce projet vise à explorer l'efficacité de plusieurs
algorithmes d'optimisation dans le contexte de l'apprentissage profond, en mettant l'accent sur
la convergence et la précision des modèles.

Méthodologie

Pour ce projet, nous avons utilisé un réseau de neurones à trois couches entièrement
connectées, chacune contenant 100 neurones avec une fonction d'activation ReLU, et une
couche de sortie avec une activation Softmax. Les méthodes d'optimisation implémentées
incluent

1. Descente de Gradient Stochastique (SGD) : Une méthode de base qui met à jour les
paramètres en utilisant le gradient de la fonction de coût.

 Relation :

Où représente les paramètres du modèle, est le taux d'apprentissage, et est le

gradient de la fonction de coût.

2. SGD avec Momentum : Améliore la convergence en ajoutant un terme de momentum

pour lisser les mises à jour.

 Relation :

Réalisé par : BAHAN KAOUTAR

Université Sultan Moulay Slimane

Faculté polydisciplinaire-Béni Mellal

A.U: 2024-2025

Où est la vitesse (momentum), et est le coefficient de momentum

3. Nesterov Accelerated Gradient (NAG) : Anticipe les mises à jour en utilisant le

gradient calculé à partir des paramètres prévus.

 Relation :

Cette méthode utilise le gradient calculé à partir de la position anticipée des paramètres.

4. RMSProp : Adapte le taux d'apprentissage pour chaque paramètre en utilisant une

moyenne mobile des carrés des gradients.

 Relation :

Où est la moyenne mobile des carrés des gradients, et est un petit terme pour éviter la division
par zéro.

Réalisé par : BAHAN KAOUTAR

Université Sultan Moulay Slimane

Faculté polydisciplinaire-Béni Mellal

A.U: 2024-2025

5. Adam : Combine les idées de RMSProp et de momentum pour ajuster les taux
d'apprentissage de manière adaptative.

 Relation :

Où et sont les estimations des moments du premier et du second ordre, respectivement.

6. Méthode de Newton (simplifiée) : Utilise une approximation de la matrice Hessienne

pour ajuster les paramètres, bien que simplifiée pour des raisons de complexité.

 Relation :

Où est la matrice Hessienne de la fonction de coût. En pratique, une approximation est

souvent utilisée en raison de la complexité de calcul de .

Résultats

Les résultats expérimentaux ont été évalués en termes de précision sur un ensemble de
test et de la convergence de la fonction de coût au fil des itérations. Le graphique ci-dessous
montre l'évolution de la perte pour chaque méthode d'optimisation :

Réalisé par : BAHAN KAOUTAR

Université Sultan Moulay Slimane

Faculté polydisciplinaire-Béni Mellal

A.U: 2024-2025

Comparaison des performances

Méthode Perte finale Précision sur test (%)

SGD 0.0210 93.46
Momentum 0.0214 93.37

Nesterov 0.0210 93.54

RMSProp 0.0004 96.87

Adam 0.0000 96.70

Newton Simplifiée 0.0210 93.46

Discussion

Les résultats montrent que RMSProp et Adam offrent une meilleure convergence et
précision par rapport aux autres techniques. RMSProp converge rapidement vers une faible

Réalisé par : BAHAN KAOUTAR

Université Sultan Moulay Slimane

Faculté polydisciplinaire-Béni Mellal

A.U: 2024-2025

perte, tandis qu'Adam atteint une perte de zéro et offre une précision légèrement inférieure à
celle de RMSProp.

L'algorithme SGD, bien que simple, nécessite davantage d'itérations pour atteindre un bon
niveau de performance et reste moins précis que les méthodes adaptatives comme RMSProp
et Adam. Les méthodes avec momentum (Momentum et Nesterov) améliorent la
convergence par rapport à SGD, mais n'atteignent pas les mêmes performances que
RMSProp et Adam.

Quant à la méthode Newton simplifiée, elle est une tentative d'améliorer la descente
de gradient en utilisant des informations de deuxième ordre. Cependant, en pratique, elle peut
être difficile à mettre en œuvre dans des réseaux de neurones profonds en raison du calcul
coûteux des matrices Hessiennes (la matrice des dérivées secondes). Dans ce projet,
l'implémentation simplifiée de Newton n'a pas montré des résultats significativement
meilleurs par rapport aux méthodes précédentes, principalement en raison de l'instabilité et de
la lenteur du calcul des mises à jour. Toutefois, la méthode de Newton peut être intéressante
dans des problèmes plus simples où le calcul des dérivées secondes est moins coûteux.

La méthode Adam, en particulier, combine les avantages de RMSProp et

Momentum, ce qui permet une convergence rapide et une précision élevée. Cela en fait un
choix privilégié pour des tâches complexes comme celles impliquant MNIST.

Conclusion

En résumé, ce projet a démontré l'importance du choix de l'algorithme d'optimisation

dans l'apprentissage profond. Adam s'est révélé être le plus efficace parmi les méthodes
testées, offrant un bon équilibre entre rapidité de convergence et précision. Les résultats
soulignent également la nécessité d'adapter les méthodes d'optimisation aux spécificités du
problème et de l'architecture du modèle. Pour des travaux futurs, l'exploration de variantes
d'Adam ou l'intégration de techniques de régularisation pourrait encore améliorer les
performances des modèles.

Réalisé par : BAHAN KAOUTAR

Vous aimerez peut-être aussi

Hfyf FHGFHFH
Pas encore d'évaluation
Hfyf FHGFHFH
8 pages
Differents Optimizers in Deep Learning
Pas encore d'évaluation
Differents Optimizers in Deep Learning
4 pages
Hfytfytytryt
Pas encore d'évaluation
Hfytfytytryt
8 pages
Optimisation Et Paramétrage en
Pas encore d'évaluation
Optimisation Et Paramétrage en
5 pages
S3 ISF - Comple Üments
Pas encore d'évaluation
S3 ISF - Comple Üments
25 pages
Cours DL - Part5 (Prof)
Pas encore d'évaluation
Cours DL - Part5 (Prof)
78 pages
TP SGD
Pas encore d'évaluation
TP SGD
5 pages
Optimisation Numérique Version Temporaire
Pas encore d'évaluation
Optimisation Numérique Version Temporaire
52 pages
THESELASSONFRANCOIS
Pas encore d'évaluation
THESELASSONFRANCOIS
174 pages
RN
Pas encore d'évaluation
RN
40 pages
Hybridation des Méthodes de Recherche
Pas encore d'évaluation
Hybridation des Méthodes de Recherche
191 pages
Master BHC
Pas encore d'évaluation
Master BHC
59 pages
03-Deep Learning Optimization
Pas encore d'évaluation
03-Deep Learning Optimization
102 pages
La Méthode de Gradient Achirkhadija47
Pas encore d'évaluation
La Méthode de Gradient Achirkhadija47
38 pages
IA: Régression et Optimisation
100% (1)
IA: Régression et Optimisation
18 pages
Optimisation pour l'Apprentissage
Pas encore d'évaluation
Optimisation pour l'Apprentissage
64 pages
Miniprojet - 2GLT - EL KHELLADI - KHALID - Word
Pas encore d'évaluation
Miniprojet - 2GLT - EL KHELLADI - KHALID - Word
18 pages
Sene Uqac 0862N 11232
Pas encore d'évaluation
Sene Uqac 0862N 11232
85 pages
Sini, Nabil
Pas encore d'évaluation
Sini, Nabil
65 pages
Apprentissage-Machine
Pas encore d'évaluation
Apprentissage-Machine
5 pages
MALLOUK Otmane - Inconnu (E)
Pas encore d'évaluation
MALLOUK Otmane - Inconnu (E)
80 pages
Rapport Du Projet
Pas encore d'évaluation
Rapport Du Projet
4 pages
Algorithme de colonie de fourmis dynamique
Pas encore d'évaluation
Algorithme de colonie de fourmis dynamique
128 pages
Apprentissage Automatique Et Profond
Pas encore d'évaluation
Apprentissage Automatique Et Profond
7 pages
Optimisation Globale Et Optimisation Semi-Infinie Théorie, Algorithmes Et Applications
Pas encore d'évaluation
Optimisation Globale Et Optimisation Semi-Infinie Théorie, Algorithmes Et Applications
127 pages
El Mazroua
Pas encore d'évaluation
El Mazroua
51 pages
MNO2017
Pas encore d'évaluation
MNO2017
38 pages
LN01 1 Optimisation Introduction Histoire
Pas encore d'évaluation
LN01 1 Optimisation Introduction Histoire
5 pages
2017 KenjyDemeester
Pas encore d'évaluation
2017 KenjyDemeester
64 pages
Optimisation Non Linéaire: Méthodes et Algorithmes
Pas encore d'évaluation
Optimisation Non Linéaire: Méthodes et Algorithmes
28 pages
Rapport M2
Pas encore d'évaluation
Rapport M2
53 pages
Mpo PDF
Pas encore d'évaluation
Mpo PDF
9 pages
Optimizer
Pas encore d'évaluation
Optimizer
3 pages
Mining 1
Pas encore d'évaluation
Mining 1
33 pages
Optimisation TSP par Pointer Net
Pas encore d'évaluation
Optimisation TSP par Pointer Net
3 pages
2020 Priem Remy
Pas encore d'évaluation
2020 Priem Remy
217 pages
VM DataSci v1
Pas encore d'évaluation
VM DataSci v1
30 pages
Techniques d'optimisation mathématique
Pas encore d'évaluation
Techniques d'optimisation mathématique
8 pages
Un Modèle Hybride Pour Le Support L'Apprentissage Dans Les Domaines Procéduraux Et Mal Définis
Pas encore d'évaluation
Un Modèle Hybride Pour Le Support L'Apprentissage Dans Les Domaines Procéduraux Et Mal Définis
229 pages
Rapport Moataz
Pas encore d'évaluation
Rapport Moataz
58 pages
Optimisation Numérique L3 Paris-Dauphine
Pas encore d'évaluation
Optimisation Numérique L3 Paris-Dauphine
78 pages
Optimisation Globale : Méthodes Hybrides
Pas encore d'évaluation
Optimisation Globale : Méthodes Hybrides
125 pages
Mathématiques Avancées Pour Big Data Optimisation Et Modélisation
Pas encore d'évaluation
Mathématiques Avancées Pour Big Data Optimisation Et Modélisation
59 pages
Opt PDF
100% (1)
Opt PDF
395 pages
Poly GMM4
Pas encore d'évaluation
Poly GMM4
106 pages
Deep Learning
Pas encore d'évaluation
Deep Learning
18 pages
Avoce Jesutin Jonas 2021 Memoire
Pas encore d'évaluation
Avoce Jesutin Jonas 2021 Memoire
91 pages
TP
Pas encore d'évaluation
TP
4 pages
Imagerie Médicale: Représentation Uniforme
Pas encore d'évaluation
Imagerie Médicale: Représentation Uniforme
190 pages
Main5 PDF
Pas encore d'évaluation
Main5 PDF
87 pages
Systèmes et Modèles: Identification et Optimisation
Pas encore d'évaluation
Systèmes et Modèles: Identification et Optimisation
91 pages
Thèse Machine Learning - 241105 - 141454
Pas encore d'évaluation
Thèse Machine Learning - 241105 - 141454
2 pages
Mémoire PDF
Pas encore d'évaluation
Mémoire PDF
69 pages
Identification Important Exercice
Pas encore d'évaluation
Identification Important Exercice
95 pages
Article ML
Pas encore d'évaluation
Article ML
3 pages
Guide D'installation
100% (1)
Guide D'installation
6 pages
Atelier SQL3 Correction
Pas encore d'évaluation
Atelier SQL3 Correction
3 pages
Le Langage SQL
Pas encore d'évaluation
Le Langage SQL
67 pages
CCNA4 Partie1
Pas encore d'évaluation
CCNA4 Partie1
30 pages
Analyse Des Séries Temporelles
Pas encore d'évaluation
Analyse Des Séries Temporelles
2 pages
Avant Propos Manuel PC - 1
Pas encore d'évaluation
Avant Propos Manuel PC - 1
7 pages
Tout Savoir Sur Les Concours D'inspection Générale Des Banques
Pas encore d'évaluation
Tout Savoir Sur Les Concours D'inspection Générale Des Banques
3 pages
Corrigé-Type D BAC1 BLANC NATIONAL
Pas encore d'évaluation
Corrigé-Type D BAC1 BLANC NATIONAL
7 pages
Cours TOPO 102 (LTN Morand)
Pas encore d'évaluation
Cours TOPO 102 (LTN Morand)
50 pages
Maîtriser la Dynamique Visuelle
Pas encore d'évaluation
Maîtriser la Dynamique Visuelle
20 pages
Lot 01 Plan Bibliotheque
Pas encore d'évaluation
Lot 01 Plan Bibliotheque
52 pages
Exercice 1:: E.N.I.T
Pas encore d'évaluation
Exercice 1:: E.N.I.T
3 pages
Logement Moderne et Famille Urbaine
Pas encore d'évaluation
Logement Moderne et Famille Urbaine
25 pages
Exercices de Génétique Formelle 7D
Pas encore d'évaluation
Exercices de Génétique Formelle 7D
4 pages
GRHH
Pas encore d'évaluation
GRHH
204 pages
Est-Ce Réel ? Phénoménologies de L'imaginaire Par Annabelle Dufourcq
Pas encore d'évaluation
Est-Ce Réel ? Phénoménologies de L'imaginaire Par Annabelle Dufourcq
306 pages
PCT 2nde C 2eme Devoir Du 1er Semestre 2023-2024 Ceg1 Ikpinle
100% (3)
PCT 2nde C 2eme Devoir Du 1er Semestre 2023-2024 Ceg1 Ikpinle
3 pages
Évaluer la Secrétaire chez TANJIS
Pas encore d'évaluation
Évaluer la Secrétaire chez TANJIS
4 pages
Produit Scalaire et Calcul Vectoriel
Pas encore d'évaluation
Produit Scalaire et Calcul Vectoriel
26 pages
Randonnée Belvédère de las Buitreras
Pas encore d'évaluation
Randonnée Belvédère de las Buitreras
4 pages
Transformation Numérique en Entreprise
Pas encore d'évaluation
Transformation Numérique en Entreprise
2 pages
Guide des Pronoms COD et COI en Français
Pas encore d'évaluation
Guide des Pronoms COD et COI en Français
6 pages
Methodes Et Astuces Et Remarques Et Conseils Equation Du Second Degre
Pas encore d'évaluation
Methodes Et Astuces Et Remarques Et Conseils Equation Du Second Degre
1 page
Découverte des Éléments Chimiques
100% (1)
Découverte des Éléments Chimiques
2 pages
Livret 6 Présenter S-Exprimer Sur Une Oeuvre HIDA Peac-1
Pas encore d'évaluation
Livret 6 Présenter S-Exprimer Sur Une Oeuvre HIDA Peac-1
20 pages
C4 L'Adjectif Qualificatif
100% (2)
C4 L'Adjectif Qualificatif
14 pages
Pedologie SGM
Pas encore d'évaluation
Pedologie SGM
20 pages
Horaire Cours Fage Du 05 Au 10 Aout 2024
Pas encore d'évaluation
Horaire Cours Fage Du 05 Au 10 Aout 2024
3 pages
Concours Physique II : Loi de Wiedemann-Franz
Pas encore d'évaluation
Concours Physique II : Loi de Wiedemann-Franz
8 pages
Inj BAHA HAKIM PDF
Pas encore d'évaluation
Inj BAHA HAKIM PDF
143 pages
Cours Méca Spa
Pas encore d'évaluation
Cours Méca Spa
70 pages
Travaux Dirigés sur le Transfert de Chaleur
Pas encore d'évaluation
Travaux Dirigés sur le Transfert de Chaleur
48 pages
Guide Pedagogique de La Student Academy
Pas encore d'évaluation
Guide Pedagogique de La Student Academy
54 pages
Edt SJP 19 Au 24 Mai 2025
Pas encore d'évaluation
Edt SJP 19 Au 24 Mai 2025
11 pages