République Tunisienne
Ministère de l'Enseignement Supérieur
et de Recherche Scientifique
***
Université de Carthage
***
Institut National des Sciences Appliquées et de Technologie
Module : Deep Learning Session : principale ■
Enseignant :Sana HAMDI Semestre : 2ème
Filière : RT Date : 13/03/2023
Barème : 20 Durée : 1h30
Nombre de pages : 6 Documents : non autorisés ■
Nom :......................................... N° d’inscription : ........................
Prénom :.................................... C. I. N. : ........................
QCM : Questions à Choix Multiple
Pour chacune des questions suivantes, choisir la (les) bonne(s) réponse(s) en justifiant votre choix.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
a
b
c
d
1. Vous entraı̂nez un perceptron pour la classification binaire. Les données sont linéairement séparables,
mais le modèle ne parvient pas à converger. Que feriez-vous pour résoudre ce problème ?
(a) Ajouter des couches cachées
(b) Augmenter le taux d’apprentissage
(c) Standardiser les données
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
2. Vous utilisez un perceptron pour la classification de données non linéairement séparables. Que feriez-vous
pour améliorer les performances du modèle ?
(a) Ajouter des couches cachées
(b) Utiliser une fonction d’activation linéaire
(c) Augmenter le nombre d’itérations
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
-1-
3. Vous travaillez sur le développement d’un modèle Deep Learning de classification multiclasse et vous
avez un ensemble de données avec 10 classes. Quelle fonction d’activation utiliseriez-vous dans la couche
de sortie de votre MLP ?
(a) La fonction sigmoı̈de
(b) La fonction tangente hyperbolique
(c) La fonction softmax
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
4. Vous avez entraı̂né un MLP (MultiLayer Perceptron, Perceptron multicouche) pour la classification bi-
naire et vous constatez que le modèle a une précision de 90% sur les données d’entraı̂nement, mais
seulement 70% sur les données de test. Que feriez-vous pour améliorer la performance du modèle sur les
données de test ?
(a) Réduire la taille du modèle pour éviter le surapprentissage
(b) Augmenter le nombre d’itérations d’entraı̂nement
(c) Ajouter de la régularisation pour réduire le surapprentissage
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
5. Vous entraı̂nez un réseau de neurones pour la reconnaissance d’images, mais vous constatez que la des-
cente de gradient stochastique standard prend beaucoup de temps à converger vers un minimum local.
Quelle méthode de descente de gradient pouvez-vous utiliser pour accélérer l’entraı̂nement ?
(a) Stochastic Gradient Descent (SGD)
(b) Batch Gradient Descent
(c) Mini-Batch Gradient Descent
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
6. Vous entraı̂nez un réseau de neurones profond pour la classification d’images, mais vous constatez que
la descente de gradient stochastique standard prend beaucoup de temps à converger vers un minimum
local. Quelle méthode d’optimisation recommanderiez-vous pour accélérer l’entraı̂nement ?
(a) Momentum
(b) RMSprop
-2-
(c) Adam
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
7. Comment fonctionne Early Stopping ?
(a) En surveillant la performance du modèle sur un ensemble de validation à chaque itération d’entraı̂nement
et en arrêtant l’entraı̂nement lorsque la performance sur l’ensemble de validation commence à se dégrader
(b) En augmentant progressivement la régularisation du modèle à chaque itération d’entraı̂nement pour améliorer
la généralisation
(c) En diminuant progressivement la taille du modèle à chaque itération d’entraı̂nement pour éviter le sur-
apprentissage
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
8. Quels sont les avantages de l’utilisation de Early Stopping ?
(a) Réduction du sur-apprentissage et amélioration de la capacité de généralisation
(b) Augmentation de la précision du modèle sur les données d’entraı̂nement
(c) Réduction de la variance du modèle
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
9. Vous entraı̂nez un modèle Deep Learning de classification multi-classes et vous avez un déséquilibre
important dans les classes. Quelle métrique devez-vous utiliser pour évaluer votre modèle ?
(a) La précision
(b) Le rappel
(c) L’accuracy
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
10. Votre modèle de classification des différentes espèces de chiens enregistre une erreur d’ensemble d’en-
traı̂nement élevée. Parmi les éléments suivants, lesquels sont prometteurs pour essayer d’améliorer votre
classifieur ?
-3-
(a) Utiliser un plus grand réseau de neurones
(b) Obtenir plus de données d’entraı̂nement
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
11. Dans le cadre de la réalisation d’une application pour aider les médecins dans leurs diagnostics, on vous
a dédié la tâche de construction d’un modèle Deep Learning pour la prédiction de la présence d’une
tumeur dans un scanner cérébral. Le label de la présence d’une tumeur est 1 et l’absence d’une tumeur
est 0. Laquelle de ces métriques choisiriez-vous d’utiliser ?
(a) La précision
(b) Le rappel
(c) L’accuracy
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
12. Dans quelle situation le drop-out peut-il être utile ?
(a) Lorsque le modèle ne parvient pas à converger vers une solution satisfaisante
(b) Lorsque le modèle commence à surapprendre sur les données d’entraı̂nement
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
13. Quelles sont les conséquences possibles d’un taux de drop-out trop élevé ?
(a) Le modèle risque de ne pas converger vers une solution satisfaisante
(b) Le modèle risque de sous-apprendre et de ne pas généraliser correctement
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
14. Supposons que vous entraı̂niez un réseau de neurones à plusieurs couches. Comment le backpropagation
est-il utilisé pour ajuster les poids et les biais du modèle ?
(a) Les poids et les biais sont ajustés en même temps à chaque itération de l’algorithme d’optimisation.
(b) Le backpropagation est utilisé pour calculer le gradient de la fonction de perte par rapport à chaque poids
et biais, puis les poids et les biais sont ajustés en utilisant une méthode d’optimisation.
-4-
(c) Les poids sont ajustés en utilisant l’algorithme du gradient stochastique (SGD), tandis les biais sont ajustés
en utilisant le backpropagation.
(d) Les poids et les biais sont ajustés en utilisant une méthode d’optimisation différente du backpropagation.
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
15. Quel est l’objectif de la rétropropagation en réseau de neurones ?
(a) Optimiser les poids du réseau pour minimiser la fonction de coût.
(b) Calculer la sortie du réseau pour une entrée donnée.
(c) Initialiser les poids du réseau avec des valeurs aléatoires.
(d) Réduire le nombre de paramètres du réseau.
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
16. Vous avez un réseau de neurones avec une couche d’entrée de 100 neurones, une couche cachée de 50
neurones et une couche de sortie de 10 neurones. Combien de poids y a-t-il dans le réseau ?
(a) 5 100
(b) 5 560
(c) 6 000
(d) 6 500
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
17. Vous avez un ensemble de données de taille 100000 × 784 pour la classification d’images. Vous souhaitez
utiliser un réseau de neurones pour effectuer cette tâche. Quel type de réseau de neurones devriez-vous
utiliser pour ce projet ?
(a) Un réseau de neurones entièrement connecté.
(b) Un réseau de neurones convolutif.
(c) Les deux réponses sont valables.
(d) Aucune réponse n’est valable.
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
-5-
18. Vous utilisez une architecture CNN (Convolutional Neural Network) avec une couche de convolution
suivie d’une couche de pooling. La couche de convolution a 32 filtres de taille 5 × 5, un padding de 2 et
un stride de 1, et la couche de pooling a une fenêtre de taille 2 × 2 et un stride de 2. La taille de l’entrée
est 32 × 32 × 3
(a) La couche de convolution a 2400 paramètres et la couche de pooling a 1 paramètres.
(b) La couche de convolution a 2432 paramètres et la couche de pooling a 0 paramètres.
(c) La couche de convolution a 2400 paramètres et la couche de pooling a 0 paramètres.
(d) La couche de convolution a 1472 paramètres et la couche de pooling a 0 paramètres.
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
19. Vous utilisez une architecture CNN (Convolutional Neural Network) avec une couche de convolution
suivie d’une couche de pooling. La couche de convolution a 32 filtres de taille 5 × 5, un padding de 2 et
un stride de 1, et la couche de pooling a une fenêtre de taille 2 × 2 et un stride de 2. Si la taille de l’entrée
est 64 × 64 × 3, quelle est la taille de sortie de la couche de pooling ?
(a) 16 × 16 × 32
(b) 32 × 32 × 32
(c) 15 × 15 × 32
(d) 31 × 31 × 32
Justification : ........................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
.................................................................................................................................................................................
-6-