0% ont trouvé ce document utile (0 vote)
471 vues6 pages

QCM Correction

Ce document est un examen sur le deep learning, comprenant 31 questions à choix multiples sur des sujets tels que l'entraînement de modèles Keras, les réseaux de neurones convolutifs (CNN), les réseaux de neurones récurrents (RNN), et les techniques pour éviter le sur-apprentissage. Les questions portent sur des concepts clés comme le 'early stopping', les fonctions d'activation, le transfert d'apprentissage, et la normalisation par lot. Les étudiants doivent démontrer leur compréhension des architectures de réseaux de neurones et des méthodes d'optimisation.

Transféré par

aminatakimbiri
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
471 vues6 pages

QCM Correction

Ce document est un examen sur le deep learning, comprenant 31 questions à choix multiples sur des sujets tels que l'entraînement de modèles Keras, les réseaux de neurones convolutifs (CNN), les réseaux de neurones récurrents (RNN), et les techniques pour éviter le sur-apprentissage. Les questions portent sur des concepts clés comme le 'early stopping', les fonctions d'activation, le transfert d'apprentissage, et la normalisation par lot. Les étudiants doivent démontrer leur compréhension des architectures de réseaux de neurones et des méthodes d'optimisation.

Transféré par

aminatakimbiri
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Deep learning - Licence d’Excellence /S6

Nom et Prénom : _______________________ Nombres de pages : 6


Code d’Apogée : ________________________ Durée : 1h

1) Laquelle des méthodes suivantes est utilisée pour entraîner un modèle séquentiel
Keras ?
A. [Link]
B. [Link]
C. [Link]
D. [Link]

2) CNN est utilisé lorsqu’il y a .........


A. des images
B. du texte
C. Les deux réponses A) et B)
D. Aucune de ces réponses.

3) Laquelle des affirmations suivantes est la meilleure description de « early stopping »


?
A. Entrainer le réseau jusqu'à ce qu'un minimum local dans la fonction d'erreur soit atteint
B. Simuler le réseau sur un ensemble de données de test après chaque époque (epoch)
d’entrainement. Arrêtez l'entraînement lorsque l'erreur de généralisation commence à
augmenter.
C. Ajoutez un terme « momentum » à la mise à jour du poids (weights) dans la règle delta
généralisée, afin que l’entrainement converge plus rapidement
D. Une version plus rapide de la rétropropagation (Backpropagation), comme l'algorithme «
Quickprop

4) Dans un reseau de neurones de type LSTM, citez le(s) function(s) d’activation les plus
utilisés:
A. ReLU
B. sigmoid
C. tangente hyperbolique. (Tanh)
D. Les réponses B) et C).
5) En deep learning, comment éviter le sur-apprentissage (overfitting) :
A. Récupérer plus de données d’apprentissage
B. Réduire la taille des données d’apprentissage
C. Augmenter la taille des données de test
D. Réduire la taille des données de test
6) Lequel des termes suivants est associé au LSTM?
A. “same” and “valid” Padding.
B. Stride
C. Filters (Kernels).
D. Forget Gate

7) La sortie de la fonction d’activation “softmax” est comprise entre:

1
Deep learning - Licence d’Excellence /S6

A. 0à9
B. 0à1
C. -1 à 1
D. -1 à 0

8) Quelles sont les limites du modèle RNN ?


A. Exploding gradient
B. Vanishing gradient
C. Memoire à court terme (short-term memory) très limitée
D. Toutes les réponses sont correctes

9) Identifier l’architecture CNN qui correspond à la figure suivante:

A. ConCNN
B. ResNet
C. InceptionV3
D. VGG-16
10) Compléter la figure suivante:

A. (1) Training, (2) Evaluation


B. (1) Object detection, (2) Classification
C. (1) Feature Learning, (2) classification
D. Aucune de ces réponses

2
Deep learning - Licence d’Excellence /S6

11) Lors de l'évaluation d'un modèle CNN ou RNN, pourquoi est-il important d'utiliser
à la fois des données d'entraînement, de validation et de test ?

A. Pour évaluer la probabilité de divergence du modèle


B. Pour mesurer l'efficacité du modèle à traiter des données inconnues
C. Pour déterminer le nombre optimal d'époques (epochs) d’entraînement
D. Pour évaluer la probabilité de convergence du modèle
12) En termes de dépendance temporelle, illustrer la différence entre RNN et CNN ?
A. Les modèles CNN peuvent traiter les dépendances temporelles, contrairement aux modèles
RNN.
B. Les modèles RNN peuvent traiter les dépendances temporelles, contrairement aux
modèles CNN.
C. Les modèles CNN et RNN sont tous deux capables de traiter les dépendances
temporelles.
D. Les modèles CNN et RNN ne peuvent pas traiter les dépendances temporelles.

13) Dans un réseau de neurones, Quelle est la fonction de perte (loss function)
couramment utilisée dans les problèmes de classification binaire?
A. L'erreur quadratique moyenne (MSE)
B. L'entropie croisée binaire (binary cross-entropy)
C. L'entropie croisée catégorielle (categorical cross-entropy)
D. L'erreur absolue moyenne (MAE)

14) ………….. est une méthode de descente de gradient stochastique basée sur
l’estimation adaptative des moments de premier et de second ordre (first order and
second orcer moments)?
A. Stochastic Gradient Descent SGD
B. RMsprop
C. Adam

15) Pour un réseau entièrement connecté (Fully Connected), le nombre de nœuds de la


couche d’entrée est 6 et celui de la couche cachée est 6 (Biais pour chaque nœud est
non NULL). Le nombre maximal de paramètres de la couche d’entrée à la couche
cachée est de :
A. Égal à 36
B. Inférieur à 36
C. Supérieur à 36
D. C’est une valeur arbitraire

16) Lequel des éléments suivants est une application du LSTM ?


A. Text Mining
B. Sentiment Analysis
C. Text and Speech Analysis
D. Toutes ces réponses

17) Le Transfer Learning, où apprentissage par transfert en français, désigne

3
Deep learning - Licence d’Excellence /S6

l’ensemble des ………. qui permettent de ……...les connaissances acquises à partir de


la résolution de problèmes donnés pour ………un autre problème.
A. Applications, adopter, traiter
B. Méthodes, transférer, traiter
C. Méthodes, tester, évaluer
D. Applications, tester, traiter

18) Choisissez le code python qui vous permet d'avoir le résultat de pooling de la Figure
2:

Figure 2
A. [Link](MaxPooling2D(pool_size=2))
B. [Link](MaxPooling2D(pool_size=4))
C. [Link](AveragePooling2D (pool_size=2))
D. [Link](AveragePooling2D (pool_size=4))

19) Soit l’architecture du réseau de neurones suivante :

1. def create_model():
2. model = Sequential ()
3. [Link](Dropout(0.2, input_shape=(60,)))
4. [Link](Dense(60, activation='relu', kernel_constraint=MaxNorm(3)))
5. [Link](Dense(30, activation='relu', kernel_constraint=MaxNorm(3)))
6. [Link](Dense(1, activation='sigmoid'))

Identifier le numéro de la ligne de code utilisée pour empêcher le overfitting:


A. Ligne 3
B. Lignes 4 et 5
C. Ligne 6
D. Le “overfitting” n’est pas traité dans ce modèle

20) Une convolution, dans un réseau de neurones convolutifs CNN, est utilisée pour :
A. La classification des images
B. La réduction de la taille de l’image
C. L’extraction des features à partir des images
D. Aucune de ces réponse.

21) Soit la figure suivante:

4
Deep learning - Licence d’Excellence /S6

Figure 3

La Figure 3 présente la fonction d’activation :


A. Tanh (Hyperbolic Tangent)
B. Leaky ReLU
C. ReLU
D. Sigmoid
22) Soit le code python suivant:

CNN = Sequential(name="Sequential_CNN")
[Link](Conv2D(16, kernel_size=(3, 3), strides=(1, 1), padding="same", activation="relu", input_shape=(28, 28, 1)))

Figure 4

Le code dans la Figure 4 consiste à ajouter:


A. Une couche de convolution
B. Une couche de pooling
C. Une couche de flatten
D. Un couche de “fully connected”

23) La taille de l’output du code dans la Figure 4 est:


A. (26, 26, 1)
B. (26, 26, 16)
C. (28, 28, 1)
D. (28, 28, 16)
24) Quel est l'objectif d'utiliser plusieurs filtres de convolution dans une seule couche de
convolution ?
A. Eviter le surapprentissage (overfitting)
B. Réduire la complexité de calcul
C. Réduire la taille de l'entrée du réseau (input size)
D. Extraire des diverses caractéristiques (features)

25) Dans une couche de convolution, le rôle du paramètre “stride” est de :


A. Ajouter des zéros autour de l’entrée pour maintenir les dimensions spatiales
B. Ignorer ou supprimer une partie de l’entrée pendant l’apprentissage
C. Ajuster le ‘learning rate’ pendant l’apprentissage
D. Aucune de ces réponses

26) En deep learning, l’objectif de l’algorithme de Backpropagation est de :


A. Réduire le Learning Rate durant l’apprentissage
B. Calculer les gradients afin de mettre à jour les paramètres du modèle
C. Initialiser les poids du réseau de neurones
D. Pour gérer les valeurs manquantes dans les données en input.

27) Lequel des éléments suivants n'est pas une application de RNN ?
A. Prévision de séries temporelles
B. Détection d'anomalies
C. Prévision météorologique

5
Deep learning - Licence d’Excellence /S6

D. Prédiction boursière
28) Lequel des éléments suivants n’est pas un hyperparamètre dans un réseau de
neurones:
A. Nombre des epochs
B. Batch size
C. Learning rate (Taux d’apprentissage)
D. Aucune ces réponses
29) Quels sont les facteurs pour sélectionner la profondeur d'un réseau neuronal ?
1. Type de réseau neuronal (par exemple ANN, CNN, RNN, etc.)
2. Données d'entrée
3. Puissance de calcul, c'est-à-dire les capacités matérielles et les capacités logicielles
4. Taux d'apprentissage (Learning rate)
5. La fonction d’activation adéquate

A. 1, 2, 4 et 5
B. 2, 3, 4 et 5
C. 1, 3, 4 et 5
D. 1, 2, 3, 4 et 5
30) La méthode "Batch Normalization" ……. :
A. Elle normalise toutes les entrées avant de les envoyer à la couche suivante
B. Elle normalise les poids (weights) avant de les envoyer à la couche suivante
C. Elle normalise les poids de la couche de sortie
D. Aucun de ces réponses
31) Soit le code python suivant:

# Build neural network


model = [Link]()
[Link](Dense(512, activation='relu', input_shape=(NUM_ROWS * NUM_COLS,)))
[Link](……(1)………)
[Link](Dense(256, activation='relu'))
[Link](Dropout(0.25))
[Link](Dense(10, ………(2) .......... )
# Compile model
[Link](optimizer='rmsprop', ………………(3)…………………, metrics=['accuracy'])
Figure 6

Choisissez la bonne réponse qui consiste à compléter le code python dans la Figure 6:
A. (1) activation='softmax’, (2) loss='categorical_crossentropy’, (3) Dropout(0.5)
B. (1) Dropout(0.5) , (2) loss='categorical_crossentropy' , (3) activation='softmax'
C. (1) loss='categorical_crossentropy’, (2) activation='softmax', (3) Dropout(0.5)
D. (1) Dropout(0.5) , (2) activation='softmax', (3) loss='categorical_crossentropy'

Vous aimerez peut-être aussi