Révision Applications IA
1. Quel est l'objectif principal de la classification supervisée ?
a) Découvrir automatiquement des groupes dans les données
b) Prédire une étiquette à partir de données déjà étiquetées
c) Réduire la dimensionnalité d’un jeu de données
d) Générer des images réalistes à partir de bruit
2. Parmi les algorithmes suivants, lequel est principalement utilisé
pour la régression ?
a) k-means
b) DecisionTreeRegressor
c) Naive Bayes
d) DBSCAN
3. Quelle technique est utilisée pour regrouper des données non
étiquetées en groupes similaires ?
a) Classification
b) Clustering
c) Régression
d) Vectorisation
4. Quel est le rôle de l’algorithme Apriori ?
a) Réduire la dimensionnalité des données
b) Prédire la catégorie d’une image
c) Découvrir des règles d’association entre variables
d) Détecter des objets dans une vidéo
5. Quelle est la tâche principale d’un système de recommandation ?
a) Supprimer les doublons d’une base de données
b) Détecter des fraudes bancaires
c) Proposer du contenu pertinent à l’utilisateur
d) Réaliser la segmentation d’images
6. Quelle métrique mesure la proportion de vraies prédictions
positives sur l’ensemble des prédictions positives ?
a) Accuracy
b) Recall
c) F1-score
d) Précision
7. Quel est l’objectif de l’algorithme PCA ?
a) Créer des clusters non supervisés
b) Réduire la dimensionnalité tout en préservant la variance
c) Augmenter la précision d’un classifieur
d) Équilibrer des classes déséquilibrées
8. Lequel des modèles suivants est un détecteur d’objets one-
stage ?
a) Faster R-CNN
b) YOLO
c) R-CNN
d) Mask R-CNN
9. Quelle couche du modèle Faster R-CNN génère des propositions
de régions ?
a) Head
b) Neck
c) Region Proposal Network (RPN)
d) Bounding Box Layer
10. Dans le NLP, que fait la tâche de “lemmatisation” ?
a) Elle supprime les accents des mots
b) Elle réduit les mots à leur forme canonique
c) Elle identifie les parties du discours
d) Elle traduit un texte en une autre langue
11. Quelle bibliothèque Python est couramment utilisée pour créer
des arbres de décision ?
a) TensorFlow
b) matplotlib
c) scikit-learn
d) pandas
12. Quel type d'apprentissage utilise des récompenses pour guider
l’agent ?
a) Apprentissage supervisé
b) Apprentissage non supervisé
c) Apprentissage par renforcement
d) Apprentissage semi-supervisé
13. Dans un jeu de données déséquilibré, quelle métrique est la plus
utile pour évaluer un modèle ?
a) Accuracy
b) F1-score
c) RMSE
d) R²
14. Quelle est la sortie principale d’un classifieur multiclasse ?
a) Un seul score de régression
b) Un vecteur de similarité
c) Une probabilité pour chaque classe possible
d) Un ensemble de règles d’association
15. Quel est le rôle du CountVectorizer dans le traitement du texte ?
a) Générer des images à partir de texte
b) Compter les fréquences de mots pour créer des vecteurs
c) Réduire la dimension des données
d) Traduire les mots en d’autres langues
16. Que fait le TfidfVectorizer par rapport au CountVectorizer ?
a) Supprime les mots trop fréquents uniquement
b) Applique un poids basé sur la fréquence inverse du mot dans les
documents
c) Utilise un réseau de neurones pour encoder les mots
d) Trie les documents par pertinence
17. Quelle méthode est adaptée à un problème où la variable cible
prend des valeurs comme “rouge”, “bleu”, “vert” ?
a) Régression linéaire
b) Clustering hiérarchique
c) Classification
d) Réduction de dimension
18. Dans un modèle de régression, quel est l’effet du
surapprentissage (overfitting) ?
a) Le modèle généralise mieux
b) Le modèle est plus rapide à exécuter
c) Le modèle a une très haute précision sur l’entraînement mais faible sur les
tests
d) Le modèle se débarrasse du bruit dans les données
19. Quel est le rôle de l’étape de normalisation des données ?
a) Ajouter de nouvelles classes au dataset
b) Uniformiser l’échelle des variables
c) Identifier les colonnes manquantes
d) Supprimer les doublons
20. Quel algorithme de clustering ne nécessite pas de spécifier le
nombre de clusters à l'avance ?
a) k-means
b) DBSCAN
c) SVM
d) Gaussian Mixture Model
21. Que signifie "IoU" dans le contexte de la détection d’objets ?
a) Image over Units
b) Inference of Utility
c) Intersection over Union
d) Image of Usage
22. Dans un arbre de décision, quel critère est souvent utilisé pour
les divisions ?
a) Moyenne quadratique
b) Entropie ou Gini
c) Coefficient de corrélation
d) R²
23. Quelle technique de réduction de dimensionnalité est basée sur
les valeurs propres et vecteurs propres ?
a) PCA
b) t-SNE
c) Clustering
d) CNN
24. Quelle tâche est la mieux adaptée pour détecter des emails
indésirables ?
a) Régression logistique
b) Clustering
c) Classification binaire
d) Vectorisation
25. Dans un modèle supervisé, qu’est-ce que la variable cible
(target) ?
a) La variable d’entrée
b) La métrique utilisée pour évaluer le modèle
c) La sortie attendue à prédire
d) Le nom du fichier contenant les données
26. Quel est l’effet principal du label encoding ?
a) Supprimer les valeurs nulles
b) Transformer des colonnes numériques en texte
c) Remplacer des catégories textuelles par des entiers
d) Mélanger les colonnes du dataset
27. Dans le modèle k-NN, que représente le “k” ?
a) Le nombre de clusters à trouver
b) Le nombre de voisins à considérer
c) Le nombre de couches du modèle
d) Le taux d’erreur attendu
28. Qu'est-ce qu'un "surdéterminé" dans une équation de régression
?
a) Un modèle avec plus de sorties que d’entrées
b) Un système avec plus d’équations que d’inconnues
c) Un modèle où tous les coefficients valent zéro
d) Une régression avec uniquement des valeurs manquantes
29. Quel type de variable est le mieux adapté à une régression
linéaire ?
a) Variable binaire
b) Variable catégorielle
c) Variable continue
d) Variable horodatée
30. Quel est le rôle du test set dans l’évaluation d’un modèle ?
a) Servir de référence pour les métriques internes
b) Optimiser les hyperparamètres
c) Évaluer la performance sur des données jamais vues
d) Remplacer le jeu d’entraînement
31. Quelle méthode de validation consiste à diviser les données en k
sous-ensembles utilisés à tour de rôle pour le test ?
a) Split 80/20
b) Validation croisée (k-fold)
c) Hold-out
d) Bootstrap
32. Quelle propriété distingue un problème de classification
multiclasse d’un problème binaire ?
a) La cible est continue
b) Il y a plus de deux classes possibles
c) Les données sont non supervisées
d) On n’a pas besoin de variable cible
33. Quel est l’avantage principal de la normalisation des données ?
a) Réduire le bruit aléatoire
b) Faire converger plus rapidement les algorithmes
c) Supprimer les doublons dans le dataset
d) Remplacer les valeurs nulles
34. Quel algorithme permet de détecter des groupes denses dans
des espaces bruités ?
a) k-NN
b) k-means
c) DBSCAN
d) Linear Regression
35. Dans un arbre de décision, que représente une “feuille” ?
a) Une règle d’arrêt
b) Une variable d’entrée
c) Une décision finale
d) Une erreur de prédiction
36. Que permet de faire l’encodage one-hot ?
a) Supprimer les doublons d’un dataset
b) Convertir des valeurs numériques en texte
c) Transformer des catégories en colonnes binaires
d) Réduire la variance des données
37. Quelle est la fonction principale d’un modèle de régression ?
a) Classer un échantillon dans une catégorie
b) Prédire une valeur numérique continue
c) Réduire la taille des données
d) Identifier des clusters
38. Quel est l’objectif d’un algorithme de détection d’anomalies ?
a) Identifier les observations typiques dans les données
b) Équilibrer un dataset
c) Identifier les points de données inhabituels ou suspects
d) Remplir les valeurs manquantes
39. Que fait une matrice de confusion dans la classification ?
a) Représente l’évolution du modèle dans le temps
b) Compare les performances de deux modèles
c) Résume les prédictions correctes et incorrectes
d) Affiche les hyperparamètres utilisés
40. Quel type de variable ne peut pas être utilisé directement dans
un modèle de régression linéaire sans encodage ?
a) Variable continue
b) Variable entière
c) Variable catégorielle textuelle
d) Variable booléenne
41. Quelle est la principale différence entre le surapprentissage
(overfitting) et le sous-apprentissage (underfitting) ?
a) Le surapprentissage se produit quand le modèle est trop simple
b) Le sous-apprentissage donne de très bonnes performances sur le test
c) Le surapprentissage mémorise les données d’entraînement au lieu de
généraliser
d) Le sous-apprentissage n’est possible qu’avec des réseaux de neurones
42. Quel est le rôle de l’échantillonnage aléatoire (random sampling)
?
a) Augmenter la précision d’un modèle
b) Créer des modèles plus complexes
c) Réduire le temps d’entraînement
d) Représenter équitablement l’ensemble des données
43. Qu'est-ce qu'un hyperparamètre dans un modèle d’IA ?
a) Une variable de sortie du modèle
b) Un paramètre appris automatiquement pendant l'entraînement
c) Un paramètre défini avant l'entraînement qui influence le modèle
d) Une métrique d'évaluation
44. Quel format de fichier est souvent utilisé pour stocker des jeux
de données tabulaires ?
a) .jpg
b) .csv
c) .mp3
d) .exe
45. Que fait la méthode fit() dans scikit-learn ?
a) Elle affiche les données sous forme de tableau
b) Elle applique un modèle entraîné à de nouvelles données
c) Elle entraîne un modèle sur les données fournies
d) Elle supprime les valeurs nulles
46. Quelle méthode d'évaluation convient le mieux à un modèle de
classification multiclasse ?
a) R²
b) F1-score macro
c) RMSE
d) MAE
47. Dans un dataset, pourquoi divise-t-on les données en train/test ?
a) Pour alléger la mémoire utilisée
b) Pour tester la capacité du modèle à généraliser
c) Pour éliminer les valeurs extrêmes
d) Pour normaliser les variables
48. Que signifie la régularisation L2 ?
a) Supprimer les variables corrélées
b) Ajouter une pénalité proportionnelle au carré des coefficients
c) Créer une validation croisée automatique
d) Normaliser les données d’entrée
49. Quel est le rôle de LabelEncoder() en scikit-learn ?
a) Appliquer un modèle pré-entraîné
b) Visualiser des données catégorielles
c) Convertir des labels textuels en valeurs numériques
d) Supprimer les doublons dans le dataset
50. Quelle affirmation est vraie à propos de k-means ?
a) Il fonctionne mieux avec des données textuelles
b) Il nécessite de spécifier le nombre de clusters à l’avance
c) Il supprime automatiquement les valeurs aberrantes
d) Il effectue une classification supervisée
51. Quel est le principal inconvénient de l’algorithme k-NN ?
a) Il nécessite un grand nombre de paramètres à ajuster
b) Il ne peut pas être utilisé pour des données numériques
c) Il est lent lors de la prédiction car il parcourt tout le dataset
d) Il ne fonctionne pas avec des données non étiquetées
52. Quelle est la fonction principale de train_test_split() dans scikit-
learn ?
a) Visualiser les performances d’un modèle
b) Séparer les données en sous-ensembles d’entraînement et de test
c) Normaliser les colonnes numériques
d) Encoder les labels textuels
53. Quel type d’apprentissage est utilisé quand les données n’ont
pas d’étiquette ?
a) Apprentissage supervisé
b) Apprentissage non supervisé
c) Apprentissage par renforcement
d) Apprentissage supervisé inversé
54. Quel est l'objectif principal de l’algorithme PCA ?
a) Créer de nouveaux clusters
b) Réduire la redondance dans les variables
c) Détecter des anomalies dans les séries temporelles
d) Évaluer les performances d’un modèle
55. Quel est l’effet d’un taux d’apprentissage trop élevé dans un
réseau de neurones ?
a) Le modèle converge plus rapidement sans aucun risque
b) Le modèle pourrait ne jamais converger ou osciller
c) Le modèle mémorise mieux les données
d) Le modèle produit des prédictions constantes
56. Qu’est-ce qu’un “token” dans le traitement du langage naturel
(NLP) ?
a) Une prédiction du modèle
b) Une représentation graphique
c) Un mot ou un sous-mot extrait d’un texte
d) Une métrique de performance
57. Quelle bibliothèque est la plus souvent utilisée pour manipuler
des tableaux et des DataFrames en Python ?
a) NumPy
b) TensorFlow
c) scikit-learn
d) pandas
58. Quelle est l’utilité d’une matrice de confusion ?
a) Générer automatiquement des clusters
b) Visualiser l’architecture d’un modèle
c) Résumer les prédictions correctes et incorrectes par classe
d) Calculer le taux de variance
59. Que mesure la métrique “recall” ?
a) Le pourcentage total de bonnes prédictions
b) La capacité du modèle à éviter les faux positifs
c) La capacité à retrouver toutes les vraies instances positives
d) La précision moyenne sur l’ensemble du dataset
60. Quelle méthode est la plus adaptée pour détecter des spams
dans des SMS ?
a) Régression linéaire
b) Clustering hiérarchique
c) Classification binaire avec vectorisation de texte
d) PCA
61. Quel est l’intérêt d’utiliser un pipeline dans scikit-learn ?
a) Créer un modèle de réseau de neurones personnalisé
b) Visualiser les résultats sous forme de graphique
c) Enchaîner automatiquement les étapes de transformation et de
modélisation
d) Réaliser une validation croisée manuellement
62. Dans un modèle de régression, que signifie une valeur de R²
proche de 1 ?
a) Le modèle ne prédit pas mieux que le hasard
b) Le modèle est peu fiable
c) Le modèle explique bien la variance de la variable cible
d) Le modèle est en surapprentissage
63. Quel type de modèle est le plus adapté pour prédire le prix d’un
bien immobilier ?
a) Classifieur binaire
b) Régression linéaire
c) Clustering hiérarchique
d) Analyse discriminante linéaire
64. Quelle méthode permet de choisir automatiquement les
meilleurs paramètres d’un modèle ?
a) GridSearchCV
b) LabelEncoder
c) ConfusionMatrix
d) DecisionTreePlot
65. Que fait une fonction d’activation dans un réseau de neurones ?
a) Elle initialise les poids
b) Elle contrôle la forme de la sortie des neurones
c) Elle nettoie les données d’entrée
d) Elle arrête l’entraînement du modèle
66. Qu’est-ce que le “dropout” dans les réseaux de neurones ?
a) Une technique pour augmenter le nombre d’échantillons
b) Un indicateur de performance
c) Une méthode pour régulariser et éviter le surapprentissage
d) Une métrique d’optimisation
67. Quel modèle NLP est basé sur une architecture de type
Transformer ?
a) Naive Bayes
b) Word2Vec
c) BERT
d) LSTM
68. Quelle est la particularité de l’algorithme t-SNE ?
a) Il réduit la dimensionnalité tout en conservant les distances globales
b) Il est utilisé pour la classification binaire
c) Il préserve la structure locale des données en 2D ou 3D
d) Il remplace les modèles supervisés
69. Quelle technique est utilisée pour éviter la sur-représentation
d'une classe dans les données ?
a) Augmentation de données
b) Encodage one-hot
c) Sur-échantillonnage (oversampling)
d) PCA
70. Que signifie “epoch” dans l’apprentissage d’un réseau de
neurones ?
a) Un lot de données d’entrée
b) Un test de validation
c) Un passage complet sur tout le jeu de données
d) Une couche d’activation
71. Quelle est la fonction d’un optimiseur dans un réseau de
neurones ?
a) Supprimer les erreurs de données
b) Maximiser le nombre d’epochs
c) Mettre à jour les poids pour minimiser la fonction de perte
d) Visualiser les couches du modèle
72. Quel est le rôle principal de la fonction de perte (loss function) ?
a) Identifier les variables les plus importantes
b) Mesurer l’écart entre la prédiction et la valeur réelle
c) Créer des couches supplémentaires dans le modèle
d) Générer des clusters à partir des données
73. Quelle bibliothèque Python est spécialisée dans les réseaux de
neurones profonds ?
a) seaborn
b) pandas
c) TensorFlow
d) matplotlib
74. Quelle structure est typique d’un réseau convolutif (CNN) ?
a) Une suite de couches fully connected uniquement
b) Des couches de convolution, de pooling, et de classification
c) Une couche unique de clustering
d) Une seule fonction d’activation pour tout le modèle
75. Quelle technique consiste à générer artificiellement des données
pour enrichir un dataset ?
a) Undersampling
b) Data augmentation
c) Feature engineering
d) PCA
76. Qu’est-ce que le “feature scaling” ?
a) Réduire le nombre de lignes d’un dataset
b) Augmenter le nombre de classes dans une classification
c) Mettre les variables sur une échelle comparable
d) Supprimer les colonnes inutiles
77. Quel algorithme est un exemple d’apprentissage semi-
supervisé ?
a) k-means
b) SVM
c) Label propagation
d) Naive Bayes
78. Que représente la courbe ROC ?
a) Le taux d'erreur moyen au fil des epochs
b) La précision du modèle en fonction du taux de rappel
c) La relation entre le taux de vrais positifs et le taux de faux positifs
d) La vitesse d’apprentissage du modèle
79. Dans les séries temporelles, que permet de faire l’analyse de
tendance ?
a) Identifier les classes dominantes
b) Détecter les saisons manquantes
c) Visualiser la progression moyenne des données dans le temps
d) Appliquer le clustering
80. Quel type de tâche consiste à affecter une catégorie à chaque
pixel d’une image ?
a) Object detection
b) Image classification
c) Instance segmentation
d) Semantic segmentation
81. Quelle est la principale différence entre semantic segmentation
et instance segmentation ?
a) Semantic segmentation utilise des images en noir et blanc
b) Instance segmentation identifie chaque objet individuellement
c) Semantic segmentation fonctionne uniquement sur du texte
d) Instance segmentation est non supervisée
82. Quel est le rôle de StandardScaler() en scikit-learn ?
a) Supprimer les colonnes redondantes
b) Encoder les variables catégorielles
c) Centrer les données autour de 0 et les réduire à une variance de 1
d) Normaliser les dates
83. Dans l’algorithme Naive Bayes, l’hypothèse clé est que :
a) Les variables d’entrée sont corrélées
b) Les variables de sortie sont continues
c) Les variables sont indépendantes les unes des autres
d) Les données sont hiérarchiques
84. Quel est le format typique d’un ensemble de données d’image
pour l'entraînement d’un CNN ?
a) Un tableau de texte brut
b) Un vecteur de chaînes de caractères
c) Un tenseur (hauteur, largeur, canaux)
d) Un fichier CSV avec des ID
85. Que permet l’analyse de sentiment dans le NLP ?
a) Identifier les noms propres dans un texte
b) Compter les mots les plus fréquents
c) Déterminer l’opinion exprimée (positive, négative, neutre)
d) Traduire automatiquement un texte
86. Dans le cadre d’un modèle supervisé, qu’est-ce qu’un “faux
positif” ?
a) Une prédiction correcte pour la classe négative
b) Une prédiction incorrecte pour la classe positive
c) Une prédiction correcte pour la classe positive
d) Une erreur due à un échantillon manquant
87. Quelle méthode de sampling consiste à extraire plusieurs
échantillons avec remplacement ?
a) Cross-validation
b) Hold-out
c) Bootstrap
d) Under-sampling
88. Quel type de graphique est le plus adapté pour visualiser la
corrélation entre deux variables continues ?
a) Histogramme
b) Boîte à moustaches
c) Nuage de points (scatter plot)
d) Diagramme circulaire
89. Qu’est-ce qu’un “early stopping” dans l’entraînement d’un
modèle ?
a) Arrêter l'entraînement quand toutes les époques sont complétées
b) Interrompre manuellement le programme
c) Arrêter l'entraînement si la performance ne s’améliore plus sur le jeu de
validation
d) Réinitialiser les poids au début de chaque époque
90. Quelle métrique permet de mesurer la dispersion d’un ensemble
de données autour de la moyenne ?
a) Moyenne
b) Médiane
c) Variance
d) R²
91. Quelle est la caractéristique d’un modèle linéaire ?
a) Il fonctionne uniquement avec des données catégorielles
b) Il suppose une relation proportionnelle entre les variables d’entrée et la
sortie
c) Il ne nécessite aucun prétraitement des données
d) Il est basé sur des règles d’association
92. Quel est l’objectif d’un algorithme de génération de texte
comme GPT ?
a) Résumer automatiquement des images
b) Générer des textes cohérents à partir d’une entrée
c) Traduire du texte en images
d) Détecter les anomalies dans des signaux audio
93. Quel est l'avantage des modèles ensemblistes comme Random
Forest ?
a) Ils nécessitent très peu de données
b) Ils entraînent un seul arbre pour plus de rapidité
c) Ils combinent plusieurs modèles pour améliorer la performance et la
robustesse
d) Ils réduisent le besoin de validation croisée
94. Que permet de faire le “feature engineering” ?
a) Créer un modèle plus rapide
b) Réduire automatiquement la taille des données
c) Concevoir ou transformer des variables pour améliorer les performances
du modèle
d) Ajouter des valeurs manquantes aléatoires
95. Que signifie le terme “scalabilité” d’un modèle ?
a) Sa capacité à fonctionner sans GPU
b) Sa capacité à être interprété facilement
c) Sa capacité à traiter efficacement de grands volumes de données
d) Sa capacité à remplacer tous les modèles existants
96. Quelle stratégie permet de gérer les valeurs manquantes dans
un dataset ?
a) Appliquer une transformation PCA
b) Les remplacer par la moyenne ou la médiane
c) Les convertir en variables booléennes
d) Les encoder avec one-hot
97. Qu’est-ce que le “bagging” dans les modèles ensemblistes ?
a) Un modèle basé sur un seul échantillon
b) Une méthode pour réduire la variance en utilisant plusieurs échantillons
aléatoires
c) Une technique de réduction de dimension
d) Une méthode de régularisation L1
98. Quelle est la sortie typique d’un modèle de classification
probabiliste ?
a) Une image
b) Une valeur booléenne
c) Un vecteur de probabilités pour chaque classe
d) Un score de similarité entre variables
99. Pourquoi utiliser une couche de pooling dans un réseau de
neurones convolutif (CNN) ?
a) Pour augmenter la résolution des images
b) Pour normaliser les images
c) Pour réduire la taille des représentations intermédiaires
d) Pour générer des mots-clés
100. Quel est le rôle de la bibliothèque matplotlib en Python ?
a) Créer des modèles de machine learning
b) Manipuler des tableaux et des matrices
c) Visualiser des données sous forme de graphiques
d) Construire des réseaux de neurones profonds