Q2

Le document est un quiz sur les concepts de traitement des données en Machine Learning, abordant des sujets tels que les types de données, les techniques d'imputation, la normalisation, et la gestion des données déséquilibrées. Il présente des questions à choix multiples sur des techniques spécifiques comme l'encodage one-hot, le SMOTE, et la standardisation. Les réponses correctes sont indiquées pour chaque question, fournissant un aperçu des connaissances requises dans ce domaine.

Transféré par

marwaneouzaina

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

27 vues6 pages

Q2

Transféré par

marwaneouzaina

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

QUIZ 1

Quelle est la principale caractéristique des données numériques continues ?

 Elles prennent des valeurs discrètes.
 Elles peuvent prendre n'importe quelle valeur dans un intervalle donné.
 Elles sont toujours entières.
 Elles ne peuvent pas être mesurées.
Quel exemple représente des données discrètes ?
 Poids d'une personne
 Température
 Nombre d'enfants dans une famille
 Vitesse d'un véhicule
Les données ordinales :
 N'ont pas d'ordre défini
 Peuvent être mesurées avec une précision infinie
 Représentent des catégories avec un ordre spécifique
 Sont toujours numériques
Quelle technique est utilisée pour traiter des données nominales ?
 Encodage one-hot
 Normalisation
 Standardisation
 Réduction de dimensionnalité
Les données catégorielles sont généralement :
 Des données qui peuvent être mesurées numériquement
 Des valeurs continues
 Des catégories ou groupes
 Des données temporelles
Que signifie l’imputation des données manquantes ?
 Supprimer les lignes avec des données manquantes
 Remplacer les données manquantes par une estimation
 Normaliser les données manquantes
 Aucune des réponses ci-dessus
Quel est le risque de supprimer des lignes contenant des données manquantes ?
 Perte d'information importante
 Amélioration de la qualité du modèle
 Augmentation de la variance des données
 Aucune conséquence
Quelle technique est utilisée pour remplacer les valeurs manquantes par la moyenne ou la
médiane ?
 Encodage
 Imputation
 Normalisation
 Réduction de dimensionnalité
Quelles sont les approches courantes pour détecter des valeurs aberrantes dans un dataset ?
 Comparer les valeurs avec des seuils prédéfinis (par exemple, valeurs trop
grandes ou trop petites)
 Identifier des valeurs extrêmes en utilisant la moyenne et l'écart-type
 Supprimer toutes les lignes du dataset sans vérification
 Remplacer les valeurs manquantes par la moyenne
Les valeurs aberrantes peuvent :
 Améliorer la performance du modèle
 Déformer les résultats du modèle
 Aucune influence sur le modèle
 Remplacer les données manquantes
Quelle technique transforme les données pour qu'elles aient une moyenne de 0 et un écart-
type de 1 ?
 Normalisation
 Standardisation
 Imputation
 Encodage
Pourquoi est-il important de normaliser les données avant d'entraîner un modèle ?
 Pour que les données aient une échelle similaire
 Pour réduire le nombre de caractéristiques
 Pour gérer les valeurs manquantes
 Aucune des réponses ci-dessus
Quelle méthode de transformation est souvent utilisée pour réduire la dimensionnalité d'un jeu
de données ?
 PCA (Analyse en Composantes Principales)
 Standardisation
 Encodage one-hot
 Régression linéaire
Le One-Hot Encoding est utilisé principalement pour :
 Traiter les données continues
 Transformer les données ordinales en valeurs numériques
 Encoder les variables catégorielles nominales
 Réduire la dimensionnalité des données
Quelle méthode peut être utilisée pour convertir des données textuelles en nombres ?
 PCA
 Tokenization
 One-Hot Encoding
 Aucune des réponses ci-dessus
Que signifie "données déséquilibrées" en Machine Learning ?
 Les classes sont équilibrées entre elles
 Une classe est sur-représentée par rapport à l'autre
 Toutes les données sont égales
 Il n'y a aucune classe
Quelle technique est utilisée pour équilibrer les classes dans un jeu de données déséquilibré ?
 Réduction de la dimensionnalité
 SMOTE (Synthetic Minority Over-sampling Technique)
 One-Hot Encoding
 Aucune technique
Quelle est la conséquence de ne pas traiter des données déséquilibrées ?
 Amélioration des résultats du modèle
 Biais du modèle en faveur de la classe majoritaire
 Réduction de la variance du modèle
 Aucune conséquence
L'undersampling consiste à :
 Ajouter des exemples à la classe minoritaire
 Réduire le nombre d'exemples de la classe majoritaire
 Ajouter des caractéristiques supplémentaires
 Aucune des réponses ci-dessus
L'oversampling consiste à :
 Réduire le nombre d'exemples dans la classe majoritaire
 Créer des copies supplémentaires de la classe majoritaire
 Ajouter des exemples à la classe minoritaire
 Réduire la dimensionnalité
La normalisation est utilisée pour :
 Appliquer des valeurs spécifiques à chaque variable
 Changer la distribution des données
 Réduire l'écart type des données
 Transformer les données afin qu'elles aient une échelle similaire
Quelle est la principale différence entre normalisation et standardisation ?
 La normalisation change la distribution des données, la standardisation non
 La standardisation transforme les données dans un intervalle donné, la
normalisation non
 La normalisation ajuste l'échelle des données, la standardisation ne le fait pas
 Aucune différence
Pourquoi utiliser la réduction de la dimensionnalité ?
 Pour augmenter la complexité des modèles
 Pour améliorer l'efficacité des calculs et réduire le bruit
 Pour ajouter plus de caractéristiques au modèle
 Pour traiter les données déséquilibrées
L’imputation des données manquantes peut être réalisée par :
 Remplacement par la moyenne
 Suppression des lignes
 Remplacement par une valeur prédite
 Toutes les réponses ci-dessus
Quelle technique est utilisée pour détecter des valeurs aberrantes dans les données ?
 Boxplot
 K-means clustering
 PCA
 Toutes les réponses ci-dessus
Quel modèle est sensible à l'échelle des données ?
 Arbres de décision
 K-plus proches voisins
 Régression linéaire
 Aucune des réponses ci-dessus
Pour quel type de données la normalisation est-elle essentielle ?
 Données discrètes
 Données catégorielles
 Données continues
 Données textuelles
Quel est l'objectif principal du SMOTE ?
 Réduire le nombre de caractéristiques
 Générer de nouveaux échantillons pour la classe minoritaire
 Standardiser les données
 Supprimer les lignes avec des valeurs manquantes
Quel algorithme bénéficie le plus de la réduction de la dimensionnalité ?
 Régression linéaire
 Réseaux neuronaux
 Forêts aléatoires
 Toutes les réponses ci-dessus
L’encodage one-hot est utilisé pour transformer des données :
 Ordinales
 Nominales
 Numériques continues
 Aucune des réponses ci-dessus
Quelles étapes peuvent être nécessaires avant d'appliquer un modèle de Machine Learning sur
un jeu de données ?
 Normalisation, nettoyage, transformation
 Encodage des données, réduction de dimensionnalité
 Imputation des données manquantes
 Toutes les réponses ci-dessus
Pourquoi les données déséquilibrées peuvent-elles poser un problème dans l'apprentissage ?
 Le modèle peut être biaisé vers la classe majoritaire
 Le modèle est plus lent
 Les classes sont mal séparées
 Aucune des réponses ci-dessus
L'oversampling et undersampling sont des techniques utilisées pour :
 Réduire le bruit
 Manipuler l'échelle des données
 Traiter les données déséquilibrées
 Réduire la dimensionnalité
Quel prétraitement est nécessaire pour des données temporelles ?
 Normalisation
 Lissage
 Décalage de fenêtre
 Toutes les réponses ci-dessus
Qu'est-ce que la normalisation min-max ?
 Transformation des données dans une échelle de -1 à 1
 Transformation des données dans un intervalle de [0, 1]
 Transformation des données en logarithmes
 Réduction des données en une seule dimension
Quelle technique de transformation est utilisée pour éviter que des variables dominent les
autres ?
 Encodage
 Normalisation
 Standardisation
 Imputation
Les données binaires sont :
 Des valeurs continues entre 0 et 1
 Des valeurs qui ne peuvent être que 0 ou 1
 Des variables catégorielles avec plus de deux catégories
 Aucune des réponses ci-dessus
Que permet la réduction de dimensionnalité ?
 Accélérer le calcul
 Préserver la majorité de l'information
 Supprimer les caractéristiques inutiles
 Toutes les réponses ci-dessus
Quel est le principal objectif de l’imputation des données manquantes ?
 Minimiser la perte d'informations
 Créer de nouvelles lignes de données
 Modifier les valeurs des données
 Réduire la variance
Qu'est-ce que l’encodage ordinal ?
 Attribuer des valeurs numériques aux catégories avec un ordre
 Utiliser des colonnes binaires pour chaque catégorie
 Appliquer une transformation logistique
 Aucune des réponses ci-dessus

Vous aimerez peut-être aussi

Q4
Pas encore d'évaluation
Q4
5 pages
Quiz Data Mining : Techniques et Concepts
Pas encore d'évaluation
Quiz Data Mining : Techniques et Concepts
3 pages
Chap2 Pretraitement Donnees
100% (1)
Chap2 Pretraitement Donnees
31 pages
Preparation Des Donnees Nettoyage Organisation25
Pas encore d'évaluation
Preparation Des Donnees Nettoyage Organisation25
41 pages
3
Pas encore d'évaluation
3
44 pages
Activité 2
Pas encore d'évaluation
Activité 2
4 pages
TD2
Pas encore d'évaluation
TD2
8 pages
Devoir Surveillé: Merci de Répondre Sur La Feuille Des Réponses
Pas encore d'évaluation
Devoir Surveillé: Merci de Répondre Sur La Feuille Des Réponses
4 pages
Seance 1
Pas encore d'évaluation
Seance 1
26 pages
CHP 2 Data Transformation 2024 2025
Pas encore d'évaluation
CHP 2 Data Transformation 2024 2025
30 pages
Pretraitement Des Donnees
100% (1)
Pretraitement Des Donnees
27 pages
Q3
Pas encore d'évaluation
Q3
3 pages
Chap2 4 1
Pas encore d'évaluation
Chap2 4 1
53 pages
Encodage Et Normalisation Des Données
Pas encore d'évaluation
Encodage Et Normalisation Des Données
3 pages
Chapitre 2 Préparation Des Données
Pas encore d'évaluation
Chapitre 2 Préparation Des Données
39 pages
TD2 Traitement Des Valeurs Manquantes: Exercice 1
Pas encore d'évaluation
TD2 Traitement Des Valeurs Manquantes: Exercice 1
10 pages
Chapitre 2 Préparation Des Données
Pas encore d'évaluation
Chapitre 2 Préparation Des Données
49 pages
ML QCM
Pas encore d'évaluation
ML QCM
13 pages
Correction Micro-interrogation STIC
Pas encore d'évaluation
Correction Micro-interrogation STIC
1 page
4-Préparation Données
100% (1)
4-Préparation Données
55 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
11 pages
Préparation Des Données-Chapitre2
Pas encore d'évaluation
Préparation Des Données-Chapitre2
27 pages
Cour ML
Pas encore d'évaluation
Cour ML
107 pages
Apprentissage Supervisé 1-2
Pas encore d'évaluation
Apprentissage Supervisé 1-2
21 pages
QCM Kahoot IA
Pas encore d'évaluation
QCM Kahoot IA
13 pages
Introduction Au Machine Learning Séance #1
Pas encore d'évaluation
Introduction Au Machine Learning Séance #1
34 pages
QCM Analyse Exploratoire Donnees
Pas encore d'évaluation
QCM Analyse Exploratoire Donnees
2 pages
Corrigé Examen Data Mining 2019
Pas encore d'évaluation
Corrigé Examen Data Mining 2019
3 pages
Data Pre Processing Fin
Pas encore d'évaluation
Data Pre Processing Fin
7 pages
CH2 - Préparation Des Données
100% (1)
CH2 - Préparation Des Données
27 pages
Reduction de Dimension
Pas encore d'évaluation
Reduction de Dimension
16 pages
Analyse de Données IA avec Python
Pas encore d'évaluation
Analyse de Données IA avec Python
22 pages
QCM sur le Feature Engineering et Création de Variables
Pas encore d'évaluation
QCM sur le Feature Engineering et Création de Variables
1 page
Chapitre 2
Pas encore d'évaluation
Chapitre 2
16 pages
INF8111 - Exercices + Solutions
Pas encore d'évaluation
INF8111 - Exercices + Solutions
32 pages
Révision Application IA
Pas encore d'évaluation
Révision Application IA
20 pages
Cours3 PrétraitementDonnées
Pas encore d'évaluation
Cours3 PrétraitementDonnées
38 pages
Questions D'examen Sur L'exploration de Données
Pas encore d'évaluation
Questions D'examen Sur L'exploration de Données
25 pages
Discrétisation des Données Numériques
Pas encore d'évaluation
Discrétisation des Données Numériques
21 pages
Recto
Pas encore d'évaluation
Recto
2 pages
TPPré-traitement Des Donnée
Pas encore d'évaluation
TPPré-traitement Des Donnée
23 pages
CH2 - Préparation Des Données
Pas encore d'évaluation
CH2 - Préparation Des Données
27 pages
ACP Excel Xnumbers
Pas encore d'évaluation
ACP Excel Xnumbers
15 pages
Data Mining et Machine Learning
Pas encore d'évaluation
Data Mining et Machine Learning
34 pages
Classification Hiérarchique en Clustering
Pas encore d'évaluation
Classification Hiérarchique en Clustering
64 pages
Exemple IQ MOYENNE Ecarttype
Pas encore d'évaluation
Exemple IQ MOYENNE Ecarttype
18 pages
Prova ISD 2022-23
Pas encore d'évaluation
Prova ISD 2022-23
3 pages
Big Data
Pas encore d'évaluation
Big Data
14 pages
Machine Learning Preparation Des Donnéees
Pas encore d'évaluation
Machine Learning Preparation Des Donnéees
29 pages
Cour 2
Pas encore d'évaluation
Cour 2
3 pages
M1-DATA Mining - Exam M1-DATA Mining - Exam
Pas encore d'évaluation
M1-DATA Mining - Exam M1-DATA Mining - Exam
3 pages
Fiche1 TD TP DataMining 2024 2025
Pas encore d'évaluation
Fiche1 TD TP DataMining 2024 2025
2 pages
Cours ML
Pas encore d'évaluation
Cours ML
40 pages
Cours Compressed
Pas encore d'évaluation
Cours Compressed
23 pages
TD 3
Pas encore d'évaluation
TD 3
12 pages
Corrigé D'un Examen de Machine Learning S4 Génie MIS
100% (1)
Corrigé D'un Examen de Machine Learning S4 Génie MIS
25 pages
Examen ML: Classification et Préparation
Pas encore d'évaluation
Examen ML: Classification et Préparation
6 pages
Pieces de Rechange Arnaud Meunier
Pas encore d'évaluation
Pieces de Rechange Arnaud Meunier
6 pages
152 Pince Ericc3 Version2
Pas encore d'évaluation
152 Pince Ericc3 Version2
2 pages
Corrigé Du TD Sur Les Transformations de Laplace
Pas encore d'évaluation
Corrigé Du TD Sur Les Transformations de Laplace
5 pages
Examen Et corrigérattrapageSD2023 - 231109 - 073149
100% (1)
Examen Et corrigérattrapageSD2023 - 231109 - 073149
3 pages
Addition Et Soustraction Des Nombres de 0 À 999 999
100% (2)
Addition Et Soustraction Des Nombres de 0 À 999 999
3 pages
Application de La Theorie Des Jeux Dans L'organisation Industrielle
100% (1)
Application de La Theorie Des Jeux Dans L'organisation Industrielle
103 pages
Polynômes de Tchebychev expliqués
Pas encore d'évaluation
Polynômes de Tchebychev expliqués
11 pages
Devoirs N2.2bac PC
Pas encore d'évaluation
Devoirs N2.2bac PC
8 pages
Filtres du Second Ordre : Formes Canoniques
100% (1)
Filtres du Second Ordre : Formes Canoniques
4 pages
Enonce Test2 02
Pas encore d'évaluation
Enonce Test2 02
3 pages
Dynamique des systèmes avec frottement et forces
Pas encore d'évaluation
Dynamique des systèmes avec frottement et forces
13 pages
TP02 Introduction Au Langage Python - Corrections
Pas encore d'évaluation
TP02 Introduction Au Langage Python - Corrections
3 pages
Cours - 1 - Diapo - Introduction - Géostatistique
Pas encore d'évaluation
Cours - 1 - Diapo - Introduction - Géostatistique
59 pages
Astuce
Pas encore d'évaluation
Astuce
3 pages
Hydraulique urbaine et réseaux d'eau
Pas encore d'évaluation
Hydraulique urbaine et réseaux d'eau
25 pages
Mouvements Vibratoires et Périodicité
Pas encore d'évaluation
Mouvements Vibratoires et Périodicité
6 pages
Installation Des Cables
Pas encore d'évaluation
Installation Des Cables
15 pages
Encadrement de la constante d'Euler
Pas encore d'évaluation
Encadrement de la constante d'Euler
1 page
TD 5 TG Algorithme de Dijkstra
Pas encore d'évaluation
TD 5 TG Algorithme de Dijkstra
7 pages
Algèbre II : Exercices sur Endomorphismes et Diagonalisation
Pas encore d'évaluation
Algèbre II : Exercices sur Endomorphismes et Diagonalisation
4 pages
Cours Analyse Mathématique IUT MTIN
Pas encore d'évaluation
Cours Analyse Mathématique IUT MTIN
49 pages
Devoir Commun Mai 2015
Pas encore d'évaluation
Devoir Commun Mai 2015
2 pages
Calcul Compression Béton Armé
Pas encore d'évaluation
Calcul Compression Béton Armé
4 pages
Concours Miss Maths 2016 Niveau Tle C
Pas encore d'évaluation
Concours Miss Maths 2016 Niveau Tle C
3 pages
Echangeurs
100% (1)
Echangeurs
16 pages
Logarithme Exercice 7
Pas encore d'évaluation
Logarithme Exercice 7
3 pages
Matlab 1
100% (1)
Matlab 1
27 pages
Informatique
Pas encore d'évaluation
Informatique
232 pages
Notes de Cours - Les Solides - Chapitre 6
Pas encore d'évaluation
Notes de Cours - Les Solides - Chapitre 6
36 pages
Analyse des Correspondances Multiples ACM
Pas encore d'évaluation
Analyse des Correspondances Multiples ACM
31 pages