0% ont trouvé ce document utile (0 vote)
96 vues3 pages

Quiz Data Mining : Techniques et Concepts

Ce document contient des questions et réponses sur des techniques de traitement de données telles que la normalisation, la détection d'outliers, l'encodage de variables catégorielles et l'apprentissage automatique.

Transféré par

Ons Hadrich
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Thèmes abordés

  • données de traitement de signa…,
  • données structurées,
  • problèmes de régression,
  • méthodes de normalisation,
  • données de traitement de donné…,
  • OneHotEncoder,
  • régression,
  • données de validation,
  • données de simulation,
  • données de visualisation
0% ont trouvé ce document utile (0 vote)
96 vues3 pages

Quiz Data Mining : Techniques et Concepts

Ce document contient des questions et réponses sur des techniques de traitement de données telles que la normalisation, la détection d'outliers, l'encodage de variables catégorielles et l'apprentissage automatique.

Transféré par

Ons Hadrich
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Thèmes abordés

  • données de traitement de signa…,
  • données structurées,
  • problèmes de régression,
  • méthodes de normalisation,
  • données de traitement de donné…,
  • OneHotEncoder,
  • régression,
  • données de validation,
  • données de simulation,
  • données de visualisation

QUIZ DataMining

. Quelle technique de normalisation est généralement recommandée dans le cas d'une distribution de
données asymétrique?

 Min Max Scaler ✔

 RobustScaler

 StandardScaler

 Equal-Frequency method

. Dans quelle situation RobustScaler est-elle préférable ?

 Lorsqu'il y a des valeurs aberrantes dans les données ✔

 Lorsque la distribution des données est normale

 Lorsque la distribution est symétrique

 Lorsque les données sont déjà normalisées

. Comment pouvez-vous déterminer un seuil pour la détection des outliers à partir d'un KDE?

 En utilisant la moyenne de la distribution

 En se basant sur la plage interquartile

 En observant les zones de densité de probabilité plus faible ✔

 En identifiant les modes de la distribution

. Comment fonctionne OneHotEncoder pour encoder des variables catégorielles?

 En remplaçant chaque catégorie par une valeur numérique


 En créant une nouvelle colonne binaire pour chaque catégorie ✔
 En réduisant la dimension des données
 En supprimant les valeurs aberrantes

. What is OrdinalEncoder?

 Une méthode pour normaliser les données

 Un algorithme de clustering

 Une transformation des variables catégorielles en données ordinals ✔

 Une technique pour encoder des variables catégorielles en binaires


. Comment applique-t-on pd.get_dummies() sur la colonne ‘B’ du dataframe df ?

 Pd.get_dummies(df[‘B’])
 pd.get_dummies(df, columns=['B']) ✔
 OneHotEncoder.fit_transform(df[['B']])
 [Link] (df[['B']])

. OrdinalEncoder est approprié pour les variables catégoriques quiont une relation d’ordre Claire et
significative:

 Vrai ✔
 Faux

. Ia transformation de données consiste à:

 Normaliser les donnés

. La famille de données data mining consiste a :

 transformer les donnes en Connaissances

. Quel type de données est souvent utilise das le Data Mining? Données Structurées

 Données Structurées

. La découverte de régle d'association fait partie de :

 DM descriptif

. L’estimation de prix d’une nouvelle maison a construire est un problème de

 Regression

. Comment fonctionne OneHotEncoder pour encoder des variables catégorielles

 En créant une nouvelle colonne binaire pour chaque catégorie.

. Qu’est-ce que ordinalEncoder ?

 Une transformation des variables catégorielle en données ordinales

.OrdinalEncoder est approprié pour des variables catégorique qu’ont une relative d’ordre claire et
significative

 Vrai

. L'apprentissage supervise consiste principalement a :

 extrapoler un savoir a partir des donne historiques


. La data mining est un sous ensemble:

 ML
 IA
 Deep learning
 Aucun reponse n'est correcte ✔

. L'etape de preparation de donnes consiste a :

 Decouvrir des regularite dans les donnes

. La variable en entier ayant les valeur Bien,tres bien Execellent est de type:

 ordinale

Vous aimerez peut-être aussi