0% ont trouvé ce document utile (0 vote)

32 vues4 pages

Activité 2

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

32 vues4 pages

Activité 2

Transféré par

Mohamed Ouerghi

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Module : Machine Learning

Licence : RIOT3
Enseignante : Dr. Rym Besrour

Activité 2
« Exploration, Prétraitement et Transformation de Données»

1. Pourquoi est-il important de nettoyer les données avant de les utiliser pour l’entrainement d’un modèle en
ML ?
a. Les données propres conduisent toujours à des modèles plus précis.
b. Les données brutes peuvent contenir des erreurs, des valeurs aberrantes ou des lacunes qui peuvent
affecter négativement la performance du modèle.

2. Quelle bibliothèque Python est couramment utilisée pour le prétraitement des données en machine
learning ?
a. Pandas.
b. Matplotlib.
c. Numpy

3. Qu’est-ce que l’exploration des données (data exploration) en machine learning ?

a. Le processus de nettoyage des données pour enlever les valeurs aberrantes.
b. L’analyse et la visualisation des données pour en tirer des insights et comprendre leur nature.

4. Quel type de graphique est généralement utilisé pour représenter la distribution d’une variable continue ?
a. Histogramme.
b. Diagrammes à barres.
c. Nuages de points.

5. Qu’est-ce qu’un diagramme en boite (box plot) ?

a. Un graphique qui affiche la fréquence de chaque valeur unique dans un ensemble de données.
b. Un graphique qui représente la distribution de données numériques à l’aide de quartiles.

6. Comment peut-on normaliser les données dans une colonne spécifique d’un DataFrame en utilisant Scikit-
learn ?
a. from sklearn.preprocessing import normalize puis normalize(df[‘colonne’])
b. from sklearn.preprocessing import StandardScaler puis
StandardScaler ().fit_transform(df[[‘colonne’]])
c. from sklearn.preprocessing import MinMaxScaler puis
MinMaxScaler ().fit_transform(df[[‘colonne’]])

7. Quelle est la signification d’une corrélation positive entre deux variables ?

a. Les variables évoluent dans la même direction.
b. Les variables évoluent dans des directions opposées.
Module : Machine Learning
Licence : RIOT3
Enseignante : Dr. Rym Besrour

8. Que représente la matrice de corrélation entre plusieurs variables ?

a. Une table qui montre la corrélation entre chaque paire de variables.
b. Une table qui résume la distribution des données.

9. Qu’est-ce qu’une variable catégorielle en exploration de données ?

a. Une variable qui représente des catégories ou des groupes distincts.
b. Une variable numérique.

10. Quelle est la fonction principale des diagrammes de dispersion (scatter plots) ?
a. Représenter la relation entre deux variables continues.
b. Montrer la distribution d’une variable catégorielle.

11. Comment peut-on calculer la corrélation positive entre deux variables ?

a. En utilisant le coefficient de corrélation de Pearson.
b. En calculant la différence entre les moyennes des deux variables.

12. Quelle méthode peut etre utilisée pour gérer les valeurs aberrantes lors de l’exploration des données ?
a. Ignorer complètement les valeurs aberrantes car elles n’ont pas d’impact significatif.
b. Les identifier et décider de les supprimer ou de les traiter selon le cas.

13. Quel outil Python populaire est souvent utilisé pour l’exploration et la visualisation des données en
machine learning ?
a. Matplotlib
b. Scikit-learn
c. TensorFlow

14. Quelle méthode de Pandas peut être utilisée pour compter le nombre de valeurs uniques dans une colle
d’un DataFrame ?
a. nunique()
b. unique()
c. count_unique()

15. Qu’est-ce qu’une valeur aberrante ‘outlier’ dans un jeu de données ?

a. Une donne qui est située très loin de la moyenne des autres données.
b. Une donnée manquante.

16. Comment peut-on générer un histogramme pour visualiser la distribution d’une variable en utilisant
Matplotlib ?
a. plt.bar()
b. plt.plot()
c. plt.hist()

17. Comment peut-on traiter les valeurs aberrantes dans un jeu de données ?
a. En les supprimant.
b. En les remplaçant par une valeur basée sur la médiane ou la moyenne du reste des données.
Module : Machine Learning
Licence : RIOT3
Enseignante : Dr. Rym Besrour
18. Que sont les données manquantes (missing value) ?
a. Des données qui sont perdues pendant le processus de collecte.
b. Des données qui ne sont pas pertinentes pour l’analyse.

19. Quelles sont certaines des méthodes pour gérer les données manquantes ?
a. Supprimer les lignes avec des données manquantes.
b. Imputer les valeurs manquantes en utilisant des techniques comme la moyenne, la médiane ou le
mode.

20. Quelle méthode de Pandas peut être utilisée pour vérifier s’il y a des valeurs manquantes dans un
DataFrame ?
a. isna()
b. missing_values()
c. null_values()

21. Qu’est-ce qu’une variable catégorielle dans un jeu de données ?

a. Une variable qui représente des catégories ou des groupes, souvent sous forme de texte.
b. Une variable numérique.

22. Qu’est-ce que la normalisation des données ?

a. Le processus de convertir les variables catégorielles en variables numériques.
b. Le processus de mettre toutes les variables sur la même échelle.

23. Comment peut-on lire un fichier CSV dans Python en utilisant la bibliothèque Pandas ?
a. pd.load_csv(« nom_fichier.csv »)
b. pd.read_csv(« nom_fichier.csv »)
c. pd.open_csv(« nom_fichier.csv »)

24. Comment peut-on remplacer les valeurs manquantes dans un DataFrame avec la valeur moyenne de la
colonne en utilisant Pandas ?
a. df.fillna(df.mean(), inplace=True)
b. df.replace_missinf(df.mean())
c. df.fill_missing(df.mean())

25. Quelle méthode de Pandas peut être utilisée pour supprimer les lignes contenant des valeurs manquantes
dans un DataFrame ?
a. remove_missing()
b. delete_null()
c. dropna()

26. Quelle méthode de Pandas peut être utilisée pour effectuer un encodage one-hot sur une colonne
catégorielle ?
a. encode_one_hot()
b. pd.get_dummies()
c. categorical_encode()
Module : Machine Learning
Licence : RIOT3
Enseignante : Dr. Rym Besrour

27. Comment peut-on diviser un ensemble de données en ensembles d’entrainement et de test en utilisant
Scikit-learn ?
a. ‘from sklearn.split import train_test’ puis ‘X_train, X_test, y_train, y_test = train_test_split(X, y, 0.2)’
b. ‘from sklearn.data import split_data’ puis ‘X_train, X_test, y_train, y_test = split_data(X, y, 0.2)’
c. ‘from sklearn.model_selection import train_test_split’ puis ‘X_train, X_test, y_train, y_test =
train_test_split(X, y, test_size=0.2)’

28. Comment peut-on afficher les premières lignes d’un DataFrame en utilisant la bibliothèque Pandas ?
a. df.first()
b. df.show()
c. df.head()

29. Quelle méthode de Pandas peut être utilisée pour obtenir des statistiques descriptives pour un
DataFrame ?
a. describe()
b. stats()
c. summary()

30. Quel type de graphique peut être utilisé pour visualiser la relation entre deux variables continues en
utilisant Matplotlib ?
a. Scatter plot
b. Bar plot
c. Line plot

31. Comment peut-on créer une boite à moustaches (box plot) pour visualiser la distribution d’une variable en
utilisant Matplotlib ?
a. plt.plot()
b. plt.boxplot()
c. plt.bar()

32. Comment peut-on créer une matrice de corrélation pour examiner les relations entre plusieurs variables
en utilisant Pandas ?
a. df.correlation()
b. df.correlation_matrix()
c. df.corr()

33. Quel outil Python est souvent utilisé pour créer des visualisations interactives et dynamiques ?
a. Plotly
b. Seaborn
c. Matplotlib

34. Quelle méthode de Pandas peut être utilisée pour remplacer des valeurs spécifiques dans un DataFrame ?
a. fill()
b. replace()
c. substitute()

Vous aimerez peut-être aussi

TD2
Pas encore d'évaluation
TD2
8 pages
QCM Ia
Pas encore d'évaluation
QCM Ia
9 pages
TD1 Data Cleaning
Pas encore d'évaluation
TD1 Data Cleaning
3 pages
Module: Analyse Et Fouille de Données
Pas encore d'évaluation
Module: Analyse Et Fouille de Données
3 pages
Paragraph
Pas encore d'évaluation
Paragraph
135 pages
Examen Data Science 01
100% (3)
Examen Data Science 01
11 pages
QCM Kahoot IA
Pas encore d'évaluation
QCM Kahoot IA
13 pages
Python: Packages pour la Statistique
Pas encore d'évaluation
Python: Packages pour la Statistique
151 pages
Importation et manipulation avec NumPy
Pas encore d'évaluation
Importation et manipulation avec NumPy
3 pages
Quiz Summary
Pas encore d'évaluation
Quiz Summary
2 pages
QCM 60 Hypotheses Analyse Commandes
Pas encore d'évaluation
QCM 60 Hypotheses Analyse Commandes
4 pages
TP2 - Python
Pas encore d'évaluation
TP2 - Python
4 pages
TP 5 Py Av
Pas encore d'évaluation
TP 5 Py Av
9 pages
Q2
Pas encore d'évaluation
Q2
6 pages
Chapitre 6 Data Analysis-5
Pas encore d'évaluation
Chapitre 6 Data Analysis-5
78 pages
Fonctions Principales de NumPy, Pandas, Plotly - Test
Pas encore d'évaluation
Fonctions Principales de NumPy, Pandas, Plotly - Test
5 pages
Optimisation Du Code Python 4
Pas encore d'évaluation
Optimisation Du Code Python 4
29 pages
Exercices
Pas encore d'évaluation
Exercices
10 pages
TP 1 - Manipulation, Visualisation & Prétraitement Des Données
Pas encore d'évaluation
TP 1 - Manipulation, Visualisation & Prétraitement Des Données
2 pages
Résumé CS KacemLachkar
Pas encore d'évaluation
Résumé CS KacemLachkar
14 pages
Science des Données avec Python
Pas encore d'évaluation
Science des Données avec Python
39 pages
tp2 ML
Pas encore d'évaluation
tp2 ML
7 pages
DS3 2eco
Pas encore d'évaluation
DS3 2eco
3 pages
Chapitre 3 - Pandas+visualisation
Pas encore d'évaluation
Chapitre 3 - Pandas+visualisation
40 pages
MLenPython - PPT Compatibility Mode
Pas encore d'évaluation
MLenPython - PPT Compatibility Mode
20 pages
Data Science
Pas encore d'évaluation
Data Science
10 pages
Pre Traitement Donnees 24 Handout
Pas encore d'évaluation
Pre Traitement Donnees 24 Handout
103 pages
TD4 - MLPreparation Des Données
Pas encore d'évaluation
TD4 - MLPreparation Des Données
5 pages
TP Machine Learning: NumPy, Pandas, Matplotlib
Pas encore d'évaluation
TP Machine Learning: NumPy, Pandas, Matplotlib
10 pages
Cours Prog Sci
Pas encore d'évaluation
Cours Prog Sci
14 pages
Fonctions Clés de Pandas en Python
100% (1)
Fonctions Clés de Pandas en Python
44 pages
Py Data Analysis
Pas encore d'évaluation
Py Data Analysis
44 pages
Formation Python Pour La Data Science - 3 - Introduction À Numpy
Pas encore d'évaluation
Formation Python Pour La Data Science - 3 - Introduction À Numpy
43 pages
Analyse de Donnees
Pas encore d'évaluation
Analyse de Donnees
27 pages
Introduction à Numpy et Pandas en Python
Pas encore d'évaluation
Introduction à Numpy et Pandas en Python
45 pages
QCM 40 Hypotheses Commandes Analyse
Pas encore d'évaluation
QCM 40 Hypotheses Commandes Analyse
5 pages
TP Pandas: Manipulation et Analyse de Données
Pas encore d'évaluation
TP Pandas: Manipulation et Analyse de Données
4 pages
Les Fonctionnalités Essentielles 2
Pas encore d'évaluation
Les Fonctionnalités Essentielles 2
5 pages
CH 3
Pas encore d'évaluation
CH 3
44 pages
Analyse de Données IA avec Python
Pas encore d'évaluation
Analyse de Données IA avec Python
22 pages
Exercices Data Science Complet
Pas encore d'évaluation
Exercices Data Science Complet
2 pages
Support TP DataPreprocessing
100% (1)
Support TP DataPreprocessing
2 pages
Programmer en Python Pour La DS
Pas encore d'évaluation
Programmer en Python Pour La DS
57 pages
EF ML TekUP 22-23
100% (1)
EF ML TekUP 22-23
4 pages
Analyse Statistique des Données Pokémon
Pas encore d'évaluation
Analyse Statistique des Données Pokémon
29 pages
Rapport ML (1) COLETTE
Pas encore d'évaluation
Rapport ML (1) COLETTE
19 pages
Nettoyage et Transformation des Données
100% (1)
Nettoyage et Transformation des Données
14 pages
TD de Révision ML Ver Etudiant
100% (1)
TD de Révision ML Ver Etudiant
11 pages
CH 2
Pas encore d'évaluation
CH 2
22 pages
Fiche
Pas encore d'évaluation
Fiche
4 pages
Statistiques Descriptives TP1
Pas encore d'évaluation
Statistiques Descriptives TP1
5 pages
Atelier Graphiques pour Étudiants RT
Pas encore d'évaluation
Atelier Graphiques pour Étudiants RT
6 pages
Manipulation de listes et matrices en Python
Pas encore d'évaluation
Manipulation de listes et matrices en Python
7 pages
TP - Visualisation Des Données - Maîtrise de Matplotlib
Pas encore d'évaluation
TP - Visualisation Des Données - Maîtrise de Matplotlib
6 pages
Python Avancé pour Data Science
Pas encore d'évaluation
Python Avancé pour Data Science
13 pages
EF ML TekUP 22-23
Pas encore d'évaluation
EF ML TekUP 22-23
7 pages
Exercice 1
Pas encore d'évaluation
Exercice 1
4 pages
Cryptographie et Sécurité Réseau
Pas encore d'évaluation
Cryptographie et Sécurité Réseau
97 pages
Questions Reponses Soutenance PFE
Pas encore d'évaluation
Questions Reponses Soutenance PFE
2 pages
Devoir de Contrôle N°1 - Physique - Bac Math (2010-2011) MR Raouf
Pas encore d'évaluation
Devoir de Contrôle N°1 - Physique - Bac Math (2010-2011) MR Raouf
5 pages
Exercice de chimie et physique : contrôle 4ème
100% (1)
Exercice de chimie et physique : contrôle 4ème
5 pages
DS QCM-Analyse1 20-21 PDF
Pas encore d'évaluation
DS QCM-Analyse1 20-21 PDF
3 pages
DS QCM-Analyse1 20-21 PDF
Pas encore d'évaluation
DS QCM-Analyse1 20-21 PDF
3 pages
S - Vanne - Types
Pas encore d'évaluation
S - Vanne - Types
21 pages
cc1 Programmation Corrige
Pas encore d'évaluation
cc1 Programmation Corrige
3 pages
Gestion de La Relation Client Et Marketing Direct 1
Pas encore d'évaluation
Gestion de La Relation Client Et Marketing Direct 1
8 pages
Traité D'hypnotisme Expérimental Et de (... ) Joire Paul Bpt6k880465r
Pas encore d'évaluation
Traité D'hypnotisme Expérimental Et de (... ) Joire Paul Bpt6k880465r
590 pages
SDR à Conversion Directe : Fonctionnement et Évaluation
Pas encore d'évaluation
SDR à Conversion Directe : Fonctionnement et Évaluation
83 pages
Chapitre 4
Pas encore d'évaluation
Chapitre 4
11 pages
Devoir1 Algorithme 2021
Pas encore d'évaluation
Devoir1 Algorithme 2021
1 page
ELEC84 Citelis
Pas encore d'évaluation
ELEC84 Citelis
66 pages
TP 1
Pas encore d'évaluation
TP 1
2 pages
Controle1 Corrige
Pas encore d'évaluation
Controle1 Corrige
3 pages
Mid 039 - Cid 0017 - Fmi 05 (Kenr5924-14) Sis2.0
Pas encore d'évaluation
Mid 039 - Cid 0017 - Fmi 05 (Kenr5924-14) Sis2.0
4 pages
Innovation et Créativité Entrepreneuriale
Pas encore d'évaluation
Innovation et Créativité Entrepreneuriale
31 pages
Rapport de Stage Projet Web 3
Pas encore d'évaluation
Rapport de Stage Projet Web 3
17 pages
Exercice Ou Activités Sur Les Systèmes D'équations
Pas encore d'évaluation
Exercice Ou Activités Sur Les Systèmes D'équations
5 pages
Memoire Satisfaction Des Clients Cas Des
Pas encore d'évaluation
Memoire Satisfaction Des Clients Cas Des
77 pages
Recherche CDI en Service Client et Finance
Pas encore d'évaluation
Recherche CDI en Service Client et Finance
1 page
Moteur Profalux Radio
Pas encore d'évaluation
Moteur Profalux Radio
2 pages
Techniques d'Extinction des Incendies
Pas encore d'évaluation
Techniques d'Extinction des Incendies
28 pages
Composition 2 1am 2020
100% (2)
Composition 2 1am 2020
2 pages
5.procedure Agrementfournisseurs
Pas encore d'évaluation
5.procedure Agrementfournisseurs
10 pages
Les Théories de La Communication
Pas encore d'évaluation
Les Théories de La Communication
21 pages
POO pour BTS SNIR : Concepts Clés
Pas encore d'évaluation
POO pour BTS SNIR : Concepts Clés
17 pages
Exemples de SMS de bonne nuit romantiques
Pas encore d'évaluation
Exemples de SMS de bonne nuit romantiques
1 page
PROMO7 L1SEM.1 - VF CALENDRIER Réaménagé À Nouveau Des Examens Du Sem.1
Pas encore d'évaluation
PROMO7 L1SEM.1 - VF CALENDRIER Réaménagé À Nouveau Des Examens Du Sem.1
3 pages
Mini-Projet - Dispositif Pour Robinet À Poussoir
Pas encore d'évaluation
Mini-Projet - Dispositif Pour Robinet À Poussoir
7 pages
Données BFC - BPE
Pas encore d'évaluation
Données BFC - BPE
3 pages
Dixell Espagne XR75CX SP r1 0 27 02 2009
Pas encore d'évaluation
Dixell Espagne XR75CX SP r1 0 27 02 2009
6 pages
Serge Tisseron Ado Et Ecrans
Pas encore d'évaluation
Serge Tisseron Ado Et Ecrans
2 pages
Unite de Papier Essuie Tout 1
Pas encore d'évaluation
Unite de Papier Essuie Tout 1
2 pages
Comment Faire Une Étude de Faisabilité en Gestion de Projet
Pas encore d'évaluation
Comment Faire Une Étude de Faisabilité en Gestion de Projet
2 pages