0% ont trouvé ce document utile (0 vote)

98 vues2 pages

Travaux Pratiques N°1 #

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

98 vues2 pages

Travaux Pratiques N°1 #

Transféré par

Rayen BEN AOUN

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Université Nord-Américaine privée

Institut International de Technologie

Département Informatique

Travaux pratiques n°1 #numpy/ pandas/matplotlib & seaborn

Matière : Fouille de données Enseignants: Taoufik Ben Abdallah
Discipline : 2ème année Génie Informatique Tarek Ben Said
Année Universitaire : 2024-2025 / S1

L’objectif de ce TP est de revoir les prérequis essentiels pour introduire les concepts de data mining
et de machine learning, en mettant l’accent sur l’utilisation des bibliothèques numpy, pandas,
matplotlib et seaborn. Au cours de ce TP, vous explorerez, traiterez et visualiserez les données
d’un jeu de données contenant des informations sur 213 athlètes, disponible dans le fichier
"athlete.csv". Chaque athlète est décrit par les attributs suivants : Gender, Age, Height/Weight
et Sport. Le sexe peut être soit "M" pour Homme, soit "F" pour Femme, et le sport peut être
"Athlétisme", "Gymnastique", "Football", "Basketball" ou "Judo". L’attribut Age peut
contenir des valeurs indéfinies, marquées par « X ».
Le Tableau 1 montre un extrait du jeu de données présent dans le fichier "athlete.csv"
Gender Age Height/ Weight Sport
0 M 24 180.0/80.0 Basketball
1 M 23 170.0/60.0 Judo
2 M 28 175.0/64.0 Gymnastics
3 M 28 175.0/64.0 Gymnastics
4 M X 175.0/64.0 Basket
... ... ... ... ...
Tableau 1 : Extrait du jeu de données athlete.csv

Travail à Faire :
1/ Charger le jeu de données "athlete.csv" dans un DataFrame nommé 𝐝𝐝𝐝𝐝_𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚, puis afficher
sa taille et les types de données de chaque attribut
2/ Diviser les valeurs de la colonne Height/Weight dans 𝐝𝐝𝐝𝐝_𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚 en deux colonnes distinctes en
utilisant le caractère "/" comme séparateur. Ajouter ensuite ces deux nouvelles colonnes, nommées
Height et Weight, à 𝐝𝐝𝐝𝐝_𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚 en les plaçant en deuxième et troisième position (NB. Ces
colonnes remplaceront la colonne Height/Weight existante)
3/ Remplacer les valeurs «Basket» par «Basketball» dans la colonne Sport de d𝐟𝐟_𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚.
Afficher les 5 premières lignes de d𝐟𝐟_𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚
4/ Renommer la colonne "Gender" en "Sex" dans d𝐟𝐟_𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚. Afficher les 3 dernières lignes de
d𝐟𝐟_𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚
5/ Afficher le sport le plus fréquemment pratiqué pour chaque sexe (M et F). Utiliser crosstab de pandas
6/ Créer une série, nommé 𝐒𝐒_𝐇𝐇𝐇𝐇, en utilisant les valeurs de hauteur (Height) et de poids (Weight)
selon la formule suivante : Height-Weight-100. Ensuite, ajouter une colonne nommée "State"
en dernière position dans 𝐝𝐝𝐝𝐝_𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚. Cette colonne doit contenir 3 valeurs discrètes : «perfect»
si la valeur correspondante dans 𝐒𝐒_𝐇𝐇𝐇𝐇 est comprise entre 0 et 10 inclus, «Excessive» si la valeur
est supérieure à 10, et «Insufficiency» si la valeur est inférieure à 0

1/2
Travaux pratiques n°1 2024-2025

7/ Créer une figure de dimensions 3×11 pouces comprenant deux axes alignés horizontalement. Le
premier axe, intitulé «HIST», doit afficher un histogramme montrant la répartition des athlètes selon
leur sport. Le deuxième axe, intitulé «PIE», doit afficher un diagramme en secteurs illustrant la
distribution des athlètes en fonction de leur état (State).
8/ Remplacer les valeurs « X » dans la colonne Age par la moyenne des âges des athlètes ayant le même
sexe et le même sport que l’athlète concerné. Convertir la colonne Age de 𝐝𝐝𝐝𝐝_𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚 en type entier.
Afficher ensuite d𝐟𝐟_𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚
9/ Trier les observations de 𝐝𝐝𝐝𝐝_𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚 par ordre décroissant selon la colonne Age et réinitialiser les
indices des lignes
10/ Écrire une fonction tracer_courbe(age=16) qui prend un paramètre age (par défaut age=16)
et retourne un graphique montrant le poids maximum des athlètes en fonction de leur âge à partir de
d𝐟𝐟_𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚. La fonction doit également marquer la valeur du poids maximum des athlètes pour
l’âge spécifié (si cet âge existe dans les données). Tester cette fonction
11/ Tracer un histogramme montrant la distribution des athlètes en fonction de 4 intervalles d’âge.
Indiquer les valeurs des intervalles sur les axes des x (xticks) du graphique
12/ Supprimer les athlètes dont l’âge appartient à l’intervalle d’âge ayant le moins d’occurrences
13/ Tracer le nuage de points (scatter) de Height en fonction de Weight ainsi que de Height en
fonction d’Age. Ajouter une légende à la figure et supprimer les titres des axis
14/ Transformer les colonnes Height et Weight de 𝐝𝐝𝐝𝐝_𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚𝐚 en deux tableaux (ndarray): le premier,
un tableau 1D nommé 𝐗𝐗, pour la colonne Height, et le second, un tableau 2D nommé 𝐘𝐘, pour la
colonne Weight

Bon Travail

2/2

Vous aimerez peut-être aussi

Devoir de Contrôle N3 4éco3
Pas encore d'évaluation
Devoir de Contrôle N3 4éco3
3 pages
Introduction au langage R pour débutants
Pas encore d'évaluation
Introduction au langage R pour débutants
2 pages
DC 34 Eco 22024 G 2
Pas encore d'évaluation
DC 34 Eco 22024 G 2
2 pages
1477 Inf2 Other Final p2022
Pas encore d'évaluation
1477 Inf2 Other Final p2022
7 pages
TP23
Pas encore d'évaluation
TP23
3 pages
Suivi Antidopage Oracle: Activité 2.2
Pas encore d'évaluation
Suivi Antidopage Oracle: Activité 2.2
2 pages
Analyse de données avec R et ACP
Pas encore d'évaluation
Analyse de données avec R et ACP
2 pages
TD 2 Table
Pas encore d'évaluation
TD 2 Table
3 pages
Notebook Chapitre 5 Pandas Avec Commentaires
Pas encore d'évaluation
Notebook Chapitre 5 Pandas Avec Commentaires
50 pages
TP Python : Manipulation de Données en Statistiques Exploratoires
Pas encore d'évaluation
TP Python : Manipulation de Données en Statistiques Exploratoires
3 pages
Compte Rendu Du TP
Pas encore d'évaluation
Compte Rendu Du TP
20 pages
Bac-Blancecogestion 2022 F
Pas encore d'évaluation
Bac-Blancecogestion 2022 F
5 pages
TP 2 Correction
Pas encore d'évaluation
TP 2 Correction
4 pages
TD/TP Machine Learning en Python
Pas encore d'évaluation
TD/TP Machine Learning en Python
1 page
Final P23
Pas encore d'évaluation
Final P23
2 pages
IFRI LangagePython TP3
Pas encore d'évaluation
IFRI LangagePython TP3
4 pages
TP2 - Python
Pas encore d'évaluation
TP2 - Python
4 pages
Ilovepdf Merged
Pas encore d'évaluation
Ilovepdf Merged
99 pages
CH 10 Les Tests Statistiques Exemple
Pas encore d'évaluation
CH 10 Les Tests Statistiques Exemple
7 pages
Préparation et Transformation de Données pour Analyses Statistiques
100% (1)
Préparation et Transformation de Données pour Analyses Statistiques
2 pages
Formula1 BD 2023
Pas encore d'évaluation
Formula1 BD 2023
5 pages
Serie N2
Pas encore d'évaluation
Serie N2
2 pages
Version Finale TD
Pas encore d'évaluation
Version Finale TD
20 pages
Examens Info2 MIPC S3
Pas encore d'évaluation
Examens Info2 MIPC S3
17 pages
TP 2
Pas encore d'évaluation
TP 2
2 pages
22 23 4eco C3
Pas encore d'évaluation
22 23 4eco C3
2 pages
ACP Sous Python Avec Scientisttools
Pas encore d'évaluation
ACP Sous Python Avec Scientisttools
22 pages
Algorithmique Et Programmation Python: Exercice 01: Gestion D'une Liste de Courses
Pas encore d'évaluation
Algorithmique Et Programmation Python: Exercice 01: Gestion D'une Liste de Courses
2 pages
Travaux Pratiques N°2: Exploration Des Données Avec Pandas Visualisation Graphique Avec Mathplotlib Et Seaborn
Pas encore d'évaluation
Travaux Pratiques N°2: Exploration Des Données Avec Pandas Visualisation Graphique Avec Mathplotlib Et Seaborn
2 pages
Bac Pratique 24052023 Eco 11h
Pas encore d'évaluation
Bac Pratique 24052023 Eco 11h
3 pages
Fiche de TP3 - Correction
Pas encore d'évaluation
Fiche de TP3 - Correction
6 pages
Autres Exemples Matplotlib
Pas encore d'évaluation
Autres Exemples Matplotlib
5 pages
Fiche TP4
Pas encore d'évaluation
Fiche TP4
4 pages
TD 2
Pas encore d'évaluation
TD 2
7 pages
Rev2 dc1
Pas encore d'évaluation
Rev2 dc1
2 pages
Exercices
Pas encore d'évaluation
Exercices
10 pages
PDF tp1 Bases de Donnees Enonce
Pas encore d'évaluation
PDF tp1 Bases de Donnees Enonce
4 pages
SujetTP1 2024
Pas encore d'évaluation
SujetTP1 2024
8 pages
Pré-traitement des données d'attaques de requins
Pas encore d'évaluation
Pré-traitement des données d'attaques de requins
29 pages
TP 5 Py Av
Pas encore d'évaluation
TP 5 Py Av
9 pages
TPinit R
Pas encore d'évaluation
TPinit R
4 pages
Concours Blanc-Corrigé.
Pas encore d'évaluation
Concours Blanc-Corrigé.
5 pages
Recherche V
Pas encore d'évaluation
Recherche V
5 pages
Statistiques Basket et Excel 2016-2017
Pas encore d'évaluation
Statistiques Basket et Excel 2016-2017
3 pages
Correction SN Inf371
Pas encore d'évaluation
Correction SN Inf371
2 pages
TD Les Dictionnaires Listes
Pas encore d'évaluation
TD Les Dictionnaires Listes
2 pages
Cours Accéléré Python Pandas Numpy
Pas encore d'évaluation
Cours Accéléré Python Pandas Numpy
2 pages
Correction D'exercices
Pas encore d'évaluation
Correction D'exercices
7 pages
Text
Pas encore d'évaluation
Text
3 pages
Mini Projet ADD R
Pas encore d'évaluation
Mini Projet ADD R
3 pages
TP 4 Analyse Exploratoire de Données AED
Pas encore d'évaluation
TP 4 Analyse Exploratoire de Données AED
5 pages
Cours Datamining P2
Pas encore d'évaluation
Cours Datamining P2
26 pages
Home Work
Pas encore d'évaluation
Home Work
5 pages
Serie - Statis - Sans Sol
Pas encore d'évaluation
Serie - Statis - Sans Sol
4 pages
Module: Analyse Et Fouille de Données
Pas encore d'évaluation
Module: Analyse Et Fouille de Données
3 pages
TP 2
Pas encore d'évaluation
TP 2
2 pages
Analyse Statistique des Données Pokémon
Pas encore d'évaluation
Analyse Statistique des Données Pokémon
29 pages
Projet 3 IA vs2
Pas encore d'évaluation
Projet 3 IA vs2
5 pages
TP Machine Learning: NumPy, Pandas, Matplotlib
Pas encore d'évaluation
TP Machine Learning: NumPy, Pandas, Matplotlib
10 pages
1xbet CM
Pas encore d'évaluation
1xbet CM
2 pages
Parachute de France Atom Tandem Manual
Pas encore d'évaluation
Parachute de France Atom Tandem Manual
64 pages
Grade 6 Answer Key
Pas encore d'évaluation
Grade 6 Answer Key
2 pages
Oukaimeden Station DE Sports D'Hiver: Bulletin Économique Et Social Du Maroc
Pas encore d'évaluation
Oukaimeden Station DE Sports D'Hiver: Bulletin Économique Et Social Du Maroc
8 pages
Free Tambola Tickets
Pas encore d'évaluation
Free Tambola Tickets
2 pages
MARCHA REGULAR - Tristeza Andina (MARCHA CHOLA)
Pas encore d'évaluation
MARCHA REGULAR - Tristeza Andina (MARCHA CHOLA)
17 pages
03 Clarinet
Pas encore d'évaluation
03 Clarinet
1 page
Developpement Corrige Serie D Exercices 1
Pas encore d'évaluation
Developpement Corrige Serie D Exercices 1
4 pages
Évaluation Gymnastique: Roulades et Sauts
Pas encore d'évaluation
Évaluation Gymnastique: Roulades et Sauts
7 pages
Projet Sportif du Canon de Yaoundé
100% (1)
Projet Sportif du Canon de Yaoundé
10 pages
GR - V French Term2 Set2 MS
Pas encore d'évaluation
GR - V French Term2 Set2 MS
2 pages
Ave Maria para Guitarra Completa.
Pas encore d'évaluation
Ave Maria para Guitarra Completa.
3 pages
Comprendre les tournois d'échecs
Pas encore d'évaluation
Comprendre les tournois d'échecs
11 pages
CE2 Corrige 37
Pas encore d'évaluation
CE2 Corrige 37
1 page
Grand Oral Math
100% (1)
Grand Oral Math
5 pages
Caractéristiques du calmar géant
Pas encore d'évaluation
Caractéristiques du calmar géant
1 page
? Otc
Pas encore d'évaluation
? Otc
10 pages
Tarif A3-3P SB-BERLINE Tarif 08 2055
Pas encore d'évaluation
Tarif A3-3P SB-BERLINE Tarif 08 2055
48 pages
6562811d2f3bb75b0b3b9a7b Xofivuxodirulerulaxugaber
Pas encore d'évaluation
6562811d2f3bb75b0b3b9a7b Xofivuxodirulerulaxugaber
3 pages
Abidjan Padel Tour 16 Décembre
Pas encore d'évaluation
Abidjan Padel Tour 16 Décembre
5 pages
Fiche43 Allez Les Petit
Pas encore d'évaluation
Fiche43 Allez Les Petit
2 pages
Maillot Miami Bleu - Recherche Google
Pas encore d'évaluation
Maillot Miami Bleu - Recherche Google
1 page
Janvier2021 LeJournalNumériqueN17
100% (2)
Janvier2021 LeJournalNumériqueN17
8 pages
Ferrari Cranes 712
Pas encore d'évaluation
Ferrari Cranes 712
2 pages
JH Pmub Du 22-07-2023
Pas encore d'évaluation
JH Pmub Du 22-07-2023
2 pages
Echauffement en Maternelle Pour siteDSDEN
Pas encore d'évaluation
Echauffement en Maternelle Pour siteDSDEN
8 pages
La Langue Des Sports Parlez Vous Ski
Pas encore d'évaluation
La Langue Des Sports Parlez Vous Ski
2 pages
Fiche Jeux - Horloge
Pas encore d'évaluation
Fiche Jeux - Horloge
2 pages
Demande de Mise A Disposition Des Stades
Pas encore d'évaluation
Demande de Mise A Disposition Des Stades
3 pages
Sticks and Stones
Pas encore d'évaluation
Sticks and Stones
8 pages