TP2 Data Science

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

149 vues2 pages

TP2 Data Science

Transféré par

Pape Moussa Diop

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TP 2 : Manipulation des données

Cours : Principes et Techniques de Data Science

Responsable : Dr Ousmane KHOUMA

Année Académique 2021 - 2022

Université Amadou Mahtar MBOW (UAM)

Licence 2 Ingénierie Informatique

Exercice 1 :
1. Créer un Dataframe qui ressemble à ceci :

Nom Age Poids Paille Genre

0 Dodou 10 75 4.5 M
1 Amy 15 123 5.0 F
2 Mousa 20 239 6.1 M

2. Créez un DataFrame animaux qui correspond au diagramme ci-dessous :

Vaches Chevres
an 1 12 22
an 2 20 19

3. Enregistrer le DataFrame de la question 2 sur le disque dur en tant que fichier csv sous le
nom vache_chevre.csv.
4. Transformer le fichier de la question 3 en DataFrame pour obtenir le résultat suivant.

Vaches Chevres
an 1 12 22
an 2 20 19

1
Exercice 2 :
1. Importer le fichier boissons_evaluees.csv.
2. Quelle est la médiane de la colonne points dans le DataFrame boisson ?
3. Quels sont les pays représentés dans l’ensemble de données ? (Votre réponse ne doit pas
comporter de doublons).
4. À quelle fréquence chaque pays figure-t-il dans l’ensemble des données ? Créez une Series
de boisson_par_pays en faisant correspondre les pays au nombre de critiques de boisson de
ce pays.
5. Créez la variable prix_centre contenant une version de la colonne price avec le prix moyen
soustrait. (Remarque : cette transformation de « centrage » est une étape de prétraitement courante
avant l’application de divers algorithmes de Machine Learning).
6. Je suis un acheteur de boisson. Quelle boisson est la meilleure affaire ? Créez une variable
boisson_negociee avec le titre de la boisson ayant le meilleur rapport qualité/prix dans
l’ensemble de données.
Exercice 3 :
On considère le fichier boissons_evaluees.csv.
1. Quels sont les critiques de boisson les plus fréquentes dans l’ensemble des données ? Créez
une Series dont l’index est la catégorie taster_twitter_handle de l’ensemble de données, et
dont les valeurs comptent le nombre de critiques que chaque personne a rédigées.
2. Quelle est la meilleure boisson que je puisse acheter pour une somme donnée ? Créez une
Series dont l’indice est le prix de la boisson et dont la valeur est le nombre maximum de
points qu’une boisson coûtant le même prix a obtenu dans une critique. Trier les valeurs par
prix, en ordre croissant.
3. Quels sont les prix minimum et maximum pour chaque cépage (variety) de boisson ? Créez
un DataFrame dont l’indice est la catégorie variety de l’ensemble de données et dont les
valeurs sont les valeurs min et max de celui-ci.
4. Créer une Series dont l’indice est celui des « commentateurs » et dont la valeur est la note
moyenne de l’examen donné par ce « commentateur ». Astuce : vous aurez besoin des
colonnes taster_name et points.
5. Quel est le type de données de la colonne points dans l’ensemble de données ?
6. Parfois, la colonne price est nulle. A combien d’avis dans l’ensemble de données manque-t-il
un prix ?

Vous aimerez peut-être aussi

Compte Rendu Du TP
Pas encore d'évaluation
Compte Rendu Du TP
20 pages
TP N°2
Pas encore d'évaluation
TP N°2
4 pages
TD3-Python Analyse
Pas encore d'évaluation
TD3-Python Analyse
1 page
TP2 - Python
Pas encore d'évaluation
TP2 - Python
4 pages
Annexe - Pandas F
Pas encore d'évaluation
Annexe - Pandas F
7 pages
Exercice 1
Pas encore d'évaluation
Exercice 1
4 pages
Exercice 1
Pas encore d'évaluation
Exercice 1
2 pages
Analyse des ventes avec Pandas
Pas encore d'évaluation
Analyse des ventes avec Pandas
2 pages
Manipulation des données avec Pandas
Pas encore d'évaluation
Manipulation des données avec Pandas
9 pages
TP 4 Analyse Exploratoire de Données AED
Pas encore d'évaluation
TP 4 Analyse Exploratoire de Données AED
5 pages
TP N°2
Pas encore d'évaluation
TP N°2
4 pages
Importation et Manipulation de Données en Python
Pas encore d'évaluation
Importation et Manipulation de Données en Python
2 pages
Analyse de données avec R
Pas encore d'évaluation
Analyse de données avec R
2 pages
Annexe - Pandas
Pas encore d'évaluation
Annexe - Pandas
10 pages
TD Pyspark
Pas encore d'évaluation
TD Pyspark
2 pages
TP Pandas: Séries et DataFrames
Pas encore d'évaluation
TP Pandas: Séries et DataFrames
4 pages
ANNEXE
Pas encore d'évaluation
ANNEXE
3 pages
Page - 1
Pas encore d'évaluation
Page - 1
20 pages
Python Pour Les Economistes-Pandas
Pas encore d'évaluation
Python Pour Les Economistes-Pandas
43 pages
Gestion - Restaurant Pandas
Pas encore d'évaluation
Gestion - Restaurant Pandas
3 pages
TP Data Mining Avec NumPy, Pandas Et Matplotlib
Pas encore d'évaluation
TP Data Mining Avec NumPy, Pandas Et Matplotlib
3 pages
Guide Pandas
Pas encore d'évaluation
Guide Pandas
5 pages
ÉNONCÉ Prototype - EG - 2023.
Pas encore d'évaluation
ÉNONCÉ Prototype - EG - 2023.
4 pages
Correction Prototype 2023.
Pas encore d'évaluation
Correction Prototype 2023.
5 pages
TP Python : Manipulation de Données en Statistiques Exploratoires
Pas encore d'évaluation
TP Python : Manipulation de Données en Statistiques Exploratoires
3 pages
TP3 4 5 Pandas 4eco Version Eleves
Pas encore d'évaluation
TP3 4 5 Pandas 4eco Version Eleves
4 pages
Python: Manipulation Des Données Avec Pandas
100% (1)
Python: Manipulation Des Données Avec Pandas
9 pages
Examen TP Data Science 2024
Pas encore d'évaluation
Examen TP Data Science 2024
4 pages
Partie 1: La Bibliothèque Numpy:: Exercice 1
Pas encore d'évaluation
Partie 1: La Bibliothèque Numpy:: Exercice 1
3 pages
TP1 - Introduction À Python (Data Mining)
Pas encore d'évaluation
TP1 - Introduction À Python (Data Mining)
2 pages
Tp1 Pandas Corrigé
100% (1)
Tp1 Pandas Corrigé
10 pages
StatDonnees Fiches 1516
Pas encore d'évaluation
StatDonnees Fiches 1516
12 pages
Httpscahier de Prepa - FRPC Eptdownloadid 606 2
Pas encore d'évaluation
Httpscahier de Prepa - FRPC Eptdownloadid 606 2
15 pages
tp2 ML
Pas encore d'évaluation
tp2 ML
7 pages
Projet 2 OC Presentation
Pas encore d'évaluation
Projet 2 OC Presentation
38 pages
Fonctions Clés de Pandas en Python
100% (1)
Fonctions Clés de Pandas en Python
44 pages
TD2 ML
Pas encore d'évaluation
TD2 ML
4 pages
Analyse Statistique des Données Pokémon
Pas encore d'évaluation
Analyse Statistique des Données Pokémon
29 pages
Projet Python Jean Paulinah
Pas encore d'évaluation
Projet Python Jean Paulinah
28 pages
IFRI LangagePython TP3
Pas encore d'évaluation
IFRI LangagePython TP3
4 pages
Le Sujet Comporte 3 Pages Numérotées de 1 Sur 3 À 3 Sur 3
Pas encore d'évaluation
Le Sujet Comporte 3 Pages Numérotées de 1 Sur 3 À 3 Sur 3
3 pages
TP Pandas: Manipulation et Analyse de Données
Pas encore d'évaluation
TP Pandas: Manipulation et Analyse de Données
4 pages
Analyse de DataFrames avec Pandas
Pas encore d'évaluation
Analyse de DataFrames avec Pandas
1 page
Cours Accéléré Python Pandas Numpy
Pas encore d'évaluation
Cours Accéléré Python Pandas Numpy
2 pages
Cours et exercices de Data Mining R
Pas encore d'évaluation
Cours et exercices de Data Mining R
2 pages
Devoir
Pas encore d'évaluation
Devoir
2 pages
DS3 2eco
Pas encore d'évaluation
DS3 2eco
3 pages
Annexe - Pandas
Pas encore d'évaluation
Annexe - Pandas
10 pages
TP Sujet IEF
Pas encore d'évaluation
TP Sujet IEF
3 pages
Pandas Bateaux
Pas encore d'évaluation
Pandas Bateaux
2 pages
Fiche-16 - Données en Table-Dataframe
Pas encore d'évaluation
Fiche-16 - Données en Table-Dataframe
4 pages
4eco Devoir Controle3
Pas encore d'évaluation
4eco Devoir Controle3
3 pages
Exercices R pour Big Data & Cloud Computing
100% (1)
Exercices R pour Big Data & Cloud Computing
4 pages
Exercices Data Mining (Partie1) Avec Solution
Pas encore d'évaluation
Exercices Data Mining (Partie1) Avec Solution
4 pages
Examen ProgrammationR L3 2025
Pas encore d'évaluation
Examen ProgrammationR L3 2025
2 pages
Module: Analyse Et Fouille de Données
Pas encore d'évaluation
Module: Analyse Et Fouille de Données
3 pages
TD4 - Filtres
Pas encore d'évaluation
TD4 - Filtres
4 pages
Guide Pandas: Manipulation et Analyse de Données
Pas encore d'évaluation
Guide Pandas: Manipulation et Analyse de Données
45 pages
Pandas
Pas encore d'évaluation
Pandas
7 pages
Rapport Atelier 6
Pas encore d'évaluation
Rapport Atelier 6
13 pages
Énumération des sous-domaines UCAD
Pas encore d'évaluation
Énumération des sous-domaines UCAD
8 pages
Rapport Atelier 5
Pas encore d'évaluation
Rapport Atelier 5
11 pages
Rapport Atelier 3
100% (1)
Rapport Atelier 3
7 pages
Traitement Fichiers ESTI
Pas encore d'évaluation
Traitement Fichiers ESTI
14 pages
Introduction au Calcul Tensoriel
Pas encore d'évaluation
Introduction au Calcul Tensoriel
16 pages
Outils Essentiels pour Data Scientists
Pas encore d'évaluation
Outils Essentiels pour Data Scientists
13 pages
Chapitre 2 POO 2022
Pas encore d'évaluation
Chapitre 2 POO 2022
17 pages
TD 1
Pas encore d'évaluation
TD 1
2 pages
TD Microprocesseurs et Mémoire RAM
100% (1)
TD Microprocesseurs et Mémoire RAM
1 page
Pline Block
Pas encore d'évaluation
Pline Block
3 pages
Activation de SolidWorks 2020 Cracked
Pas encore d'évaluation
Activation de SolidWorks 2020 Cracked
4 pages
Chef 101037
Pas encore d'évaluation
Chef 101037
8 pages
Cours Circuits Numériques (Semestre 2) 1AP
Pas encore d'évaluation
Cours Circuits Numériques (Semestre 2) 1AP
72 pages
Rapport de NAGIOS
Pas encore d'évaluation
Rapport de NAGIOS
31 pages
IA & ML : Défis et Avenir
Pas encore d'évaluation
IA & ML : Défis et Avenir
14 pages
15 Exemple de Manuel Qualite
Pas encore d'évaluation
15 Exemple de Manuel Qualite
8 pages
Scripts Shell Linux: Exercices Pratiques
Pas encore d'évaluation
Scripts Shell Linux: Exercices Pratiques
3 pages
Chap 6 Segmentation Par Détection de Contour
Pas encore d'évaluation
Chap 6 Segmentation Par Détection de Contour
23 pages
Le Système D'exploitation
Pas encore d'évaluation
Le Système D'exploitation
3 pages
3iir TP2
Pas encore d'évaluation
3iir TP2
2 pages
Algo Cours 1
Pas encore d'évaluation
Algo Cours 1
11 pages
LTAM
Pas encore d'évaluation
LTAM
19 pages
Facture n° 68950510 - Vito Tambasco
Pas encore d'évaluation
Facture n° 68950510 - Vito Tambasco
2 pages
TD2 Architecture Des Ordinateurs
Pas encore d'évaluation
TD2 Architecture Des Ordinateurs
2 pages
Aymane Moutei
Pas encore d'évaluation
Aymane Moutei
37 pages
Cours Chapitre 5 Réseaux Mobiles 1 Partie
Pas encore d'évaluation
Cours Chapitre 5 Réseaux Mobiles 1 Partie
24 pages
Réseau Poste A Poste Et Client Server
Pas encore d'évaluation
Réseau Poste A Poste Et Client Server
15 pages
Cours sur le Langage PL/SQL
Pas encore d'évaluation
Cours sur le Langage PL/SQL
23 pages
Exam Rattrapage TICRS1 2014 2015
Pas encore d'évaluation
Exam Rattrapage TICRS1 2014 2015
2 pages
Commandes de base sous Linux : Guide pratique
Pas encore d'évaluation
Commandes de base sous Linux : Guide pratique
57 pages
Cahier de Charge
Pas encore d'évaluation
Cahier de Charge
6 pages
Yankam Joël
Pas encore d'évaluation
Yankam Joël
2 pages
Protocole TCP-IP
Pas encore d'évaluation
Protocole TCP-IP
20 pages
Installer Un Système D'information
Pas encore d'évaluation
Installer Un Système D'information
3 pages
Serveur Linux Centos: Service Nis
Pas encore d'évaluation
Serveur Linux Centos: Service Nis
15 pages
Rapport de Stage à l'Office des Routes
Pas encore d'évaluation
Rapport de Stage à l'Office des Routes
14 pages
Electronique Et Loisirs 008
Pas encore d'évaluation
Electronique Et Loisirs 008
96 pages
Cours 1
Pas encore d'évaluation
Cours 1
19 pages
Emploi de Temps RES 1-7
Pas encore d'évaluation
Emploi de Temps RES 1-7
2 pages