TP4 2017

Ce document décrit un TP sur l'analyse de données du Titanic et de pourboires dans un restaurant à l'aide de la librairie pandas. Il présente des méthodes et attributs utiles pour l'exploration et l'analyse des données, ainsi que des exemples d'analyses à réaliser sur chaque jeu de données.

Transféré par

sportbullarigia

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

52 vues2 pages

TP4 2017

Transféré par

sportbullarigia

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TP 4 Magistère: Analyse des données du Titanic

2016-2017

La séance sera consacrée à la manipulation de données avec la librairie pandas, et utilisera comme jeux de
données la base de passagers du Titanic, et une petite base contenant des statistiques de pourboires dans un
restaurant.
Pour avoir accès aux fonctions graphiques, vous utiliserez aussi pylab (cf exemples du cours), le tout peut
etre importé comme suit :
import pandas as pds
import pylab
df_tips = pds.read_csv("[Link]
df_titanic = pds.read_excel("[Link]

Le fichier peut etre aussi sauvé localement avec vos programmes. La variable df xxx est alors un objet
DataFrame de la librairie pandas.
Rappel: vous avez la documentation d’une méthode en faisant help(nom de la méthode) dans l’interpréteur,
ou dans spyder avec l’onglet de documentation. Pour avoir l’aide sur la méthode x d’une classe il faut faire
référence à une instance y de la class, par exemple help(y.x).
N’hésitez pas à regarder les (nombreuses) options disponibles des méthodes utilisées.

Exploration basique
Rappel de méthodes et attributs utiles :

• les variables (= les noms des colonnes) sont obtenus via [Link]

• vous accédez aux valeurs d’une colonne avec son nom en indice par exemple df[”age”] donne une série
de donnée avec tous les ages.
• vous accédez à une ligne particulière avec l’attribut loc/iloc, à un ensemble de lignes avec des intervalles
d’index.

Pourboires (tip) Regardez les résultats de :

df_tips.head(10)
df_tips["sex"]
df_tips[df_tips["smoker"]=="No"]
df_tips["tip"].describe()

Ajoutez une colonne contenant le pourcentage du pourboire (en fonction de la note ’total bill’). Faites
une figure donnant la distribution des pourboires en pourcentage.

1
Titanic Regardez les résultats de :

[Link][3]
df[3:10]
df["age"][10:15]

• Regardez les distributions d’age, de sexe, de classe d’embarquement des survivants, et faites des figures
appropriées (histogrammes, moustaches, bâtons...).

Analyse des données

Pourboires
• faites une ou plusieurs figures comparant les moyennes des additions et des pourcentages de pourboire
en fonction des catégories des colonnes “sex” et “smoker”
• comparez les factures en fonction du jour; même question en fonction du repas (midi/soir)

Titanic

• En utilisant la fonction pivot table, analysez les pourcentages de survivants selon l’age, le sexe, et la
classe dans laquelle ils ont embarqué.
• Donnez le taux de survie des moins de 16 ans par classe
• On peut faire des paquets de données en coupant un ensemble de valeurs selon des intervalles avec la
méthode ”cut” de pandas.
Donnez les taux de survie par classe d’age, puis par classe d’embarquement, puis les deux ensembles
en utilisant la méthode groupby.

Vous aimerez peut-être aussi

TD - Titanic
Pas encore d'évaluation
TD - Titanic
6 pages
Analyse des passagers du Titanic en Python
Pas encore d'évaluation
Analyse des passagers du Titanic en Python
3 pages
Titanic Bon
Pas encore d'évaluation
Titanic Bon
29 pages
Prédiction de survie Titanic : TP IA
Pas encore d'évaluation
Prédiction de survie Titanic : TP IA
12 pages
TP2 Prétraitement Des Données Ipynb - Colab
Pas encore d'évaluation
TP2 Prétraitement Des Données Ipynb - Colab
10 pages
Cours D'analyse de Données Pandas
Pas encore d'évaluation
Cours D'analyse de Données Pandas
8 pages
TP1 Titanic
Pas encore d'évaluation
TP1 Titanic
6 pages
Fiche-16 - Données en Table-Dataframe
Pas encore d'évaluation
Fiche-16 - Données en Table-Dataframe
4 pages
Instructions pour l'analyse du Titanic
Pas encore d'évaluation
Instructions pour l'analyse du Titanic
1 page
Chapitre Iv Base Du Machine Learning Avec Python
Pas encore d'évaluation
Chapitre Iv Base Du Machine Learning Avec Python
9 pages
Analyse des passagers du Titanic
Pas encore d'évaluation
Analyse des passagers du Titanic
4 pages
Manipulation des données avec Pandas
Pas encore d'évaluation
Manipulation des données avec Pandas
9 pages
Analyse et Prétraitement de Données Python
Pas encore d'évaluation
Analyse et Prétraitement de Données Python
4 pages
AE1 Titanic Tableur
0% (1)
AE1 Titanic Tableur
4 pages
Statistiques au lycée avec pandas Python
Pas encore d'évaluation
Statistiques au lycée avec pandas Python
53 pages
Passagers et survivants du Titanic
Pas encore d'évaluation
Passagers et survivants du Titanic
2 pages
Analyse Des Données Titanic 2
Pas encore d'évaluation
Analyse Des Données Titanic 2
8 pages
Analyse de données avec Pandas
Pas encore d'évaluation
Analyse de données avec Pandas
2 pages
tp5 Machine Learning
Pas encore d'évaluation
tp5 Machine Learning
11 pages
Les Données Structurées Et Leur Traitement Séance 1
Pas encore d'évaluation
Les Données Structurées Et Leur Traitement Séance 1
6 pages
Analyse Donnees Python Jupyter
Pas encore d'évaluation
Analyse Donnees Python Jupyter
4 pages
2eme Partie Lanalyse de Données Avec PANDAS
Pas encore d'évaluation
2eme Partie Lanalyse de Données Avec PANDAS
30 pages
TD 2
Pas encore d'évaluation
TD 2
3 pages
Correction TP Python Panda
Pas encore d'évaluation
Correction TP Python Panda
7 pages
tp2 ML
Pas encore d'évaluation
tp2 ML
7 pages
Annexe Pandas Final 2023
Pas encore d'évaluation
Annexe Pandas Final 2023
3 pages
Examen Baccalauréat Informatique 2023
Pas encore d'évaluation
Examen Baccalauréat Informatique 2023
3 pages
TP 4 Analyse Exploratoire de Données AED
Pas encore d'évaluation
TP 4 Analyse Exploratoire de Données AED
5 pages
Annexe Pandas Final 2023 - 2
Pas encore d'évaluation
Annexe Pandas Final 2023 - 2
2 pages
Nettoyage de données avec Python et Pandas
Pas encore d'évaluation
Nettoyage de données avec Python et Pandas
5 pages
Analyse de données avec Pandas
Pas encore d'évaluation
Analyse de données avec Pandas
2 pages
Science des Données avec Python
Pas encore d'évaluation
Science des Données avec Python
39 pages
Pandas A Faire 2 - Jupyter Notebook
Pas encore d'évaluation
Pandas A Faire 2 - Jupyter Notebook
7 pages
Fonctions Clés de Pandas en Python
100% (1)
Fonctions Clés de Pandas en Python
44 pages
Données Structurées
Pas encore d'évaluation
Données Structurées
1 page
Analyse de données avec Pandas
Pas encore d'évaluation
Analyse de données avec Pandas
17 pages
Manipulation de Données Avec R
Pas encore d'évaluation
Manipulation de Données Avec R
4 pages
Classification du Titanic avec Sklearn
Pas encore d'évaluation
Classification du Titanic avec Sklearn
4 pages
Correction TP3 : Analyse Titanic avec Python
Pas encore d'évaluation
Correction TP3 : Analyse Titanic avec Python
15 pages
TP 5 Py Av
Pas encore d'évaluation
TP 5 Py Av
9 pages
TP3 Et 4 Fouille de Données 2025
Pas encore d'évaluation
TP3 Et 4 Fouille de Données 2025
4 pages
Analyse des données du Titanic en R
Pas encore d'évaluation
Analyse des données du Titanic en R
24 pages
Initiation à Python avec Pandas
Pas encore d'évaluation
Initiation à Python avec Pandas
8 pages
Analyse de données avec Pandas en Python
Pas encore d'évaluation
Analyse de données avec Pandas en Python
10 pages
Traitement de données avec pandas
Pas encore d'évaluation
Traitement de données avec pandas
3 pages
TP3 Fouille de Données 2025
100% (1)
TP3 Fouille de Données 2025
3 pages
Statistiques Descriptives Et Analyse de Données Avec Le Module Pandas
Pas encore d'évaluation
Statistiques Descriptives Et Analyse de Données Avec Le Module Pandas
10 pages
Projet Python Jean Paulinah
Pas encore d'évaluation
Projet Python Jean Paulinah
28 pages
Atelier5 - Pandas
Pas encore d'évaluation
Atelier5 - Pandas
1 page
TP 02
Pas encore d'évaluation
TP 02
2 pages
Atelier Pandas
Pas encore d'évaluation
Atelier Pandas
3 pages
Guide Pandas
Pas encore d'évaluation
Guide Pandas
5 pages
DC2 Eg 2025
Pas encore d'évaluation
DC2 Eg 2025
3 pages
Py Data Analysis
Pas encore d'évaluation
Py Data Analysis
44 pages
Techniques de datavisualisation en Python
Pas encore d'évaluation
Techniques de datavisualisation en Python
16 pages
Formation Pandas
Pas encore d'évaluation
Formation Pandas
23 pages
C1 AE1 Données Du Titanic
Pas encore d'évaluation
C1 AE1 Données Du Titanic
2 pages
Analyse de données avec Pandas : TP1
Pas encore d'évaluation
Analyse de données avec Pandas : TP1
2 pages
Analyse des Données COVID-19 en Tunisie
Pas encore d'évaluation
Analyse des Données COVID-19 en Tunisie
2 pages
DS1-2ème Lettres-2019
100% (1)
DS1-2ème Lettres-2019
2 pages
Analyse des prix unitaires des articles
Pas encore d'évaluation
Analyse des prix unitaires des articles
6 pages
Examen Bac 2023 : Pratique Informatique
Pas encore d'évaluation
Examen Bac 2023 : Pratique Informatique
2 pages
Examen Bac 2023 : Pratique Informatique
Pas encore d'évaluation
Examen Bac 2023 : Pratique Informatique
2 pages
Tds Elf Evolution 700 Turbo Diesel 10w 40 DFF 202202 FR
Pas encore d'évaluation
Tds Elf Evolution 700 Turbo Diesel 10w 40 DFF 202202 FR
1 page
Matériaux en Construction Métallique
Pas encore d'évaluation
Matériaux en Construction Métallique
71 pages
TD - 3 - Sur Les Décisions Et Outils D'aide À La Décision
100% (1)
TD - 3 - Sur Les Décisions Et Outils D'aide À La Décision
4 pages
Nam 1844 1 3 442 1
Pas encore d'évaluation
Nam 1844 1 3 442 1
15 pages
Caractérisation Des Distributions À Queue Lourde Pour L'Analyse Des Crues
Pas encore d'évaluation
Caractérisation Des Distributions À Queue Lourde Pour L'Analyse Des Crues
82 pages
Hydractive
Pas encore d'évaluation
Hydractive
14 pages
Peugeot Partner Origin Notice Mode Emploi (2010)
86% (7)
Peugeot Partner Origin Notice Mode Emploi (2010)
116 pages
Le Diagnostic Histologique de La Maladie Cœliaque Et de Ses Complications
Pas encore d'évaluation
Le Diagnostic Histologique de La Maladie Cœliaque Et de Ses Complications
5 pages
SERIE C3 1ère S1 LES ALCENES ET LES ALCYNES
100% (1)
SERIE C3 1ère S1 LES ALCENES ET LES ALCYNES
2 pages
Projet Des Ponts Speciaux (Pont Biais)
Pas encore d'évaluation
Projet Des Ponts Speciaux (Pont Biais)
53 pages
Régulation Électromécanique: Références et Applications
Pas encore d'évaluation
Régulation Électromécanique: Références et Applications
1 page
Part 3 Cours Web Intelligence - NY 2024 2025
Pas encore d'évaluation
Part 3 Cours Web Intelligence - NY 2024 2025
61 pages
Exercices Résolus de Mathématiques TRI 23
Pas encore d'évaluation
Exercices Résolus de Mathématiques TRI 23
12 pages
Ex Carte de Restriction
100% (7)
Ex Carte de Restriction
19 pages
Supervision Industrielle et SCADA
Pas encore d'évaluation
Supervision Industrielle et SCADA
15 pages
Emploi du Temps SMP Université AE
Pas encore d'évaluation
Emploi du Temps SMP Université AE
3 pages
Corrigé Chimie des Surfaces
100% (4)
Corrigé Chimie des Surfaces
14 pages
Fonctionnement et choix d'un contacteur
Pas encore d'évaluation
Fonctionnement et choix d'un contacteur
8 pages
TP2 Onduleur Monophasé
Pas encore d'évaluation
TP2 Onduleur Monophasé
7 pages
Chap4 Calibrateur Dose
Pas encore d'évaluation
Chap4 Calibrateur Dose
38 pages
Manipulation Des Bases de Données Avec PDO
Pas encore d'évaluation
Manipulation Des Bases de Données Avec PDO
3 pages
Accidents Et Protections Suceptibles Lors Du Soudage.
Pas encore d'évaluation
Accidents Et Protections Suceptibles Lors Du Soudage.
18 pages
Pression et énergie électrique expliquées
Pas encore d'évaluation
Pression et énergie électrique expliquées
6 pages
Fabrication de cuves pour CCM
100% (1)
Fabrication de cuves pour CCM
14 pages
These Poiron-Guidoni Nicolas
Pas encore d'évaluation
These Poiron-Guidoni Nicolas
319 pages
Cours sur le gaz parfait en thermodynamique
100% (1)
Cours sur le gaz parfait en thermodynamique
22 pages
TP1 Can Oc2
Pas encore d'évaluation
TP1 Can Oc2
9 pages
Rapport de TP Et La Sortie de Terrain
Pas encore d'évaluation
Rapport de TP Et La Sortie de Terrain
12 pages
Programmation CNC: Décalages et Simulation
Pas encore d'évaluation
Programmation CNC: Décalages et Simulation
68 pages
Outils Statistiques Iso 13485
Pas encore d'évaluation
Outils Statistiques Iso 13485
15 pages