Pr.
Amal KHTIRA
LGC – TA
Langage Python
TP Python - Bibliothèques
Objectif du TP :
Charger, manipuler, analyser et exporter les données d’un fichier csv avec Python.
Etape 1 : Uploader le fichier
1) Uploader le fichier dans Google Colab
from [Link] import files
uploaded = [Link]()
Etape 2 : Importer les modules Python
2) Importer les packages nécessaires pour le déroulement du TP
import numpy as numpy
import [Link] as plt
import pandas as pd
Etape 3 : Charger le fichier CSV
3) Vérifier l’encodage du fichier
import chardet
# Lire un échantillon du fichier
with open('[Link]', 'rb') as file:
result = [Link]([Link](10000)) # Lire les 10 000
premiers octets
encoding = result['encoding']
print(f"L'encodage détecté est : {encoding}")
TP - Python 1
Pr. Amal KHTIRA
LGC – TA
Langage Python
4) Lire le fichier avec l’encodage détecté, puis l’afficher
# Lire le fichier avec l'encodage détecté
donnees = pd.read_csv('[Link]', encoding=encoding)
donnees
Le résultat doit être comme ceci :
Etape 4 : Manipuler les données du fichier csv
5) Afficher le nombre de lignes et de colonnes dans le tableau
>>> [Link]
6) Afficher les titres de colonnes
>>> [Link]
TP - Python 2
Pr. Amal KHTIRA
LGC – TA
Langage Python
7) Afficher les premières lignes du tableau
>>> [Link]()
8) Afficher le type du tableau importé dans Python
>>> type(donnees)
Vérifier qu’il s’agit bien d’un dataframe.
9) Afficher les données de la colonne « Client »
>>> donnees['Client']
10) Afficher le type de la colonne « Client »
>>> type(donnees['Client'])
Vérifier qu’il s’agit bien d’un Series.
11) Afficher les données de la ligne 5
>>> [Link][5]
12) Même chose, mais afficher le résultat horizontalement
>>> [Link][[5]]
13) Afficher la valeur de la colonne 6 uniquement pour la ligne 5
>>> [Link][5,6]
14) Afficher les données des colonnes 4 et 5 uniquement pour les lignes entre 5 et 7
>>> [Link][5:8, 4:6]
TP - Python 3
Pr. Amal KHTIRA
LGC – TA
Langage Python
15) Afficher les données des colonnes « Produit » et « Total » uniquement pour les lignes entre 5 et 9
>>> donnees['Client'][5:10]
16) Afficher les lignes de vente correspondant au « BERGS »
>>> donnees[donnees['Client']=='BERGS']
17) Afficher les lignes de vente correspondant au client « BERGS » quand les ventes du 4ième
Trimestre dépassent 100 euros.
>>> donnees[(donnees['Client']=='BERGS') & (donnees['Trim 4']>100)]
18) Supprimer les ventes du produit « Gorgonzola Telino » pour le client « PICCO »
>>> ind= donnees[(donnees['Produit']=='Gorgonzola Telino') &
(donnees['Client']=='PICCO')].index
>>> ind
>>> [Link](ind, axis=0, inplace=True)
>>> donnees
Vérifier que le nombre de lignes a diminué de 1 (78 au lieu de 79).
19) Afficher le nombre de lignes par client
>>> donnees['Client'].value_counts()
20) Afficher un graphique secteur qui représente le nombre de lignes par client
>>> donnees['Client'].value_counts().[Link](autopct='%1.0f%%')
TP - Python 4
Pr. Amal KHTIRA
LGC – TA
Langage Python
21) Ajouter une colonne « Total TVA » qui représente 20% de la colonne « Total »
>>> donnees['Total TVA']=donnees['Total']*0.20
22) Vérifier que la colonne « Total TVA » a été ajoutée et que son calcul est correct
>>> [Link]
>>> [Link][0:5,['Total','Total TVA']]
23) Ajouter une colonne « Total TTC » qui représente la somme des colonnes «Total » et
« Total TVA ».
>>> donnees['Total TTC']=donnees['Total']+donnees['Total TVA']
24) Vérifier que la colonne « Total TTC » a été ajoutée et que son calcul est correct
>>> [Link]
>>> [Link][0:5,['Total','Total TVA']]
TP - Python 5
Pr. Amal KHTIRA
LGC – TA
Langage Python
25) Afficher la somme du total TTC par Produit.
>>> donnees[['Produit','Total TTC']].groupby('Produit').sum()
26) Afficher un graphique colonne qui représente la somme du total TTC par produit
>>> donnees[['Produit','Total TTC']].groupby('Produit').sum().[Link]()
27) Ajouter une colonne « Moyenne » qui représente la moyenne des ventes des différents
trimestres.
>>> donnees['Moyenne']=(donnees['Trim 1']+donnees['Trim 2']+donnees['Trim
3']+donnees['Trim 4'])/4
28) Vérifier que la colonne « Moyenne » a été ajoutée et que son calcul est correct
>>> [Link]
>>> [Link][0:5,['Trim 1,'Trim 2', 'Trim 3', 'Trim 4', 'Moyenne']]
TP - Python 6
Pr. Amal KHTIRA
LGC – TA
Langage Python
Etape 5 : Exporter les nouvelles données vers un nouveau fichier CSV
29) Exporter le résultat vers un fichier csv dans Colab
df.to_csv("[Link]", sep=',')
30) Télécharger le fichier CSV
[Link]('[Link]')
TP - Python 7