0% ont trouvé ce document utile (0 vote)
229 vues3 pages

Traitement de données avec pandas

Le document décrit les étapes pour analyser un jeu de données sur les notes d'étudiants en utilisant Pandas. Il montre comment importer les données dans un dataframe, les exporter/importer dans un fichier CSV/Excel, puis effectuer diverses analyses statistiques univariées et bivariées.

Transféré par

وليد بن عمر
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
229 vues3 pages

Traitement de données avec pandas

Le document décrit les étapes pour analyser un jeu de données sur les notes d'étudiants en utilisant Pandas. Il montre comment importer les données dans un dataframe, les exporter/importer dans un fichier CSV/Excel, puis effectuer diverses analyses statistiques univariées et bivariées.

Transféré par

وليد بن عمر
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

Tp2 

:
1- Lancer IDLE Python, créer un nouveau fichier [Link] puis coller le code ci-
dessous :

# Importation des modules :


import pandas as pd
import numpy as np
# Creation de l’objet dataframe :
raw_data = {'Nom': ['Cherif', 'Mansour', 'Tijeni', 'Jridi', 'Amri'],
'Prenom': ['Seif', 'Jasem', ".", 'Marwa', 'Isam'],
'Sexe':['G','G','.','F','G'],
'age': [12, 12, 16, 14, 13],
'Controle': [4, 14, 11, ".", "."],
'Synthese': ["15,25", "14,75", 17, 12, 10],
'Observation':['Bien','Bien','Bien','Passable','Passable']}
df = [Link](raw_data, columns = ['Nom', 'Prenom', 'Sexe', 'age', 'Controle',
'Synthese', 'Observation'])
# Creation du fichier CSV :
df.to_csv('[Link]')
# Lecture du fichier CSV
df = pd.read_csv('[Link]', sep=",")
# Affichage du contenu du fichier [Link]
print(df)

2 - Maintenant, vous allez ouvrir le fichier [Link] qui se trouve dans le même emplacement
du fichier [Link] et puis :

 Copier son contenu puis le coller dans un nouveau classeur Excel


 Convertir cette colonne en tableau à l’aide de la commande convertir du menu
données
 Supprimer la première colonne
 Enregistrer le classeur Excel avec le nom note et le format CSV avec séparateurs ;
dans le même emplacement du fichier [Link] pour écraser ce dernier
3 - Remplacer le contenu du fichier [Link] par ce dernier :

# Importation des modules :

1
import pandas as pd
import numpy as np
# Lecture du fichier CSV
df = pd.read_csv('[Link]', sep=" ;")
# Affichage du contenu du fichier [Link]
print(df)

4- Affichage de quelques informations diverses :

# informations diverses
print("Le nombre de lignes et colonnes : ")
print([Link])
print("Le nombre de valeurs par colonne : ")
print([Link]())
print("Les informations generale du tableau : ")
print([Link]())
print("Afficher les entetes des colonnes par deux facons differentes : ")
print(list([Link]))
print(list(df))

5 - Affichage des statistiques :

# resume basique
print("Affichage des statistiques descriptives univaries")
print([Link]())
print("Affichage des statistiques descriptives avec deux chiffres decimales")
print([Link]().round(2))

6 - Traitement des données quantitatives :


Remarque : Il est possible de sélectionner les variables soit via les crochets [], soit par un point .. Les
fonctions ci-dessous permettent de décrire une variable quantitative (ici "Sexe").

# Quantitative :
print("Informations quantitative sur la colonne Age : ")
print([Link]())
print(df["age"].describe())
print("La moyenne des Ages")
print([Link]())

2
print("echantillonnage sur les tranches d'ages : ")
print([Link]([.01, .3, .9, .99]))

7 - Traitement des données qualitatives :


Pour les variables qualitatives, il y a plusieurs façons de faire pour obtenir la table d'occurrences
(ou des effectifs), ainsi que la table des proportions des modalités.

# Qualitatives :
print("Informations qualitative sur la colonne Sexe : ")
print([Link]())
print("Liste des valeurs d'une colonne : ")
print([Link]())
print("Compter le nombre de chaque valeur : ")
print([Link].value_counts())
print("Afficher les valeurs sous forme de tableau : ")
print([Link]([Link], "freq"))
print("Afficher les valeurs en porcentage sous forme de tableau : ")
print([Link]([Link], "freq", normalize=True))

8 - Traitement de données qualitatives - qualitative


# Traitement de donnees qualitatives - qualitatives :
print("Affichage des observations par sexes :")
print([Link]([Link], [Link]))
print("Affichage des observations par sexes avec les totaux :")
print([Link]([Link], [Link], margins=True))
print("Affichage des observations par sexes en pourcentages :")
print([Link]([Link], [Link], normalize = True))

Vous aimerez peut-être aussi