Tp2
:
1- Lancer IDLE Python, créer un nouveau fichier [Link] puis coller le code ci-
dessous :
# Importation des modules :
import pandas as pd
import numpy as np
# Creation de l’objet dataframe :
raw_data = {'Nom': ['Cherif', 'Mansour', 'Tijeni', 'Jridi', 'Amri'],
'Prenom': ['Seif', 'Jasem', ".", 'Marwa', 'Isam'],
'Sexe':['G','G','.','F','G'],
'age': [12, 12, 16, 14, 13],
'Controle': [4, 14, 11, ".", "."],
'Synthese': ["15,25", "14,75", 17, 12, 10],
'Observation':['Bien','Bien','Bien','Passable','Passable']}
df = [Link](raw_data, columns = ['Nom', 'Prenom', 'Sexe', 'age', 'Controle',
'Synthese', 'Observation'])
# Creation du fichier CSV :
df.to_csv('[Link]')
# Lecture du fichier CSV
df = pd.read_csv('[Link]', sep=",")
# Affichage du contenu du fichier [Link]
print(df)
2 - Maintenant, vous allez ouvrir le fichier [Link] qui se trouve dans le même emplacement
du fichier [Link] et puis :
Copier son contenu puis le coller dans un nouveau classeur Excel
Convertir cette colonne en tableau à l’aide de la commande convertir du menu
données
Supprimer la première colonne
Enregistrer le classeur Excel avec le nom note et le format CSV avec séparateurs ;
dans le même emplacement du fichier [Link] pour écraser ce dernier
3 - Remplacer le contenu du fichier [Link] par ce dernier :
# Importation des modules :
1
import pandas as pd
import numpy as np
# Lecture du fichier CSV
df = pd.read_csv('[Link]', sep=" ;")
# Affichage du contenu du fichier [Link]
print(df)
4- Affichage de quelques informations diverses :
# informations diverses
print("Le nombre de lignes et colonnes : ")
print([Link])
print("Le nombre de valeurs par colonne : ")
print([Link]())
print("Les informations generale du tableau : ")
print([Link]())
print("Afficher les entetes des colonnes par deux facons differentes : ")
print(list([Link]))
print(list(df))
5 - Affichage des statistiques :
# resume basique
print("Affichage des statistiques descriptives univaries")
print([Link]())
print("Affichage des statistiques descriptives avec deux chiffres decimales")
print([Link]().round(2))
6 - Traitement des données quantitatives :
Remarque : Il est possible de sélectionner les variables soit via les crochets [], soit par un point .. Les
fonctions ci-dessous permettent de décrire une variable quantitative (ici "Sexe").
# Quantitative :
print("Informations quantitative sur la colonne Age : ")
print([Link]())
print(df["age"].describe())
print("La moyenne des Ages")
print([Link]())
2
print("echantillonnage sur les tranches d'ages : ")
print([Link]([.01, .3, .9, .99]))
7 - Traitement des données qualitatives :
Pour les variables qualitatives, il y a plusieurs façons de faire pour obtenir la table d'occurrences
(ou des effectifs), ainsi que la table des proportions des modalités.
# Qualitatives :
print("Informations qualitative sur la colonne Sexe : ")
print([Link]())
print("Liste des valeurs d'une colonne : ")
print([Link]())
print("Compter le nombre de chaque valeur : ")
print([Link].value_counts())
print("Afficher les valeurs sous forme de tableau : ")
print([Link]([Link], "freq"))
print("Afficher les valeurs en porcentage sous forme de tableau : ")
print([Link]([Link], "freq", normalize=True))
8 - Traitement de données qualitatives - qualitative
# Traitement de donnees qualitatives - qualitatives :
print("Affichage des observations par sexes :")
print([Link]([Link], [Link]))
print("Affichage des observations par sexes avec les totaux :")
print([Link]([Link], [Link], margins=True))
print("Affichage des observations par sexes en pourcentages :")
print([Link]([Link], [Link], normalize = True))