TP1 : Pandas
(Manipulations de base)
Objectif :
Dans ce tp on va voir les fonctions d'analyse les plus importantes de Pandas en faisant
l'analyse du dataset Student
Pandas est une bibliothèque d'analyse de données qui nous permet de lire, d'analyser
et de modifier facilement des données.
Description du dataset :
Le Dataset « Student » relate les résultats des élèves de l'enseignement secondaire
de deux écoles portugaises. Les attributs des données comprennent les notes des
élèves, les caractéristiques démographiques, sociales et d’autres liées à l'école) et
elles ont été recueillies à travers des rapports scolaires et de questionnaires.
1) En utilisant google colab importer la librairie pandas
2) Importer le dataset dans votre environnement de travail par la ligne suivante :
df=pd.read_csv('/content/[Link]', sep=';')
3) Afficher le dataset student
4) Donner le type du Dataset en utilisant type
5) Quelle est la taille de ce dataset (utiliser shape)
6) Afficher uniquement les noms des colonnes par columns
7) Donner le type de chaque colonne en utilisant info
8) Afficher juste un aperçu du dataset en utilisant la fonction head
1
9) Afficher les 10 dernières lignes du dataset en utilisant la fonction tail
10)Afficher seulement la colonne « age » et stocker le résultat dans une variable
y comme suit
y=df['age']
11)Calculer les valeurs statistiques de la variable age par describe
12)Donner un échantillon du dataset en gardant seulement les variables suivantes :
age, sex, absences, studytime, G1 en executant la ligne du code suivant:
x=df[['age','sex','absences','studytime']]
13)Donner les valeurs statistiques de cet échantillon et commenter le résultat