TP1 DM

Le document présente un module sur l'analyse et la fouille de données, dirigé par Yosra Jarraya, avec un TP sur la manipulation de matrices de données utilisant Pandas Python dans Google Colab. Il décrit les fonctionnalités de Pandas, notamment la création et la manipulation de DataFrames, et propose une série d'exercices pratiques sur un ensemble de données d'élèves. Les exercices incluent la création de DataFrames, la sélection de données, le traitement des valeurs manquantes et l'ajout ou la suppression de lignes.

Transféré par

nourheneghouili

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

16 vues2 pages

TP1 DM

Transféré par

nourheneghouili

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Module : Analyse et fouille de données

Responsable du Cours: Yosra Jarraya Auditoire: D-LBC BI

Enseignante TP: Yosra Jarraya A-U: 2024-2025

TP1 : Manipulation des matrices de données avec Pandas Python

Google colab :
Google Colaboratory ou colab est un outil Google simple et gratuit qui permet d’exécuter du
code python à travers un navigateur. Il est utilisé directement sur le web sans installation de
logiciel. C’est un environnement adapté à l’analyse de données et au machine learning. Il est
gratuit et ne nécessite aucune configuration.

La librairie Pandas :
Pandas est une bibliothèque du langage de programmation Python, entièrement dédiée à la
science de données. C’est un outil d’analyse et de manipulation de données très puissant. Les
fonctionnalités de la librairie pandas permettent d’extraire, préparer et éventuellement analyser
des données

Le type DataFrame :
Pandas introduit la classe DataFrame ou table de données indispensable en statistique. Un
DataFrame correspond à une matrice individus-variables où les lignes correspondent à des
observations et les colonnes à des attributs décrivant les individus. Il s’agit d’associer avec le
même index de lignes des colonnes ou variables de types différents (entier, réel, booléen,
caractère).
Ce TP présente les fonctionnalités principales utilisées pour la préparation et le nettoyage des
données à l’aide de Python Pandas et particulièrement d’un DataFrame.

Exercice 1 :
Soit la matrice de données suivante qui représente des informations concernant un ensemble
d’élèves. Chaque élève est caractérisé par 4 attributs :
Nom : nom de l’élève
Score : le score en moyenne accompli par l’élève dans l’examen
Tentatives : le nombre de tentatives de passage de l’examen
Qualification : représente la réussite ou non de l’élève dans l’examen

1
Nom Score Tentatives qualification
E1 Ahmed 12.5 1 oui
E2 Chaima 9 3 non
E3 Abir 16.5 2 oui
E4 Eya NaN 3 non
E5 Hassen 9 2 non
E6 Amine 20 3 oui
E7 Hajer 14.5 1 oui
E8 Amal NaN 1 non
E9 Karim 8 2 non
E10 Hanen 19 1 oui

1) Créer et afficher un DataFrame à partir des données décrites ci-dessus contenant les
étiquettes des élèves
2) Afficher les informations de base du DataFrame
3) Afficher les 3 premières lignes du DataFrame
4) Sélectionner les colonnes «Nom» et «Score»
5) Sélectionner les lignes pour lesquelles le nombre de tentatives à l'examen est supérieur à 2
6) Compter le nombre de lignes et de colonnes du DataFrame
7) Sélectionner les lignes pour lesquelles le score est une valeur manquante
8) Sélectionner les lignes pour lesquelles le nombre de tentatives à l'examen est inférieur à 2
et le score est supérieur à 15
9) Remplacer toutes les valeurs manquantes (NaN) par des Zéro
10) Changer la valeur du score de l’élève «E4» en 11,5
11) Ajouter une nouvelle ligne «E11» au DataFrame avec des valeurs données pour chaque
colonne
12) Supprimer la nouvelle ligne et afficher de nouveau le Dataframe

Vous aimerez peut-être aussi

Manipulation de DataFrames avec Pandas
Pas encore d'évaluation
Manipulation de DataFrames avec Pandas
3 pages
Module: Analyse Et Fouille de Données
Pas encore d'évaluation
Module: Analyse Et Fouille de Données
3 pages
TP 4 Analyse Exploratoire de Données AED
Pas encore d'évaluation
TP 4 Analyse Exploratoire de Données AED
5 pages
Science des Données avec Python
Pas encore d'évaluation
Science des Données avec Python
39 pages
Analyse de données avec Pandas
Pas encore d'évaluation
Analyse de données avec Pandas
9 pages
Analyse Des Données20222
Pas encore d'évaluation
Analyse Des Données20222
10 pages
Méthodes Pandas pour DataFrames
Pas encore d'évaluation
Méthodes Pandas pour DataFrames
2 pages
TP3 4 5 Pandas 4eco Version Eleves
Pas encore d'évaluation
TP3 4 5 Pandas 4eco Version Eleves
4 pages
Guide d'utilisation de Pandas en 4ème
Pas encore d'évaluation
Guide d'utilisation de Pandas en 4ème
3 pages
Analyse de données avec Pandas
Pas encore d'évaluation
Analyse de données avec Pandas
17 pages
Atelier de Travail-Formation Pandas Version Finale Avec Correction PDF
Pas encore d'évaluation
Atelier de Travail-Formation Pandas Version Finale Avec Correction PDF
4 pages
Devoir de Synthèse N°2: Matière: Informatique
Pas encore d'évaluation
Devoir de Synthèse N°2: Matière: Informatique
3 pages
DC2 Eg 2025
Pas encore d'évaluation
DC2 Eg 2025
3 pages
Cours TP Pandas
Pas encore d'évaluation
Cours TP Pandas
7 pages
Devoir Python Pandas pour Lycée
Pas encore d'évaluation
Devoir Python Pandas pour Lycée
2 pages
Analyse de Données avec Pandas (Python)
Pas encore d'évaluation
Analyse de Données avec Pandas (Python)
4 pages
Manipulation des données avec Pandas
Pas encore d'évaluation
Manipulation des données avec Pandas
9 pages
Nettoyage de données avec Python et Pandas
Pas encore d'évaluation
Nettoyage de données avec Python et Pandas
5 pages
TP1 2 Pandas 4eco Version Eleves
100% (2)
TP1 2 Pandas 4eco Version Eleves
4 pages
DS2 3 Eco
Pas encore d'évaluation
DS2 3 Eco
3 pages
Travaux Pratiques N°2: Exploration Des Données Avec Pandas Visualisation Graphique Avec Mathplotlib Et Seaborn
Pas encore d'évaluation
Travaux Pratiques N°2: Exploration Des Données Avec Pandas Visualisation Graphique Avec Mathplotlib Et Seaborn
2 pages
CCR2024MPEN
Pas encore d'évaluation
CCR2024MPEN
27 pages
DS3 2eco
Pas encore d'évaluation
DS3 2eco
3 pages
Analyse de données avec Pandas Python
Pas encore d'évaluation
Analyse de données avec Pandas Python
4 pages
Optimisation Du Code Python 4
Pas encore d'évaluation
Optimisation Du Code Python 4
29 pages
Annexe Pandas Final 2023
Pas encore d'évaluation
Annexe Pandas Final 2023
3 pages
TD4 - MLPreparation Des Données
Pas encore d'évaluation
TD4 - MLPreparation Des Données
5 pages
Examen Baccalauréat Informatique 2024
Pas encore d'évaluation
Examen Baccalauréat Informatique 2024
3 pages
TP Pandas
Pas encore d'évaluation
TP Pandas
4 pages
TP1 Pandas Version Eleves
Pas encore d'évaluation
TP1 Pandas Version Eleves
4 pages
Analyse et Prétraitement de Données Python
Pas encore d'évaluation
Analyse et Prétraitement de Données Python
4 pages
Prétraitement des données sur R
Pas encore d'évaluation
Prétraitement des données sur R
12 pages
Annexe Pandas 2025
Pas encore d'évaluation
Annexe Pandas 2025
2 pages
Guide d'analyse de données avec Pandas
Pas encore d'évaluation
Guide d'analyse de données avec Pandas
8 pages
Introduction à Pandas en Python
Pas encore d'évaluation
Introduction à Pandas en Python
1 page
Annexe - Pandas F
Pas encore d'évaluation
Annexe - Pandas F
7 pages
Cours TP Pandas
Pas encore d'évaluation
Cours TP Pandas
9 pages
Test blanc Baccalauréat Informatique 2023
Pas encore d'évaluation
Test blanc Baccalauréat Informatique 2023
4 pages
Guide Pandas: Importation et Manipulation de Données
Pas encore d'évaluation
Guide Pandas: Importation et Manipulation de Données
13 pages
Annexe Pandas Final 2023 - 2
Pas encore d'évaluation
Annexe Pandas Final 2023 - 2
2 pages
Tp1 Pandas Corrigé
100% (1)
Tp1 Pandas Corrigé
10 pages
Exercice 2 - Pandas
Pas encore d'évaluation
Exercice 2 - Pandas
2 pages
Statistiques Descriptives Et Analyse de Données Avec Le Module Pandas
Pas encore d'évaluation
Statistiques Descriptives Et Analyse de Données Avec Le Module Pandas
10 pages
Manipulation et Visualisation de Données avec Pandas
Pas encore d'évaluation
Manipulation et Visualisation de Données avec Pandas
14 pages
CH 3
Pas encore d'évaluation
CH 3
44 pages
Examen Baccalauréat Informatique 2024
Pas encore d'évaluation
Examen Baccalauréat Informatique 2024
3 pages
Fonctions Clés de Pandas en Python
100% (1)
Fonctions Clés de Pandas en Python
44 pages
Analyse de données avec Pandas : TP1
Pas encore d'évaluation
Analyse de données avec Pandas : TP1
2 pages
Bac Pratique 22052024 Eco 11h
Pas encore d'évaluation
Bac Pratique 22052024 Eco 11h
3 pages
Les Méthodes Et Les Propriétés À Utiliser Avec La Bibliothèque Pandas
Pas encore d'évaluation
Les Méthodes Et Les Propriétés À Utiliser Avec La Bibliothèque Pandas
2 pages
2024 T Informatique
Pas encore d'évaluation
2024 T Informatique
61 pages
Traitement des données manquantes et aberrantes
Pas encore d'évaluation
Traitement des données manquantes et aberrantes
4 pages
6457c964180c4 Annexe 2023
Pas encore d'évaluation
6457c964180c4 Annexe 2023
2 pages
Python Data Science Handbook Belhadj-Alaa
Pas encore d'évaluation
Python Data Science Handbook Belhadj-Alaa
18 pages
Bac 2024 Sujet 3
Pas encore d'évaluation
Bac 2024 Sujet 3
5 pages
Rapport Du Projet de Programmation - Groupe5
Pas encore d'évaluation
Rapport Du Projet de Programmation - Groupe5
7 pages
Guide Pandas pour Débutants en Data
Pas encore d'évaluation
Guide Pandas pour Débutants en Data
10 pages
Considérons Cette Base de Donnée
Pas encore d'évaluation
Considérons Cette Base de Donnée
1 page
Créer un Tableau Statistique Efficace
Pas encore d'évaluation
Créer un Tableau Statistique Efficace
14 pages
2-Chap 2 Part 1-Macro Environnmenent PESTEL
Pas encore d'évaluation
2-Chap 2 Part 1-Macro Environnmenent PESTEL
37 pages
TP 4
Pas encore d'évaluation
TP 4
9 pages
Trouver TonPro Solution Innovante Pour Services À Domicile
Pas encore d'évaluation
Trouver TonPro Solution Innovante Pour Services À Domicile
24 pages
Trouver TonPro Solution Innovante Pour Services À Domicile
Pas encore d'évaluation
Trouver TonPro Solution Innovante Pour Services À Domicile
24 pages
JDBC
Pas encore d'évaluation
JDBC
12 pages
Trouver TonPro Solution Innovante Pour Services À Domicile
Pas encore d'évaluation
Trouver TonPro Solution Innovante Pour Services À Domicile
23 pages
Chapitre 4
Pas encore d'évaluation
Chapitre 4
31 pages
Trouver TonPro Solution Innovante Pour Services À Domicile
Pas encore d'évaluation
Trouver TonPro Solution Innovante Pour Services À Domicile
12 pages
Presentation Génie Logiciel
Pas encore d'évaluation
Presentation Génie Logiciel
9 pages
TP Analyse
Pas encore d'évaluation
TP Analyse
17 pages
Rapport Genie
Pas encore d'évaluation
Rapport Genie
34 pages
TP3 DM
Pas encore d'évaluation
TP3 DM
1 page
TP 4 Symfony
Pas encore d'évaluation
TP 4 Symfony
5 pages
Chapitre 6 Séance 10 23-04 ED ISIMA 2024 2025
Pas encore d'évaluation
Chapitre 6 Séance 10 23-04 ED ISIMA 2024 2025
13 pages
Avis de Recrutement Econome
Pas encore d'évaluation
Avis de Recrutement Econome
3 pages
Simulation Électrique avec VoltaSim
Pas encore d'évaluation
Simulation Électrique avec VoltaSim
19 pages
Python Cours 1
Pas encore d'évaluation
Python Cours 1
25 pages
Cours de Calcul Integral Et Equations Differentielles - PDF - Intégral - Fonction (Mathématiques)
Pas encore d'évaluation
Cours de Calcul Integral Et Equations Differentielles - PDF - Intégral - Fonction (Mathématiques)
42 pages
Vases D Expansion Flexcon
Pas encore d'évaluation
Vases D Expansion Flexcon
24 pages
3-Cours VPN IPSEC
100% (1)
3-Cours VPN IPSEC
94 pages
Exercices Fonctions de Deux Variables - Résultats
Pas encore d'évaluation
Exercices Fonctions de Deux Variables - Résultats
4 pages
Securite Logiciel
Pas encore d'évaluation
Securite Logiciel
28 pages
Etude de cas-SI Walmart
Pas encore d'évaluation
Etude de cas-SI Walmart
2 pages
Plan d'électricité et de masse R+2
Pas encore d'évaluation
Plan d'électricité et de masse R+2
1 page
La Informatique 2013
Pas encore d'évaluation
La Informatique 2013
107 pages
Partager Sur Twitter: Lettre de Motivation Stage Logistique Et Transports
100% (1)
Partager Sur Twitter: Lettre de Motivation Stage Logistique Et Transports
2 pages
Laboratoire Central Ponts et Chaussées : Recherche en Génie Civil
Pas encore d'évaluation
Laboratoire Central Ponts et Chaussées : Recherche en Génie Civil
1 page
Maintenance Corrective des Systèmes Biomédicaux
Pas encore d'évaluation
Maintenance Corrective des Systèmes Biomédicaux
4 pages
CV 2021-10-21 Jihen Hadfi
Pas encore d'évaluation
CV 2021-10-21 Jihen Hadfi
2 pages
Cps Merja
Pas encore d'évaluation
Cps Merja
98 pages
Redresseurs : Convertisseurs AC-DC en GE
Pas encore d'évaluation
Redresseurs : Convertisseurs AC-DC en GE
13 pages
Regles Realisation Branchement Collectif
Pas encore d'évaluation
Regles Realisation Branchement Collectif
15 pages
Différences entre sites statiques et dynamiques
100% (1)
Différences entre sites statiques et dynamiques
5 pages
Interfacage 0858809001316177433
Pas encore d'évaluation
Interfacage 0858809001316177433
7 pages
King Oil Tools Product Catalog
Pas encore d'évaluation
King Oil Tools Product Catalog
48 pages
FR J01.300.1 Edel 150 Air Manuel
Pas encore d'évaluation
FR J01.300.1 Edel 150 Air Manuel
36 pages
GRH de demain : défis et innovations
Pas encore d'évaluation
GRH de demain : défis et innovations
48 pages
Haythem Et Khalil
Pas encore d'évaluation
Haythem Et Khalil
15 pages
Université Catholique Au Congo: Sujet
Pas encore d'évaluation
Université Catholique Au Congo: Sujet
72 pages
Le béton: clé du développement ivoirien
Pas encore d'évaluation
Le béton: clé du développement ivoirien
10 pages
Recrutement Massif de QHSE
Pas encore d'évaluation
Recrutement Massif de QHSE
58 pages
Initiation Covadis-Mise A Jour
Pas encore d'évaluation
Initiation Covadis-Mise A Jour
28 pages
Utilisation Extincteurs
Pas encore d'évaluation
Utilisation Extincteurs
11 pages