0% ont trouvé ce document utile (0 vote)

248 vues3 pages

TP: EDA et Prétraitement des Données

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

248 vues3 pages

TP: EDA et Prétraitement des Données

Transféré par

Jamila Hamdi

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Matière : Enseignante de TP:

Machine Learning Jamila HAMDI

Niveau : L3DSI1,
L3DSI2
Année universitaire:
2024/2025

TP 1: Analyse exploratoire et Prétraitement des données

L'objectif principal de ce TP est de couvrir les étapes impliquées dans le prétraitement

des données et les différentes étapes de l'analyse exploratoire des données (EDA), qui
est une étape essentielle de toute analyse de recherche. Le prétraitement des données
et l'EDA sont des étapes fondamentales qui suivent la collecte des données.

1. Analyse exploratoire des données (EDA)

Techniquement, le principal objectif de l'EDA est de:

 Examiner la distribution des données

 Gestion des valeurs manquantes de l'ensemble de données (un problème très

courant avec chaque ensemble de données)

 Gestion des valeurs aberrantes

 Suppression des données en double

 Codage des variables catégorielles

 Normalisation et mise à l'échelle

Nous utiliserons un ensemble de données du « World Happiness», qui contient les

colonnes suivantes : Country, Region, Happiness Rank, Happiness Score, Standard
Error, Economy (GDP per Capita), Family, Health (Life Expectancy), Freedom, Trust
(Government Corruption), Generosity zt Dystopia Residual. pour décrire dans
quelle mesure ces facteurs contribuent à évaluer le bonheur.

Il comporte 158 instances décrites par 12 attributs.

 Importez les bibliothèques Pandas, Numpy, Matplotlib et Seaborn.
 Chargez le jeu de données «World [Link] » dans une variable
nommée df1, en utilisant la fonction read_csv() de la bibliothèque
pandas.

Pour explorer le dataset, exécutez les taches suivantes.

 Afficher les cinq premières lignes.

 Essayer d' avoir des informations de votre dataframe telles que le nom de la
colonne, le nombre de valeurs non nulles de nos colonnes, le type de
données et l'utilisation de la mémoire.

 Essayez de visualiser dans la console les noms des attributs.

 Essayez de savoir le nombre des lignes et des colonnes du dataframe df1.
 Afficher les caractéristiques statistiques de base de chaque caractéristique
numérique (types int64 et float64) : nombre de valeurs non manquantes,
moyenne, écart type, plage, médiane, quartiles 0,25, 0,50, 0,75.

2. prétraitement des données

Pour prétraiter le données, exécutez les taches suivantes.

 vérifier si les données contiennent une valeur nulle ou non.

 S'il y a des valeurs manquantes, essayer de le traiter en les remplaçant par
la valeur médiane.
 Vérifier l'existence de valeurs en double dans notre ensemble de données.
 Vérifier si les données contiennent valeurs aberrantes.
 S'il y a des valeurs aberrantes, essayer de le traiter.
 Trouver la corrélation par paires entre les différentes colonnes de
données.

2
3

Vous aimerez peut-être aussi

Chapitre2 PCA
Pas encore d'évaluation
Chapitre2 PCA
36 pages
Exercice 1
Pas encore d'évaluation
Exercice 1
2 pages
Questions Methode Simplexe
Pas encore d'évaluation
Questions Methode Simplexe
4 pages
Chapitre2 - Atelier UML Vers Java Avec Correction
Pas encore d'évaluation
Chapitre2 - Atelier UML Vers Java Avec Correction
7 pages
In551 TD3 1
Pas encore d'évaluation
In551 TD3 1
9 pages
Compilation Serie5 Corrige
Pas encore d'évaluation
Compilation Serie5 Corrige
17 pages
E S 'E N, U M E: S P: Prog. Orientée Objet Date Janvier 2017 Enseignant Chiheb-Eddine Ben N'Cir Durée 2h
Pas encore d'évaluation
E S 'E N, U M E: S P: Prog. Orientée Objet Date Janvier 2017 Enseignant Chiheb-Eddine Ben N'Cir Durée 2h
6 pages
Types construits en Python : tuples et listes
Pas encore d'évaluation
Types construits en Python : tuples et listes
35 pages
Correction SQL : Usines, Produits, Fournisseurs
Pas encore d'évaluation
Correction SQL : Usines, Produits, Fournisseurs
5 pages
Optimisation par Essaims Particuliers
Pas encore d'évaluation
Optimisation par Essaims Particuliers
2 pages
Introduction à la régression linéaire
Pas encore d'évaluation
Introduction à la régression linéaire
71 pages
Exercices Corrigés de Langage SQL - Langage SQL, MP, PSI Et La TSI, ECT, ECS, PDF
Pas encore d'évaluation
Exercices Corrigés de Langage SQL - Langage SQL, MP, PSI Et La TSI, ECT, ECS, PDF
11 pages
Devoir Libre
Pas encore d'évaluation
Devoir Libre
10 pages
TP 1 A Rendre
Pas encore d'évaluation
TP 1 A Rendre
6 pages
Examen Systèmes d'Exploitation LMD S5
Pas encore d'évaluation
Examen Systèmes d'Exploitation LMD S5
7 pages
Atelier Recap Abdelkader
Pas encore d'évaluation
Atelier Recap Abdelkader
17 pages
TP Poo TP2
100% (1)
TP Poo TP2
2 pages
TD4 Par Contraintes
Pas encore d'évaluation
TD4 Par Contraintes
3 pages
Algorithme k-NN : Concepts et Applications
Pas encore d'évaluation
Algorithme k-NN : Concepts et Applications
32 pages
Exercices
100% (1)
Exercices
4 pages
Série 1
Pas encore d'évaluation
Série 1
1 page
Exercices Java: Classes Étudiant et Disque
Pas encore d'évaluation
Exercices Java: Classes Étudiant et Disque
8 pages
TD Maziz Asma Master I VA 2
Pas encore d'évaluation
TD Maziz Asma Master I VA 2
4 pages
Exo Perceptron
100% (1)
Exo Perceptron
1 page
TD1 Et TD2 Semaphore Corrigés
Pas encore d'évaluation
TD1 Et TD2 Semaphore Corrigés
7 pages
TD UML 1 2 3 4 Corriges
Pas encore d'évaluation
TD UML 1 2 3 4 Corriges
14 pages
Création et gestion de types de meubles
Pas encore d'évaluation
Création et gestion de types de meubles
9 pages
Algorithme de Colonie de Fourmis 2 FSTF PDF
Pas encore d'évaluation
Algorithme de Colonie de Fourmis 2 FSTF PDF
40 pages
Graphes et Algorithmes en Python
Pas encore d'évaluation
Graphes et Algorithmes en Python
2 pages
Apport D Activites: Aboudi Mohamed Ali
Pas encore d'évaluation
Apport D Activites: Aboudi Mohamed Ali
19 pages
Préparation et Transformation de Données pour Analyses Statistiques
100% (1)
Préparation et Transformation de Données pour Analyses Statistiques
2 pages
java-TP4 Array - Correction
Pas encore d'évaluation
java-TP4 Array - Correction
6 pages
Guide des Sémaphores en Informatique
Pas encore d'évaluation
Guide des Sémaphores en Informatique
14 pages
DDB Exams
50% (2)
DDB Exams
9 pages
Partiel Nfa018 2012 Corrige
Pas encore d'évaluation
Partiel Nfa018 2012 Corrige
8 pages
Corr TP3
Pas encore d'évaluation
Corr TP3
20 pages
A Poly BDR 2010
Pas encore d'évaluation
A Poly BDR 2010
36 pages
QCM
Pas encore d'évaluation
QCM
7 pages
Correction TD SQL pour étudiants ISIMM
Pas encore d'évaluation
Correction TD SQL pour étudiants ISIMM
10 pages
Introduction aux Piles et Files en Python
0% (1)
Introduction aux Piles et Files en Python
5 pages
Examen TP Python Avril 2021 - Sujet2 Ma Version
Pas encore d'évaluation
Examen TP Python Avril 2021 - Sujet2 Ma Version
2 pages
Programmation ADN et Cryptographie Python
100% (1)
Programmation ADN et Cryptographie Python
4 pages
Devoir - IRT41 - Technologies Web - 2021
100% (1)
Devoir - IRT41 - Technologies Web - 2021
3 pages
1 Traitement D Image
Pas encore d'évaluation
1 Traitement D Image
36 pages
M2 ESEM Sys - Tmps - Réel
Pas encore d'évaluation
M2 ESEM Sys - Tmps - Réel
4 pages
TP3 Gestion Bibliotheque
100% (2)
TP3 Gestion Bibliotheque
2 pages
Apache Tez Theorique
Pas encore d'évaluation
Apache Tez Theorique
3 pages
TP C++
Pas encore d'évaluation
TP C++
54 pages
KNN Régression : Analyse Auto-MPG et Évaluation des Modèles
Pas encore d'évaluation
KNN Régression : Analyse Auto-MPG et Évaluation des Modèles
2 pages
TD N°1 D'algorithmique Avancée
Pas encore d'évaluation
TD N°1 D'algorithmique Avancée
1 page
Instructions MIPS et Traductions C
Pas encore d'évaluation
Instructions MIPS et Traductions C
6 pages
OCL pour Systèmes de Gestion
Pas encore d'évaluation
OCL pour Systèmes de Gestion
2 pages
Examen 2018-2019
Pas encore d'évaluation
Examen 2018-2019
13 pages
Piles et Files : Concepts et Implémentations
Pas encore d'évaluation
Piles et Files : Concepts et Implémentations
28 pages
TPE Logique Floue
Pas encore d'évaluation
TPE Logique Floue
24 pages
TD7 Corrige
Pas encore d'évaluation
TD7 Corrige
4 pages
Data Mining CAH
Pas encore d'évaluation
Data Mining CAH
18 pages
TP 1: Analyse Exploratoire Et Prétraitement Des Données
Pas encore d'évaluation
TP 1: Analyse Exploratoire Et Prétraitement Des Données
4 pages
TP2 - Python
Pas encore d'évaluation
TP2 - Python
4 pages
Traitement Des Données Avec Python
Pas encore d'évaluation
Traitement Des Données Avec Python
24 pages
Corrélation de Pearson vs Matrice de Corrélation
Pas encore d'évaluation
Corrélation de Pearson vs Matrice de Corrélation
1 page
Act3 1
Pas encore d'évaluation
Act3 1
6 pages
DEvoir de Synthese1 3STI 2024
100% (1)
DEvoir de Synthese1 3STI 2024
7 pages
Exercices 3SC 2022 2023
Pas encore d'évaluation
Exercices 3SC 2022 2023
17 pages
Procedure
100% (1)
Procedure
5 pages
Test Technique (DEEP LEARNING)
Pas encore d'évaluation
Test Technique (DEEP LEARNING)
3 pages
Module 1
100% (1)
Module 1
23 pages
Méthodologie de la dissertation juridique
Pas encore d'évaluation
Méthodologie de la dissertation juridique
13 pages
La Philomene Seraphique Partie Premiere
Pas encore d'évaluation
La Philomene Seraphique Partie Premiere
473 pages
Comprendre les lieux de vie en géographie
Pas encore d'évaluation
Comprendre les lieux de vie en géographie
2 pages
Cours 3 - 1 - Conflits Cognitifs Et Sociocognitifs - MD
Pas encore d'évaluation
Cours 3 - 1 - Conflits Cognitifs Et Sociocognitifs - MD
17 pages
Stage en comptabilité - Hajar Mouad
Pas encore d'évaluation
Stage en comptabilité - Hajar Mouad
1 page
Enquête Sur Le Comportement Du Consommateur Tunisien Sur Internet
Pas encore d'évaluation
Enquête Sur Le Comportement Du Consommateur Tunisien Sur Internet
43 pages
Kevin Lynch : Urbanisme et Perception des Villes
Pas encore d'évaluation
Kevin Lynch : Urbanisme et Perception des Villes
4 pages
IE et Logistique Internationale: Symposium
Pas encore d'évaluation
IE et Logistique Internationale: Symposium
11 pages
Calculs de solutions chimiques et concentrations
Pas encore d'évaluation
Calculs de solutions chimiques et concentrations
2 pages
TP Compte Rendu
Pas encore d'évaluation
TP Compte Rendu
10 pages
De La Sécularisation Laïque Par Le Salafisme Séculier
100% (1)
De La Sécularisation Laïque Par Le Salafisme Séculier
28 pages
Jounin - Voyage de Classe - Chapitre1
Pas encore d'évaluation
Jounin - Voyage de Classe - Chapitre1
25 pages
Mycologie
Pas encore d'évaluation
Mycologie
59 pages
Algorythme N°66 PDF
100% (2)
Algorythme N°66 PDF
8 pages
Cap 45
Pas encore d'évaluation
Cap 45
34 pages
Auto Hypnose Ondes Binaurales Giula Bath
100% (4)
Auto Hypnose Ondes Binaurales Giula Bath
33 pages
Dimensionnement et Calculs de Semelle Isolée
Pas encore d'évaluation
Dimensionnement et Calculs de Semelle Isolée
6 pages
4M CH 1 Activité 1 Référentiel1
Pas encore d'évaluation
4M CH 1 Activité 1 Référentiel1
1 page
Dépistage du Cancer du Sein à Sfax
Pas encore d'évaluation
Dépistage du Cancer du Sein à Sfax
51 pages
Électromagnétisme 2e Année MP-MP PC-PC PSI-PS PDF
100% (1)
Électromagnétisme 2e Année MP-MP PC-PC PSI-PS PDF
274 pages
CRISTALLOGRAPHIE-CRISTALLOCHIMIE-SOLUTION-SERIE-N°1 - S4 - SMC-SMP-15-16-Pr BRITEL
100% (4)
CRISTALLOGRAPHIE-CRISTALLOCHIMIE-SOLUTION-SERIE-N°1 - S4 - SMC-SMP-15-16-Pr BRITEL
30 pages
Du Système Linguistique Aux Actions Langagières. Mélanges en L'honneur D'alain Berrendonner
Pas encore d'évaluation
Du Système Linguistique Aux Actions Langagières. Mélanges en L'honneur D'alain Berrendonner
630 pages
Structure de l'ENSAB
Pas encore d'évaluation
Structure de l'ENSAB
1 page
TD de Cours GPS
Pas encore d'évaluation
TD de Cours GPS
4 pages
Simulation Des Fonctions Logiques de Base
100% (1)
Simulation Des Fonctions Logiques de Base
2 pages
Cours D'organisation de Chantier
0% (1)
Cours D'organisation de Chantier
12 pages
Math2A TD6 Corrige
Pas encore d'évaluation
Math2A TD6 Corrige
5 pages
Emploi Du Temps Agro 21 09 2025
Pas encore d'évaluation
Emploi Du Temps Agro 21 09 2025
12 pages
Syntaxe, Cours No6
Pas encore d'évaluation
Syntaxe, Cours No6
8 pages