Data Pre Processing Fin

Le prétraitement des données est crucial pour garantir la qualité et la pertinence des données avant leur utilisation en analyse ou modélisation. Plusieurs outils de la bibliothèque sklearn en Python, tels que LabelEncoder, OrdinalEncoder, LabelBinarizer, OneHotEncoder, MinMaxScaler et StandardScaler, sont utilisés pour transformer et normaliser les données. Ces techniques permettent de convertir des étiquettes catégorielles en valeurs numériques et de mettre à l'échelle les caractéristiques pour les rendre compatibles avec les algorithmes d'apprentissage automatique.

Transféré par

thereselaetitiantomb

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

10 vues7 pages

Data Pre Processing Fin

Transféré par

thereselaetitiantomb

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

VIDEO 22 : DATA PRE-PROCESSING :

Le prétraitement des données, ou data preprocessing en anglais, désigne l'ensemble des

opérations visant à préparer et à nettoyer les données avant leur utilisation dans des tâches d'analyse ou
de modélisation. C'est une étape essentielle dans le processus d'analyse des données, car elle permet
d'assurer la qualité, la cohérence et la pertinence des données utilisées pour des tâches telles que la
modélisation prédictive, l'apprentissage automatique, ou l'analyse statistique.

LabelEncoder : LabelEncoder se trouve couramment dans la bibliothèque sklearn en Python, et elle est
utilisée pour convertir des étiquettes de classes catégorielles en valeurs numériques. Cela permet de
représenter les catégories de manière à ce qu'elles soient compatibles avec les algorithmes
d'apprentissage automatique qui traitent des variables numériques. En d'autres termes, elle transforme
les étiquettes de classes textuelles en valeurs numériques.

Figure 1:LabelEncoder avec la methode fit_Transform

Il existe une méthode inverse_transform qui encode chaque classe de la variable y en une valeur
numérique , elle permet de décoder les données .

Figure 2: Inverse_transform
OrdinalEncoder ; est exactement comme le transformer LabelEncoder mais se charge de traiter
plusieurs variables à la fois.
LabelBinarizer : est une classe disponible dans la bibliothèque scikit-learn en Python. Elle est
couramment utilisée pour la conversion d'étiquettes de classe catégorielles en représentations binaires.

Figure 3:LabelBinarizer compresse

OneHotEncoder : est une classe fournie par la bibliothèque scikit-learn en Python, et elle est
utilisée pour convertir des variables catégorielles en une représentation binaire (« one-hot vector »).

Figure 4:OneHotEncoder
MinMaxScaler : est une classe de la bibliothèque scikit-learn en Python, utilisée pour mettre à
l'échelle les caractéristiques (features) dans une plage spécifique après leur transformation. Cette classe
opère en mettant les caractéristiques à l'échelle de manière à être comprises dans une plage spécifique,
généralement entre 0 et 1
StandardScaler: est une classe fournie par la bibliothèque scikit-learn en Python. Elle est utilisée pour
mettre à l'échelle les caractéristiques (features) de telle sorte qu'elles aient une moyenne nulle et un
écart type égal à un.

Figure 5: StandardScaler

Vous aimerez peut-être aussi

Encodage Et Normalisation Des Données
Pas encore d'évaluation
Encodage Et Normalisation Des Données
3 pages
Cour ML
Pas encore d'évaluation
Cour ML
107 pages
Q2
Pas encore d'évaluation
Q2
6 pages
Traitement des Données Catégorielles en ML
Pas encore d'évaluation
Traitement des Données Catégorielles en ML
8 pages
Chapitre 3 - Concepts de Basescsds
Pas encore d'évaluation
Chapitre 3 - Concepts de Basescsds
13 pages
Chapitre 2 Le Pr-Traitement Des Donn-Es en Machine Learning
100% (1)
Chapitre 2 Le Pr-Traitement Des Donn-Es en Machine Learning
68 pages
Seance 1
Pas encore d'évaluation
Seance 1
26 pages
CH IV Applications 24
Pas encore d'évaluation
CH IV Applications 24
45 pages
Analyse de Données IA avec Python
Pas encore d'évaluation
Analyse de Données IA avec Python
22 pages
Support TP DataPreprocessing
100% (1)
Support TP DataPreprocessing
2 pages
Quiz Data Mining : Techniques et Concepts
Pas encore d'évaluation
Quiz Data Mining : Techniques et Concepts
3 pages
TP 1regression
Pas encore d'évaluation
TP 1regression
4 pages
Chapitre 2 Préparation Des Données
Pas encore d'évaluation
Chapitre 2 Préparation Des Données
49 pages
Ai TP1 2024
Pas encore d'évaluation
Ai TP1 2024
5 pages
Pretraitement Des Donnees
100% (1)
Pretraitement Des Donnees
27 pages
Activité 2
Pas encore d'évaluation
Activité 2
4 pages
Classifieur Cancersein
Pas encore d'évaluation
Classifieur Cancersein
5 pages
Apprentissage Supervisé 1-2
Pas encore d'évaluation
Apprentissage Supervisé 1-2
21 pages
Prédiction de Crédit avec IA
Pas encore d'évaluation
Prédiction de Crédit avec IA
29 pages
Cours - Introduction - Cnam - UE RCP208
Pas encore d'évaluation
Cours - Introduction - Cnam - UE RCP208
41 pages
Aur ®lien G ®ron Hands On Machine Learning With Scikit Learn, Keras
Pas encore d'évaluation
Aur ®lien G ®ron Hands On Machine Learning With Scikit Learn, Keras
28 pages
Pipelines
Pas encore d'évaluation
Pipelines
26 pages
Mini Projet ML
Pas encore d'évaluation
Mini Projet ML
1 page
Fiche TP4
Pas encore d'évaluation
Fiche TP4
4 pages
Chapitre 2 Préparation Des Données
Pas encore d'évaluation
Chapitre 2 Préparation Des Données
39 pages
Chapitre 1m2r
Pas encore d'évaluation
Chapitre 1m2r
7 pages
Outils Python Pour La Data Science (PDFDrive)
Pas encore d'évaluation
Outils Python Pour La Data Science (PDFDrive)
26 pages
Résumé ML
Pas encore d'évaluation
Résumé ML
5 pages
Support
Pas encore d'évaluation
Support
17 pages
Nettoyage et Transformation des Données
100% (1)
Nettoyage et Transformation des Données
14 pages
Formation en Matlab Programmation Orientée
Pas encore d'évaluation
Formation en Matlab Programmation Orientée
8 pages
Préparer des Données avec Python
Pas encore d'évaluation
Préparer des Données avec Python
44 pages
TP Scoring
Pas encore d'évaluation
TP Scoring
5 pages
TD4 - MLPreparation Des Données
Pas encore d'évaluation
TD4 - MLPreparation Des Données
5 pages
7.1. TP Reconnaissance de Chiffres Avec Scikit-Learn - Outils Numériques Avancés en Mécanique
Pas encore d'évaluation
7.1. TP Reconnaissance de Chiffres Avec Scikit-Learn - Outils Numériques Avancés en Mécanique
10 pages
Rapport ML (1) COLETTE
Pas encore d'évaluation
Rapport ML (1) COLETTE
19 pages
Bibliothèques Et Packages Python Pour La Science Des Données
Pas encore d'évaluation
Bibliothèques Et Packages Python Pour La Science Des Données
5 pages
Introduction à l'Apprentissage Statistique et Réseaux de Neurones
Pas encore d'évaluation
Introduction à l'Apprentissage Statistique et Réseaux de Neurones
28 pages
Exemple IQ MOYENNE Ecarttype
Pas encore d'évaluation
Exemple IQ MOYENNE Ecarttype
18 pages
TD 3
Pas encore d'évaluation
TD 3
12 pages
FR Tanagra Orange DM Python
Pas encore d'évaluation
FR Tanagra Orange DM Python
11 pages
03 Classification
Pas encore d'évaluation
03 Classification
79 pages
Scikit-learn : Tutoriel d'Apprentissage Statistique avec Python
Pas encore d'évaluation
Scikit-learn : Tutoriel d'Apprentissage Statistique avec Python
11 pages
Resume ML
Pas encore d'évaluation
Resume ML
7 pages
Examen ML
Pas encore d'évaluation
Examen ML
6 pages
TP3 DM
Pas encore d'évaluation
TP3 DM
7 pages
TD2
Pas encore d'évaluation
TD2
8 pages
Logistic Regression As A Neural Network
Pas encore d'évaluation
Logistic Regression As A Neural Network
20 pages
Formation Python : Analyse de Données
Pas encore d'évaluation
Formation Python : Analyse de Données
4 pages
Introduction au Deep Learning avec Keras
Pas encore d'évaluation
Introduction au Deep Learning avec Keras
15 pages
Steps To Complete A Machine Learning
Pas encore d'évaluation
Steps To Complete A Machine Learning
11 pages
Importantaussi-Fr Tanagra Scikit Learn Decision Tree
Pas encore d'évaluation
Importantaussi-Fr Tanagra Scikit Learn Decision Tree
24 pages
Cours Complet ML Mory - (Partie 1)
Pas encore d'évaluation
Cours Complet ML Mory - (Partie 1)
91 pages
Science des Données avec Python
Pas encore d'évaluation
Science des Données avec Python
39 pages
TP1 Compréhension Et Préparation Des Données
Pas encore d'évaluation
TP1 Compréhension Et Préparation Des Données
5 pages
Recettes Python pour la Science des Données
Pas encore d'évaluation
Recettes Python pour la Science des Données
4 pages
TD2 - Planification Reseaux Mobile - DR BAVOUA
Pas encore d'évaluation
TD2 - Planification Reseaux Mobile - DR BAVOUA
39 pages
Vo IP
Pas encore d'évaluation
Vo IP
21 pages
Chapitre 3
Pas encore d'évaluation
Chapitre 3
11 pages
Fiche de Rev 1
Pas encore d'évaluation
Fiche de Rev 1
2 pages
Bronchite Chronique
Pas encore d'évaluation
Bronchite Chronique
14 pages
Chimie Analytique Minérale-Bac2 Chimie V2-1
Pas encore d'évaluation
Chimie Analytique Minérale-Bac2 Chimie V2-1
190 pages
BCH 211 Chromato-1
100% (1)
BCH 211 Chromato-1
6 pages
Évaluation Module IV Vérification de La Mise en Œuvre Du SG-SST - Révision de La Tentative 4
Pas encore d'évaluation
Évaluation Module IV Vérification de La Mise en Œuvre Du SG-SST - Révision de La Tentative 4
12 pages
CV Ouidad Ammar
Pas encore d'évaluation
CV Ouidad Ammar
1 page
POO Projet 2
Pas encore d'évaluation
POO Projet 2
6 pages
Carte Touristique Pyrénées-Orientales
0% (2)
Carte Touristique Pyrénées-Orientales
2 pages
Outils d'analyse stratégique en management
100% (1)
Outils d'analyse stratégique en management
39 pages
Mycoflor 2014
Pas encore d'évaluation
Mycoflor 2014
16 pages
Physique-Chimie BCPST : Concepts Clés
Pas encore d'évaluation
Physique-Chimie BCPST : Concepts Clés
5 pages
Évaluation Des Préfixes Et Des Suffixes 3e Année
Pas encore d'évaluation
Évaluation Des Préfixes Et Des Suffixes 3e Année
3 pages
Upper Body Maison Romane Kov
Pas encore d'évaluation
Upper Body Maison Romane Kov
23 pages
Évolution et Défis du Transport Aérien
Pas encore d'évaluation
Évolution et Défis du Transport Aérien
2 pages
Algorithmes d'Exclusion Mutuelle
Pas encore d'évaluation
Algorithmes d'Exclusion Mutuelle
36 pages
R1 04 Chap1 - Intro
Pas encore d'évaluation
R1 04 Chap1 - Intro
47 pages
Seminaire SolarWorld - COGEPRA 25-04-2015
Pas encore d'évaluation
Seminaire SolarWorld - COGEPRA 25-04-2015
35 pages
CONTROLVENT Coffret Relayage
Pas encore d'évaluation
CONTROLVENT Coffret Relayage
6 pages
DLS5 01 FR PDF
Pas encore d'évaluation
DLS5 01 FR PDF
2 pages
Exposé TICE CRMEF
Pas encore d'évaluation
Exposé TICE CRMEF
16 pages
Rapport Stage Tunicotex
Pas encore d'évaluation
Rapport Stage Tunicotex
10 pages
Fsjes Fes
Pas encore d'évaluation
Fsjes Fes
15 pages
Cours 4.5. Tce 2024-2025
Pas encore d'évaluation
Cours 4.5. Tce 2024-2025
4 pages
Kit Complet
Pas encore d'évaluation
Kit Complet
10 pages
Location de Voiture
100% (1)
Location de Voiture
5 pages
Poursuite de Gesca Contre Sophie Durocher Pour Atteinte À La Réputation
Pas encore d'évaluation
Poursuite de Gesca Contre Sophie Durocher Pour Atteinte À La Réputation
40 pages
Chess Results List
Pas encore d'évaluation
Chess Results List
4 pages
1 Un Coproprietaire Peut Il Demander La Resiliation Du Bail D Un Locataire 34482
Pas encore d'évaluation
1 Un Coproprietaire Peut Il Demander La Resiliation Du Bail D Un Locataire 34482
3 pages
Calculs de pH et constantes d'acidité
Pas encore d'évaluation
Calculs de pH et constantes d'acidité
4 pages
Résumé SI - Chapitre 1 - Notions de Base
Pas encore d'évaluation
Résumé SI - Chapitre 1 - Notions de Base
8 pages