0% ont trouvé ce document utile (0 vote)

440 vues5 pages

Classification Et Évaluation: Objectif Du TP 4

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

440 vues5 pages

Classification Et Évaluation: Objectif Du TP 4

Transféré par

Medilyass Elhamdaoui

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Machine learning TP 4 2022/2023

Classification et évaluation

Objectif du TP 4 :

• Appliquer l’algorithme KNN en tant que technique transductive.

• Appliquer les algorithmes arbre de décision, Naive Bayes, SVM et la régression

logistique.

• Evaluation des modèles de classification : Recall, precision, Accuracy, F1 mesure et

matrice de confusion.

• Visualisaation avec yeloowbrick.

• Traiter le problème de déséquilibre des données.

Travail à faire : Nous allons appliquer plusieurs algorithmes de Machine learning supervisé
pour des objectifs de classification sur le dataset diabètes. La deuxième étape consiste à
évaluer ces modèles.

A. Répartition en données d’apprentissage et données de test

Dans toutes les techniques de prédiction, il est obligatoire de répartir tout d’abord la dataset
en deux parties : la première pour la création du model ou d'apprentissage et la deuxième
pour le test.

1. Charger les bibliothèques essentielles :

2. Charger votre dataset diabets.csv dans la dataframe datadiabetes :

data_diabetes = pd.read_csv('diabetes.csv ', sep=',',index_col=None, header=0)

3. Détecter la variable à expliquer Y (target) et les variables explicatives X dans votre

dataset.
4. Répartir vos données en X_train, Y_train et X_test et Y_test.
• from sklearn.model_selection import train_test_split
Pr. N. Daoudi
Machine learning TP 4 2022/2023

• X_train, X_test, Y_train, Y_test = train_test_split(X,Y,

test_size=0.3)

B. Classification par les k-plus proches voisins : KNN

La documentation Scikit learn sur les k-NN est disponible sur http://scikit-learn.org
stable/modules /neighbors.html
1. Entrainer un classifieur des k plus proches voisins (avec k = 15) sur ce jeu de
donné (Le choix du paramètre k est parmi les principales difficultés de K-NN) :

2. Pour évaluer le modèle, il faut l’utiliser tout d’abord prédire lla target pour X_test :
Y_predKNN=model_KNN.predict(X_test)
3. Evaluation du modèle :
3.1 La matrice de confusion : from sklearn.metrics import confusion_matrix

3.2 Calculer les différentes mesures de performances du classifieur crée et en donner

l’interprétation.

4. Utiliser classification_report. Qu’est-ce que vous avez obtenu ?

5. Afficher la courbe ROC. Commenter.

Pr. N. Daoudi
Machine learning TP 4 2022/2023

6. Proposer une façon pour choisir la meilleure valeur de K.

C. Visualisation avec yellowbrick

Yellowbrick est une bibliothèque de visualisation qui facilite la lecture des résultats de
l'évaluation des modèles et leur comparaison.

• Elle permet l’affichage du Rapport de classification, Matrice de confusion, la courbre

ROCAUC, les courbes de précision-rappel pour différents seuils de probabilité. Elle
permet également de detecter visuellement l'équilibre des classes, Erreur de
prédiction de classe (alternative à la matrice de confusion qui montre à la fois le
support et la différence entre les classes réelles et prédites.) et Seuil de discrimination
(affiche la précision, le rappel, f1 et le taux de file d'attente (queue rate) sur tous les
seuils pour les classificateurs binaires qui utilisent une probabilité ou un score de
discrimination.)

1. Utiliser yellowbrick pour afficher le rapport de cassification :

Pr. N. Daoudi
Machine learning TP 4 2022/2023

2. A quoi peut servir ClassePredictionError ?

3. Afficher la courbe de ROC avec yellowbrick et intérpréter le résultat.

D. Classification : Arbre de décision

La classification en apprentissage automatique peut se faire par l’algorithme Arbre de décision

disponible sous Scikit learn via DecisionTreeClassifier :

from sklearn.tree import DecisionTreeClassifier.

Cet algorithme dispose de plusieurs paramètres, notamment :

• min_samples_split qui indique qu’un sommet ne peut être segmenté s’il est composé
de moins de min_samples_split individus.
• min_samples_leaf qui indique qu’une segmentation n’est validée que si et seulement
si les feuilles générées comportent tous au moins min_samples_leaf observations.
• max_depth : la profondeur maximale de l’arbre.
• Criterion : c’est le critère qui permet de mesurer la qualité d'un split. Les critères pris
en charge sont « gini » pour l'impureté de Gini et « entropie » pour le gain
d'informations. par défaut="gini".
1. Entrainer un classifieur arbre de décision sur le même dataset.
2. Evaluer le modèle selon les différentes mesures de performances du classifieur
crée. Interpréter vos résultats
3. Utiliser classification_report.
4. Visualiser l’arbre obtenu :

5. Comparer le modèle KNN et le modèle arbre de décision.

Pr. N. Daoudi
Machine learning TP 4 2022/2023

E. Création d’autres modèles :

1. Refaire les questions de 1 à 4 pour les algorithmes Naive bayes, SVM, Modèle
régression logistique.

2. Proposer une manière pour comparer l’ensemble des modèles.

F. Données déséquilibrées : imbalanced data

1. Oversampling
1.1 Utiliser SMOTE comme technique oversampling pour équilibrer les données.

1.2 Reprendre le modèle SVM.

1.3 Evaluer les modèle.
2. Utilisation du paramétre class_weight
2.1 Reprendre le modèle SVM en précisant class_weight
2.2 Reprendre le modèle et l’évaluer.
2.3 comparer les résultats.
3. Undersampling

3.1 Reprendre le modèle SVM.

1.3 Evaluer les modèle.
4. Comparer les résultats.

Pr. N. Daoudi

Vous aimerez peut-être aussi

TP6 SVM
Pas encore d'évaluation
TP6 SVM
4 pages
TP4 ClassificationSupervisée Student
Pas encore d'évaluation
TP4 ClassificationSupervisée Student
11 pages
tp2 IA ML (ML) VxAli
Pas encore d'évaluation
tp2 IA ML (ML) VxAli
7 pages
TP4: Apprentissage Supervisé en IA
Pas encore d'évaluation
TP4: Apprentissage Supervisé en IA
5 pages
Validation croisée et réglage hyperparamètres
Pas encore d'évaluation
Validation croisée et réglage hyperparamètres
4 pages
TP7 KMeans
Pas encore d'évaluation
TP7 KMeans
4 pages
TP Machine Learning: Régression, KNN, Arbres
100% (1)
TP Machine Learning: Régression, KNN, Arbres
4 pages
Corr TP2
Pas encore d'évaluation
Corr TP2
19 pages
Arbre de décision en Data Mining avec Python
100% (1)
Arbre de décision en Data Mining avec Python
6 pages
Prédiction de Crédit avec IA
Pas encore d'évaluation
Prédiction de Crédit avec IA
29 pages
TP 5 Machine Learning
Pas encore d'évaluation
TP 5 Machine Learning
10 pages
TP: Arbres de Décision en ML
Pas encore d'évaluation
TP: Arbres de Décision en ML
6 pages
Chapitre 3 Apprentissage Supervisé - Classification
Pas encore d'évaluation
Chapitre 3 Apprentissage Supervisé - Classification
85 pages
Exercice de régression linéaire en Python
Pas encore d'évaluation
Exercice de régression linéaire en Python
2 pages
Support de TP 1 V1
Pas encore d'évaluation
Support de TP 1 V1
6 pages
Pretraitement Des Donnees
100% (1)
Pretraitement Des Donnees
27 pages
Prétraitement Des Données en Python
Pas encore d'évaluation
Prétraitement Des Données en Python
10 pages
03-Apprentissage Automatique
Pas encore d'évaluation
03-Apprentissage Automatique
63 pages
Correction TD1
Pas encore d'évaluation
Correction TD1
8 pages
TP Regression
Pas encore d'évaluation
TP Regression
5 pages
Chapitre2 Exploration, Nettoyage Et Préparation Des Données
Pas encore d'évaluation
Chapitre2 Exploration, Nettoyage Et Préparation Des Données
56 pages
TP 1
Pas encore d'évaluation
TP 1
6 pages
TD Machine Regression Python
Pas encore d'évaluation
TD Machine Regression Python
3 pages
Notions Clés du Machine Learning
Pas encore d'évaluation
Notions Clés du Machine Learning
18 pages
K Plus Proches Voisions K-Nearest Neighbors KNN: Mme Hiba Lahmer 2020/2021
Pas encore d'évaluation
K Plus Proches Voisions K-Nearest Neighbors KNN: Mme Hiba Lahmer 2020/2021
14 pages
Correction TD1 Partie 1
Pas encore d'évaluation
Correction TD1 Partie 1
16 pages
Ydeep Learning Course Part 1
Pas encore d'évaluation
Ydeep Learning Course Part 1
31 pages
TP3 IngSI
100% (1)
TP3 IngSI
5 pages
Classifieur Naïf de Bayes
100% (1)
Classifieur Naïf de Bayes
37 pages
TP 1 - Initiation À La ML
Pas encore d'évaluation
TP 1 - Initiation À La ML
2 pages
CM4 KNN
Pas encore d'évaluation
CM4 KNN
38 pages
Exercice 1: Classification Avec L'algorithme Des K Plus Proches Voisins (K-NN)
100% (1)
Exercice 1: Classification Avec L'algorithme Des K Plus Proches Voisins (K-NN)
7 pages
SVM Machine À Vecteurs Du Support
Pas encore d'évaluation
SVM Machine À Vecteurs Du Support
37 pages
Corr TP3
Pas encore d'évaluation
Corr TP3
20 pages
TP-K-Means Clustering: Exemple de Resultat Trouve Pour K 2
Pas encore d'évaluation
TP-K-Means Clustering: Exemple de Resultat Trouve Pour K 2
1 page
Chapit 1 ML L3 IRS
Pas encore d'évaluation
Chapit 1 ML L3 IRS
38 pages
Exemple Corrigé Examen Deep Learning 12 - 02 - 2024 by Nouhaila
Pas encore d'évaluation
Exemple Corrigé Examen Deep Learning 12 - 02 - 2024 by Nouhaila
7 pages
5 Régression Logistique Et Algorithmes de Classification
100% (1)
5 Régression Logistique Et Algorithmes de Classification
49 pages
Rapport v1
100% (1)
Rapport v1
36 pages
Machine Learning Cours Complet
Pas encore d'évaluation
Machine Learning Cours Complet
2 pages
Optimisation des Hyperparamètres en ML
Pas encore d'évaluation
Optimisation des Hyperparamètres en ML
39 pages
Rapport 1 Final
Pas encore d'évaluation
Rapport 1 Final
75 pages
Cours Machine Learning
Pas encore d'évaluation
Cours Machine Learning
204 pages
Introduction au Data Mining et Data Warehousing
100% (2)
Introduction au Data Mining et Data Warehousing
28 pages
Introduction au Machine Learning et IA
Pas encore d'évaluation
Introduction au Machine Learning et IA
63 pages
Rapport PFE Fake News 20200720
Pas encore d'évaluation
Rapport PFE Fake News 20200720
56 pages
Presentation KNN
Pas encore d'évaluation
Presentation KNN
11 pages
Exemple Rapport Projet
100% (1)
Exemple Rapport Projet
44 pages
Tps Regression Machine Leraning
Pas encore d'évaluation
Tps Regression Machine Leraning
5 pages
Apprentissage Supervisé - Introduction - vf23
Pas encore d'évaluation
Apprentissage Supervisé - Introduction - vf23
44 pages
TD Machine Learning
Pas encore d'évaluation
TD Machine Learning
39 pages
00 - Support de Cours - DL & Transfert LEarning1
Pas encore d'évaluation
00 - Support de Cours - DL & Transfert LEarning1
152 pages
TP3 - SVM-23-24
Pas encore d'évaluation
TP3 - SVM-23-24
3 pages
Cours Datamining: Techniques et Processus
100% (1)
Cours Datamining: Techniques et Processus
49 pages
Traitement Image 2
Pas encore d'évaluation
Traitement Image 2
74 pages
TP Sur Regression Logistique
Pas encore d'évaluation
TP Sur Regression Logistique
4 pages
Data Mining
Pas encore d'évaluation
Data Mining
36 pages
Classification Des Fleurs Avec KNN Et Évaluation Des Performances
Pas encore d'évaluation
Classification Des Fleurs Avec KNN Et Évaluation Des Performances
14 pages
TP2 Decision Trees 23 24
Pas encore d'évaluation
TP2 Decision Trees 23 24
4 pages
Projet Ia
Pas encore d'évaluation
Projet Ia
19 pages
Traitement des données manquantes et aberrantes
Pas encore d'évaluation
Traitement des données manquantes et aberrantes
4 pages
Encodage Et Normalisation Des Données
Pas encore d'évaluation
Encodage Et Normalisation Des Données
3 pages
Cours de Thermodynamique MPSI
88% (26)
Cours de Thermodynamique MPSI
40 pages
Résolution Systèmes Complexes et Groupes
Pas encore d'évaluation
Résolution Systèmes Complexes et Groupes
2 pages
C++ - Classes, Instances, Objets (Oo) Exercices Résolus
Pas encore d'évaluation
C++ - Classes, Instances, Objets (Oo) Exercices Résolus
6 pages
Rôles et Autorisations dans SAP
Pas encore d'évaluation
Rôles et Autorisations dans SAP
32 pages
SONASID Stage Dinitiation
Pas encore d'évaluation
SONASID Stage Dinitiation
46 pages
Rapport de Stage Pfe Le Haw
Pas encore d'évaluation
Rapport de Stage Pfe Le Haw
22 pages
Catalogue Accessoires Radio Amateur Syntoniae Radio Communications
100% (3)
Catalogue Accessoires Radio Amateur Syntoniae Radio Communications
104 pages
L'alimentation Des Moteurs Diesel
100% (1)
L'alimentation Des Moteurs Diesel
7 pages
Oberflex - Ekosound Et Microsound
Pas encore d'évaluation
Oberflex - Ekosound Et Microsound
8 pages
Materiel Didactique Requis Pour L'option
Pas encore d'évaluation
Materiel Didactique Requis Pour L'option
2 pages
Patrimoine Littéraire Numérisé
Pas encore d'évaluation
Patrimoine Littéraire Numérisé
273 pages
Petites Habitudes Grandes Réussites Extrait
Pas encore d'évaluation
Petites Habitudes Grandes Réussites Extrait
27 pages
TD1 New BA 1 (DDC) 24 - 25 A
Pas encore d'évaluation
TD1 New BA 1 (DDC) 24 - 25 A
4 pages
PHQ404 A4
Pas encore d'évaluation
PHQ404 A4
195 pages
Corrigé - Mini-Session Tle Séq. 5
Pas encore d'évaluation
Corrigé - Mini-Session Tle Séq. 5
4 pages
Notes 2024 HA03L3S1
Pas encore d'évaluation
Notes 2024 HA03L3S1
4 pages
Avis d'Arrivée Navire Denis A
Pas encore d'évaluation
Avis d'Arrivée Navire Denis A
1 page
Profil RNE de SOCIETE M.C.I. au 08/02/2024
Pas encore d'évaluation
Profil RNE de SOCIETE M.C.I. au 08/02/2024
2 pages
Liebherr LTM 1030-2.1
Pas encore d'évaluation
Liebherr LTM 1030-2.1
12 pages
Chap - 3-LECON - 12 - UTLILISER UN NAVIGATEUR INTERNET
Pas encore d'évaluation
Chap - 3-LECON - 12 - UTLILISER UN NAVIGATEUR INTERNET
2 pages
Portail Casino
Pas encore d'évaluation
Portail Casino
21 pages
Horaires Aleop 333 Du 29-6-2024 Au 31-8-2024
Pas encore d'évaluation
Horaires Aleop 333 Du 29-6-2024 Au 31-8-2024
2 pages
Compte Rendu de Réunion Du CABANG 09042022.
Pas encore d'évaluation
Compte Rendu de Réunion Du CABANG 09042022.
7 pages
Rapport Concours D'agrégation 2017-Option Gestion PDF
Pas encore d'évaluation
Rapport Concours D'agrégation 2017-Option Gestion PDF
49 pages
Dugny : Dynamisme et Verdure aux Portes de Paris
Pas encore d'évaluation
Dugny : Dynamisme et Verdure aux Portes de Paris
4 pages
Titrage d'un mélange d'acides
Pas encore d'évaluation
Titrage d'un mélange d'acides
2 pages
Les Législations Environnementales Des Pays de L'espace OHADA Et
Pas encore d'évaluation
Les Législations Environnementales Des Pays de L'espace OHADA Et
28 pages
Les Classiques
Pas encore d'évaluation
Les Classiques
13 pages
التسيير العمومي الجديد كآلية لتحسين حكامة مؤسسات القطاع العام
Pas encore d'évaluation
التسيير العمومي الجديد كآلية لتحسين حكامة مؤسسات القطاع العام
15 pages
1ere ANNEE
Pas encore d'évaluation
1ere ANNEE
13 pages
Eco-Parc Fare Fenua
Pas encore d'évaluation
Eco-Parc Fare Fenua
45 pages