Classification et évaluation des modèles

Le chapitre 3 traite de la classification, en utilisant le jeu de données MNIST pour former des classificateurs, notamment un classificateur binaire basé sur la descente stochastique. Il aborde les mesures de performance, telles que la validation croisée, les matrices de confusion, ainsi que des concepts comme la précision, le rappel et le compromis entre les deux. Enfin, il explore des techniques avancées comme la classification multi-classe, multi-label et l'analyse des erreurs.

Transféré par

Teophile Mbolo

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

28 vues5 pages

Classification et évaluation des modèles

Transféré par

Teophile Mbolo

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

CHAPITRE 3

CLASSIFICATION
I- MNIST
II- Formation d'un classificateur binaire
III- Mesures de performance
1) Mesurer la précision à l'aide de la validation croisée
2) Matrices de confusion
3) Précision et rappel
4) Le compromis précision/rappel
5) La courbe ROC
IV- Classification multi-classe
V- Analyse des erreurs
VI- Classification multi-label
VII- Classification des sorties multiples

I- MNIST
Nous utiliserons le jeu de données MNIST, qui est un ensemble de 70 000 petites images
de chiffres écrits à la main par des lycéens et des employés du bureau de recensement
américain. Chaque image est étiquetée avec le chiffre qu'elle représente.

II- Formation d'un classificateur binaire

Choisissons maintenant un classificateur et entraînons-le. Un bon point de départ est un

classificateur de descente stochastique (SGD, ou GD stochastique), utilisant la classe
SGDClassifier de Scikit-Learn. Ce classificateur est capable de traiter efficacement de très
grands ensembles de données. Cela s'explique en partie par le fait que SGD traite les
instances d'apprentissage de manière indépendante, une à la fois, ce qui rend SGD bien
adapté à l'apprentissage en ligne,

III- Mesures de performance

L'évaluation d'un classificateur est souvent beaucoup plus délicate que l'évaluation d'un
régresseur. Il existe de nombreuses mesures de performance.

6) Mesurer la précision à l'aide de la validation croisée

La séparation d’un jeu de données en un jeu d’entraînement et un jeu de test est

nécessairement arbitraire. Nous risquons ainsi d’avoir, par hasard, créé des jeux de
données qui ne sont pas représentatifs. Pour éviter cet écueil, il est souhaitable de
reproduire plusieurs fois la procédure, puis de moyenner les résultats obtenus afin de
moyenner ces effets aléatoires. Le cadre le plus classique pour ce faire est celui de la
validation croisée,
la précision n'est généralement pas la mesure de performance préférée pour les
classificateurs, en particulier lorsqu'il s'agit d'ensembles de données biaisées (c'est- à-dire
lorsque certaines classes sont beaucoup plus fréquentes que les autres). Une bien
meilleure façon d'évaluer les performances d'un classificateur est d'examiner la matrice
de confusion (CM).

7) Matrices de confusion

Comme nous l’avons vu, le nombre d’erreurs de classification permet d’évaluer la qualité
d’un modèle prédictif. Notons que l’on préférera généralement décrire le nombre
d’erreurs comme une fraction du nombre d’exemples : un taux d’erreur de 1 % est plus
parlant qu’un nombre absolu d’erreurs.

Mais toutes les erreurs ne se valent pas nécessairement. Prenons l’exemple d’un modèle
qui prédise si oui ou non une radiographie présente une tumeur inquiétante : une fausse
alerte, qui sera ensuite infirmée par des examens complémentaires, est moins
problématique que de ne pas déceler la tumeur et de ne pas traiter la personne
concernée. Les performances d’un modèle de classification, binaire comme multiclasse,
peuvent être résumée dans une matrice de confusion.

8) Précision et rappel

Il est possible de dériver de nombreux critères d’évaluation à partir de la matrice de

confusion. En voici quelques exemples :

Il est cependant très facile d’avoir un bon rappel en prédisant que tous les exemples sont
positifs. Ainsi, ce critère ne peut pas être utilisé seul. On lui adjoint ainsi souvent la
précision :
De même que l’on peut facilement avoir un très bon rappel au détriment de la précision,
il est aisé d’obtenir une bonne précision (au détriment du rappel) en faisant très peu de
prédictions positives (ce qui réduit le risque qu’elles soient erronées)

9) Le compromis précision/rappel
10)La courbe ROC
IV- Classification multi-classe
V- Analyse des erreurs
VI- Classification multi-label
VII- Classification des sorties multiples

Vous aimerez peut-être aussi

Évaluation des Modèles de Machine Learning
Pas encore d'évaluation
Évaluation des Modèles de Machine Learning
16 pages
Chapitre3 Part1 Classification
Pas encore d'évaluation
Chapitre3 Part1 Classification
45 pages
Evaluation Et Séléction Du Modèle 2
Pas encore d'évaluation
Evaluation Et Séléction Du Modèle 2
36 pages
Cours 2 IA App
Pas encore d'évaluation
Cours 2 IA App
22 pages
Régression vs Classification : Clés SEO
Pas encore d'évaluation
Régression vs Classification : Clés SEO
3 pages
DM Chapitre 02 Partie 02
Pas encore d'évaluation
DM Chapitre 02 Partie 02
70 pages
Introduction à la Classification Statistique
Pas encore d'évaluation
Introduction à la Classification Statistique
164 pages
Évaluer La Performance Du Modèle
Pas encore d'évaluation
Évaluer La Performance Du Modèle
14 pages
Indicateurs de Performance en Machine Learning
Pas encore d'évaluation
Indicateurs de Performance en Machine Learning
3 pages
Chapitre 5
Pas encore d'évaluation
Chapitre 5
20 pages
7-Mesures de Performances en Classification - 24-25 - CT
Pas encore d'évaluation
7-Mesures de Performances en Classification - 24-25 - CT
12 pages
Evaluation Des Modèles de ML
100% (1)
Evaluation Des Modèles de ML
32 pages
Cours Complet ML Mory - (Partie 1)
Pas encore d'évaluation
Cours Complet ML Mory - (Partie 1)
91 pages
Métriques et Validation en Apprentissage Machine
Pas encore d'évaluation
Métriques et Validation en Apprentissage Machine
1 page
Métriques D'évaluation
Pas encore d'évaluation
Métriques D'évaluation
23 pages
Évaluation des modèles en Machine Learning
Pas encore d'évaluation
Évaluation des modèles en Machine Learning
51 pages
Évaluation des modèles en apprentissage automatique
Pas encore d'évaluation
Évaluation des modèles en apprentissage automatique
6 pages
Catégorisation de Textes et Évaluation
Pas encore d'évaluation
Catégorisation de Textes et Évaluation
43 pages
Matrice de Confusion
100% (2)
Matrice de Confusion
2 pages
Chapitre6 Evaluation
Pas encore d'évaluation
Chapitre6 Evaluation
27 pages
Évaluez Un Algorithme de Classification Qui Retourne Des Valeurs Binaires - Evaluez Les Performances D'un Modele de Machine Learning - OpenClassrooms
Pas encore d'évaluation
Évaluez Un Algorithme de Classification Qui Retourne Des Valeurs Binaires - Evaluez Les Performances D'un Modele de Machine Learning - OpenClassrooms
5 pages
I. Comprendre Le Problème Et Les Données
Pas encore d'évaluation
I. Comprendre Le Problème Et Les Données
7 pages
Apprentissage Supervisé 1-2
Pas encore d'évaluation
Apprentissage Supervisé 1-2
21 pages
Cycle d'un projet de Machine Learning
Pas encore d'évaluation
Cycle d'un projet de Machine Learning
73 pages
Introduction à la Classification en ML
Pas encore d'évaluation
Introduction à la Classification en ML
38 pages
TP4 ML
Pas encore d'évaluation
TP4 ML
10 pages
Chapitre - MachineLearning - Arbre de Decison
Pas encore d'évaluation
Chapitre - MachineLearning - Arbre de Decison
31 pages
TP Scoring
Pas encore d'évaluation
TP Scoring
5 pages
Arbre Decision 2324 4p 12 22
Pas encore d'évaluation
Arbre Decision 2324 4p 12 22
11 pages
TD in
Pas encore d'évaluation
TD in
6 pages
Cours ML Mounira
100% (1)
Cours ML Mounira
131 pages
Chapitre 3 - Classification Supervisé
Pas encore d'évaluation
Chapitre 3 - Classification Supervisé
31 pages
5-Metriques Evaluation
Pas encore d'évaluation
5-Metriques Evaluation
18 pages
Classification et Régression Avancées
Pas encore d'évaluation
Classification et Régression Avancées
45 pages
Classification et Modèles de Données
Pas encore d'évaluation
Classification et Modèles de Données
34 pages
Chapitre 1m2r
Pas encore d'évaluation
Chapitre 1m2r
7 pages
Activité 3
Pas encore d'évaluation
Activité 3
3 pages
Chapitre 3 Apprentissage Supervisé - Classification
Pas encore d'évaluation
Chapitre 3 Apprentissage Supervisé - Classification
85 pages
Examen ML: Classification et Préparation
Pas encore d'évaluation
Examen ML: Classification et Préparation
6 pages
Chap Classification Prediction
Pas encore d'évaluation
Chap Classification Prediction
42 pages
Catégorisation de textes et apprentissage
Pas encore d'évaluation
Catégorisation de textes et apprentissage
41 pages
Introduction à la Classification en Data Mining
Pas encore d'évaluation
Introduction à la Classification en Data Mining
29 pages
Entraîner Un Modèle
100% (1)
Entraîner Un Modèle
16 pages
Classification Multi-Labels : Défis et Méthodes
Pas encore d'évaluation
Classification Multi-Labels : Défis et Méthodes
23 pages
Classification Et Évaluation
Pas encore d'évaluation
Classification Et Évaluation
52 pages
Med Yassine Tanabene Rapport TP2
Pas encore d'évaluation
Med Yassine Tanabene Rapport TP2
13 pages
Évaluation des modèles en Machine Learning
Pas encore d'évaluation
Évaluation des modèles en Machine Learning
3 pages
Matrice de confusion et performances K-NN
Pas encore d'évaluation
Matrice de confusion et performances K-NN
9 pages
Chap2 Classification
Pas encore d'évaluation
Chap2 Classification
34 pages
Classification K-NN et Régression Linéaire
Pas encore d'évaluation
Classification K-NN et Régression Linéaire
12 pages
Partie Metriiques
Pas encore d'évaluation
Partie Metriiques
2 pages
Perfamance
Pas encore d'évaluation
Perfamance
5 pages
TD 3
Pas encore d'évaluation
TD 3
10 pages
Guide des Algorithmes de Classification
Pas encore d'évaluation
Guide des Algorithmes de Classification
2 pages
Fondements de l'apprentissage machine
Pas encore d'évaluation
Fondements de l'apprentissage machine
12 pages
Introduction à l'apprentissage supervisé
Pas encore d'évaluation
Introduction à l'apprentissage supervisé
32 pages
Metrics ML
100% (1)
Metrics ML
74 pages
Introduction à l'apprentissage supervisé KPPV
100% (1)
Introduction à l'apprentissage supervisé KPPV
25 pages
Introduction au Machine Learning et Deep Learning
Pas encore d'évaluation
Introduction au Machine Learning et Deep Learning
36 pages
Eva H4 5eme
Pas encore d'évaluation
Eva H4 5eme
3 pages
E 5 AB2
Pas encore d'évaluation
E 5 AB2
2 pages
3emeseq4 LB Ntui 20-21
Pas encore d'évaluation
3emeseq4 LB Ntui 20-21
2 pages
Projet de Statuts Aaeln
Pas encore d'évaluation
Projet de Statuts Aaeln
9 pages
EPR 1ERE A4 Correction
Pas encore d'évaluation
EPR 1ERE A4 Correction
4 pages
BD 2022 21 Conception Physiquekkaaaaafafk
Pas encore d'évaluation
BD 2022 21 Conception Physiquekkaaaaafafk
48 pages
Epreuve Theorique D'Informatque
Pas encore d'évaluation
Epreuve Theorique D'Informatque
2 pages
l2 s1 Micros3-1çggggggggggggggtttggtttttttt
Pas encore d'évaluation
l2 s1 Micros3-1çggggggggggggggtttggtttttttt
3 pages
6eme DS3
Pas encore d'évaluation
6eme DS3
2 pages
5eme DS3
Pas encore d'évaluation
5eme DS3
2 pages
Epreuve Theorique D'Informatque
Pas encore d'évaluation
Epreuve Theorique D'Informatque
4 pages
BD 2022 15 Production Du Schema de La BD
Pas encore d'évaluation
BD 2022 15 Production Du Schema de La BD
39 pages
Evaluation N°3 Epreuve Theorique D'Informatique Nom de L'Eleve
Pas encore d'évaluation
Evaluation N°3 Epreuve Theorique D'Informatique Nom de L'Eleve
2 pages
BD 2022 19 Analyse Conceptuelle
Pas encore d'évaluation
BD 2022 19 Analyse Conceptuelle
177 pages
BD 2022 13 Modele EA de Base
Pas encore d'évaluation
BD 2022 13 Modele EA de Base
39 pages
Évaluation Informatique Terminale A4 2024
Pas encore d'évaluation
Évaluation Informatique Terminale A4 2024
2 pages
4eme DS3
Pas encore d'évaluation
4eme DS3
2 pages
Eval 4 Pa LB Ntui 24-25
Pas encore d'évaluation
Eval 4 Pa LB Ntui 24-25
2 pages
BD 2022 08 SQL DML
Pas encore d'évaluation
BD 2022 08 SQL DML
58 pages
Chapitre 2 Projet D'apprentissage Automatique de Bout en Bout
Pas encore d'évaluation
Chapitre 2 Projet D'apprentissage Automatique de Bout en Bout
3 pages
SEQ3 TleCD
Pas encore d'évaluation
SEQ3 TleCD
3 pages
Algorithme et Sécurité Informatique
Pas encore d'évaluation
Algorithme et Sécurité Informatique
2 pages
5 Eme
Pas encore d'évaluation
5 Eme
1 page
INFO 2nde A4 - Eval N°3 - 2024-2025
Pas encore d'évaluation
INFO 2nde A4 - Eval N°3 - 2024-2025
4 pages
INFO PA - Eval N°3 - 2024-2025
Pas encore d'évaluation
INFO PA - Eval N°3 - 2024-2025
4 pages
Parcours d'un Ingénieur Innovant
Pas encore d'évaluation
Parcours d'un Ingénieur Innovant
1 page
l3 Gestion Memoire
Pas encore d'évaluation
l3 Gestion Memoire
67 pages
Proiect 4 - Les Nombres de 1 À 10.
100% (2)
Proiect 4 - Les Nombres de 1 À 10.
4 pages
Carte Me, Tale Francais 5 PDF
Pas encore d'évaluation
Carte Me, Tale Francais 5 PDF
1 page
Épreuve de mathématiques 5e - Juin 2021
Pas encore d'évaluation
Épreuve de mathématiques 5e - Juin 2021
2 pages
Intelligence Artificielle Dans L'éducation
Pas encore d'évaluation
Intelligence Artificielle Dans L'éducation
3 pages
Fiche Leçon APC 6ème Et 5ème BAT
Pas encore d'évaluation
Fiche Leçon APC 6ème Et 5ème BAT
207 pages
TP Godet 02
Pas encore d'évaluation
TP Godet 02
2 pages
P Memo Maths-1
Pas encore d'évaluation
P Memo Maths-1
2 pages
Constante Macabre
Pas encore d'évaluation
Constante Macabre
2 pages
Narramus : Apprendre à Raconter en Classe
100% (1)
Narramus : Apprendre à Raconter en Classe
21 pages
Comparaison sociale et réussite scolaire
Pas encore d'évaluation
Comparaison sociale et réussite scolaire
15 pages
Hepia
Pas encore d'évaluation
Hepia
4 pages
TD Symétrie Centrale
Pas encore d'évaluation
TD Symétrie Centrale
2 pages
Renseignement Scout
Pas encore d'évaluation
Renseignement Scout
3 pages
Demande de Formation Professionnelle
Pas encore d'évaluation
Demande de Formation Professionnelle
1 page
Fraude Concours
Pas encore d'évaluation
Fraude Concours
40 pages
Eduscol - Les Dilemmes Moraux
Pas encore d'évaluation
Eduscol - Les Dilemmes Moraux
4 pages
Tchaikovsky Danse-Des-Mirlitons FL 1 PDF
100% (1)
Tchaikovsky Danse-Des-Mirlitons FL 1 PDF
1 page
Schema Narratif
Pas encore d'évaluation
Schema Narratif
5 pages
Emplois-S1-2022 Actualisé - XLSX - SMPC-S1-AVF
Pas encore d'évaluation
Emplois-S1-2022 Actualisé - XLSX - SMPC-S1-AVF
1 page
La MP en Bref
100% (1)
La MP en Bref
13 pages
Exemple de Plan de Formation
0% (1)
Exemple de Plan de Formation
1 page
Progressions Harmonisée Premier Cycle - 2024 - 2025
Pas encore d'évaluation
Progressions Harmonisée Premier Cycle - 2024 - 2025
67 pages
Compo 3 Maths 3è ABC Ross 24-25
Pas encore d'évaluation
Compo 3 Maths 3è ABC Ross 24-25
1 page
Esthétique et critique de l'art en Licence 2
Pas encore d'évaluation
Esthétique et critique de l'art en Licence 2
2 pages
Théorie de l'Autodétermination et Contrôle
Pas encore d'évaluation
Théorie de l'Autodétermination et Contrôle
242 pages
Emploi du temps L3 Économie 2024-2025
Pas encore d'évaluation
Emploi du temps L3 Économie 2024-2025
1 page
Formation Électricien en Alternance
Pas encore d'évaluation
Formation Électricien en Alternance
4 pages
Acquisition du français par locuteurs boulou
Pas encore d'évaluation
Acquisition du français par locuteurs boulou
4 pages