3 Evaluation

Le document traite de l'évaluation des modèles de machine learning, en mettant l'accent sur la minimisation de l'erreur de généralisation à travers des méthodes comme la validation croisée et le bootstrap. Il présente également des critères de performance pour évaluer les modèles, tels que la matrice de confusion, le rappel, la précision, et les courbes ROC et Précision-Rappel. L'objectif est de sélectionner le modèle avec la meilleure performance prédictive sur des ensembles de données équilibrés.

Transféré par

Abdelghaffour Mouhsine

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

32 vues5 pages

3 Evaluation

Transféré par

Abdelghaffour Mouhsine

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Université Sidi Mohamed Ben Abdellah Université Sidi Mohamed Ben Abdellah

Faculté des Sciences et Techniques Faculté des Sciences et Techniques

Département d’Informatique Département d’Informatique

Evaluation des modèles

Machine Learning
Pr. Jamal Kharroubi
de machine learning

Rappel Rappel
 Soit X = {x1, x2, .., xn } un ensemble de vecteurs de m  L’objectif est de trouver une fonction fd dans l’espace de hypothèses

et Y = {y1, y2, .., yn} l’ensemble des étiquettes de X respectivement Fd qui a le risque empirique minimal.
 Cette minimisation de risque empirique est estimée sur l’ensemble
 Soit f: X Y
d’apprentissage
xi yi
 Se fier à l’erreur obtenue sur les données d’apprentissage est une très
 L’ensemble A = { (xi, yi) pour i =1, .., n) } représente l ’ensemble
mauvaise stratégie parce que cette erreur est souvent trop faible voir
d’apprentissage
nulle
 Solution : choisir le modèle qui a l’erreur de généralisation minimale

1
Erreur de généralisation Erreur de généralisation minimal
 Soit l’ensemble D un jeu de données. Pour la mise en place d’un bon  Comment sélectionner ce modèle qui a l’erreur de généralisation
modèle de ML, on divise cet ensemble en deux ensembles disjoints minimale ?
 A : l’ensemble d’apprentissage ( en général, 2/3 des données)  En mettant en place, un bon protocole expérimental
 T : l’ensemble de test (en général, 1/3 des données)
 Diviser l’ensemble des données D en des ensembles A et T équilibrés (Dans le
 Le modèle est construit sur l’ensemble A avec un risque empirique sens où toutes les variations existantes soient présentes dans les deux
minimal (le taux d’erreur est trop faible) ensembles et avec la même proportion)

 Le modèle est testé sur l’ensemble T. L’erreur obtenue sur cet ensemble  Utiliser un ensemble de validation si c’est possible

est l’erreur de généralisation  Tester le maximum des espaces d’hypothèses possibles

 Le meilleur modèle est celui qui l’erreur de généralisation minimale

Validation croisée (Cross Validation) Bootstrap

 Diviser le jeu de données en K ensembles disjoint équilibrées  Le bootstrap est la procédure qui consiste à construire K ensemble
 Faire l’apprentissage sur (K-1) ensembles et le test sur l’ensemble qui d’apprentissage A1, A2, .. , AK en tirant aléatoirement n échantillon du
reste jeu de données D avec remplacement.
 Chaque échantillon peut apparaitre plusieurs fois ou pas du tout dans
les Ai
 L’évaluation des performances des modèles se fait sur l’intégralité
 Le meilleur choix est de prendre K = 3 des données (tout l’ensemble D)
 Permet de tester le modèle sur tout le jeu de données

2
Bootstrap Critères de performance
 Les résultats obtenus sont un peu biaisées à cause de la présence des  Il existe plusieurs façons d’évaluer la performance prédictive d’un
données d’apprentissage dans l’ensemble de test modèle d’apprentissage supervisé
 Pour y remédier :  Matrice de confusion : C’est une matrice qui représente les classes
 On peut se limiter au test au données D \ Ai réelles par rapport aux classes prédites
 Choisir un n = Card(Ai) infiniment petit par rapport Card(D)
Classe réelle
 Cette méthode d’échantillonnage est très peu utilisé en pratique parce C1 C2 ... Ck
C1 NB(C1,C1) NB(C1,C2) ... NB(C1,Ck)
qu’elle jugée trop complexe en terme de temps de calcul et en besoin Classe
prédite C2 NB(C2,C1) NB(C2,C2) ... NB(C2,Ck)

de mémoire ... ... ... ... ...

Ck NB(Ck,C1) NB(Ck,C2) ... NB(Ck,Ck)

Critères de performance Critères de performance

 Matrice de confusion : Cas binaire  Matrice de confusion : Cas binaire
 Autre mesure de performance à partir de la matrice de confusion :
Classe réelle
-1 1  Rappel (Recall ou sensitivity) :
Classe -1 TN FN
Prédite
𝑇𝑃
1 FP TP
𝑇𝑃 + 𝐹𝑁
 TN : True Negative
 Précision (Positive Predictive Value PPV) :
 FN : False Negative
𝑇𝑃
 TP : True Positive 𝑇𝑃 + 𝐹𝑃
 FP : False Positive

3
Critères de performance Critères de performance
 F-mesure (F-Score) la moyenne de la précision et du rappel:  Soit l’exemple des scores obtenus en classement binaire sur 20
2 ∗ 𝑇𝑃 échantillons (10 positifs et 10 négatifs) suivant :
𝐹=
2 ∗ 𝑇𝑃 + 𝐹𝑃 + 𝐹𝑁
 Sur les données Positifs

 Spécificité : 0,9 0,8 0,9 0,2 0,7 0,3 0,6 0,7 0,5 0,4

𝑇𝑁
𝑇𝑁 + 𝐹𝑃  Sur les données négatifs
0,2 0,7 0,3 0,2 0,5 0,4 0,7 0,1 0,6 0,3

Critères de performance Critères de performance

 La courbe ROC  La courbe Précision-Rappel
< 00/10 , 00/10 > < 00/10 , ------- >
< 00/10 , 02/10 > < 02/10 , 02/02 >
< 00/10 , 03/10 > < 03/10 , 03/03 >
< 02/10 , 05/10 > < 05/10 , 05/07 >
< 03/10 , 06/10 > < 06/10 , 06/09 >

Précision
TPR

< 04/10 , 07/10 > < 07/10 , 07/11 >

< 05/10 , 08/10 > < 08/10 , 08/13 >
< 07/10 , 09/10 > < 09/10 , 09/16 >
< 09/10 , 10/10 > < 10/10 , 10/19 >
< 10/10 , 10/10 > < 10/10 , 10/20 >

FPR Rappel

4
Critères de performance
 La courbe DET (Detection Error Tradeoff)
< 10/10 , 00/10 >
< 08/10 , 00/10 >
< 07/10 , 00/10 >
< 05/10 , 02/10 >
< 04/10 , 03/10 >
FNR

< 03/10 , 04/10 >

< 02/10 , 05/10 >
< 01/10 , 07/10 >
< 00/10 , 09/10 >
< 00/10 , 10/10 >

FPR

Vous aimerez peut-être aussi

Evaluation Et Séléction Du Modèle 2
Pas encore d'évaluation
Evaluation Et Séléction Du Modèle 2
36 pages
Évaluation des Modèles de Machine Learning
Pas encore d'évaluation
Évaluation des Modèles de Machine Learning
16 pages
Cours Complet ML Mory - (Partie 1)
Pas encore d'évaluation
Cours Complet ML Mory - (Partie 1)
91 pages
Défis et Solutions en Apprentissage Automatique
Pas encore d'évaluation
Défis et Solutions en Apprentissage Automatique
38 pages
Arbre Decision 2324 4p 12 22
Pas encore d'évaluation
Arbre Decision 2324 4p 12 22
11 pages
Cours ML Mounira
100% (1)
Cours ML Mounira
131 pages
Chap02.concepts Apprentissage
Pas encore d'évaluation
Chap02.concepts Apprentissage
58 pages
Corrigé D'un Examen de Machine Learning S4 Génie MIS
100% (1)
Corrigé D'un Examen de Machine Learning S4 Génie MIS
25 pages
Chap02.Concepts Apprentissage
Pas encore d'évaluation
Chap02.Concepts Apprentissage
64 pages
Chapitre 2 - Apprentissage Et Classification
Pas encore d'évaluation
Chapitre 2 - Apprentissage Et Classification
47 pages
Chapitre - MachineLearning - Arbre de Decison
Pas encore d'évaluation
Chapitre - MachineLearning - Arbre de Decison
31 pages
Évaluation des modèles en Machine Learning
Pas encore d'évaluation
Évaluation des modèles en Machine Learning
51 pages
Chapitre 5
Pas encore d'évaluation
Chapitre 5
20 pages
Introduction à la Data Science et ML
Pas encore d'évaluation
Introduction à la Data Science et ML
61 pages
Cours de Data Mining en Statistiques Appliquées
100% (1)
Cours de Data Mining en Statistiques Appliquées
117 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
7 pages
Chap02.Concepts - Apprentissage (Avec Annotations)
Pas encore d'évaluation
Chap02.Concepts - Apprentissage (Avec Annotations)
50 pages
Introduction à l'apprentissage automatique
Pas encore d'évaluation
Introduction à l'apprentissage automatique
29 pages
DM2 - 14 10 2024
Pas encore d'évaluation
DM2 - 14 10 2024
110 pages
Cours - Apprentissage Statistique
100% (1)
Cours - Apprentissage Statistique
24 pages
Apprentissage Statistique en Ingénierie Mathématique
Pas encore d'évaluation
Apprentissage Statistique en Ingénierie Mathématique
24 pages
Apprentissage Supervisé 1-2
Pas encore d'évaluation
Apprentissage Supervisé 1-2
21 pages
Examen ML: Classification et Préparation
Pas encore d'évaluation
Examen ML: Classification et Préparation
6 pages
7-Mesures de Performances en Classification - 24-25 - CT
Pas encore d'évaluation
7-Mesures de Performances en Classification - 24-25 - CT
12 pages
Corrigé Examen Data Mining 2019
Pas encore d'évaluation
Corrigé Examen Data Mining 2019
3 pages
Evaluation Des Modèles de ML
100% (1)
Evaluation Des Modèles de ML
32 pages
01 RN Modele Lineaire
Pas encore d'évaluation
01 RN Modele Lineaire
37 pages
Exam 2024
Pas encore d'évaluation
Exam 2024
5 pages
TP Sur Regression Logistique
Pas encore d'évaluation
TP Sur Regression Logistique
4 pages
Entraîner Un Modèle
100% (1)
Entraîner Un Modèle
16 pages
Introduction à l'apprentissage supervisé
Pas encore d'évaluation
Introduction à l'apprentissage supervisé
32 pages
Évaluer La Performance Du Modèle
Pas encore d'évaluation
Évaluer La Performance Du Modèle
14 pages
Introduction à la fouille de données
Pas encore d'évaluation
Introduction à la fouille de données
83 pages
Introduction à la fouille de données
Pas encore d'évaluation
Introduction à la fouille de données
16 pages
DM Chapitre 02 Partie 02
Pas encore d'évaluation
DM Chapitre 02 Partie 02
70 pages
ML Motivation SelectionduModele French
Pas encore d'évaluation
ML Motivation SelectionduModele French
47 pages
Techniques d'Apprentissage Déséquilibré
Pas encore d'évaluation
Techniques d'Apprentissage Déséquilibré
12 pages
Chapitre6 Evaluation
Pas encore d'évaluation
Chapitre6 Evaluation
27 pages
Classification Et Évaluation
Pas encore d'évaluation
Classification Et Évaluation
52 pages
Cour 2
Pas encore d'évaluation
Cour 2
3 pages
Chapitre 3 - Classification Supervisé
Pas encore d'évaluation
Chapitre 3 - Classification Supervisé
31 pages
ML Foundation
Pas encore d'évaluation
ML Foundation
4 pages
ML Motivation ApprentissatgeStat French
Pas encore d'évaluation
ML Motivation ApprentissatgeStat French
37 pages
K plus proches voisins : TP et exercices R
Pas encore d'évaluation
K plus proches voisins : TP et exercices R
10 pages
Indicateurs de Performance en Machine Learning
Pas encore d'évaluation
Indicateurs de Performance en Machine Learning
3 pages
Évaluation des modèles en apprentissage automatique
Pas encore d'évaluation
Évaluation des modèles en apprentissage automatique
6 pages
Intelligence-Artificielle 25 Cours
Pas encore d'évaluation
Intelligence-Artificielle 25 Cours
19 pages
Introduction à l'apprentissage supervisé
Pas encore d'évaluation
Introduction à l'apprentissage supervisé
49 pages
Activité 3
Pas encore d'évaluation
Activité 3
3 pages
I. Comprendre Le Problème Et Les Données
Pas encore d'évaluation
I. Comprendre Le Problème Et Les Données
7 pages
Cours de Machine Learning2
Pas encore d'évaluation
Cours de Machine Learning2
44 pages
Introduction à l'apprentissage automatique
Pas encore d'évaluation
Introduction à l'apprentissage automatique
74 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
49 pages
TD N°3
Pas encore d'évaluation
TD N°3
2 pages
Machine Learning
Pas encore d'évaluation
Machine Learning
63 pages
Machine - Learning - Classification
Pas encore d'évaluation
Machine - Learning - Classification
34 pages
Introduction au Machine Learning avec R
Pas encore d'évaluation
Introduction au Machine Learning avec R
47 pages
Examen Master 2 ISEFAR : Classification Data-Mining
Pas encore d'évaluation
Examen Master 2 ISEFAR : Classification Data-Mining
3 pages
CM 6: Parcours de Graphes
Pas encore d'évaluation
CM 6: Parcours de Graphes
27 pages
TD N°1: Manipulation D'arbres Binaires ABR Et AVL en Version Itérative
Pas encore d'évaluation
TD N°1: Manipulation D'arbres Binaires ABR Et AVL en Version Itérative
10 pages
Resume Data Mining
Pas encore d'évaluation
Resume Data Mining
7 pages
Visa - 2025-09-24T19-29 Transaction #25
Pas encore d'évaluation
Visa - 2025-09-24T19-29 Transaction #25
1 page
Visa - 2025-09-23T23-44 Transaction #23
Pas encore d'évaluation
Visa - 2025-09-23T23-44 Transaction #23
1 page
Travaux Pratiques: Implémentation D'arbres Binaires, ABR Et AVL en Java
Pas encore d'évaluation
Travaux Pratiques: Implémentation D'arbres Binaires, ABR Et AVL en Java
6 pages
Machine Learning: Pr. Jamal Kharroubi
Pas encore d'évaluation
Machine Learning: Pr. Jamal Kharroubi
15 pages
Partie 2
Pas encore d'évaluation
Partie 2
22 pages
K Means DBSCAN
Pas encore d'évaluation
K Means DBSCAN
14 pages
DT RF
Pas encore d'évaluation
DT RF
10 pages
Planche Pierre Brute
Pas encore d'évaluation
Planche Pierre Brute
3 pages
Nouveau Document Microsoft Word
Pas encore d'évaluation
Nouveau Document Microsoft Word
1 page
Etudier en Italie
Pas encore d'évaluation
Etudier en Italie
57 pages
Français Niv1 P4 Sem1 Séance4 Drive
Pas encore d'évaluation
Français Niv1 P4 Sem1 Séance4 Drive
66 pages
Traumatismes parentaux et relations amoureuses
Pas encore d'évaluation
Traumatismes parentaux et relations amoureuses
2 pages
Épreuve Danse Bac 2023 : Guide Candidat
Pas encore d'évaluation
Épreuve Danse Bac 2023 : Guide Candidat
6 pages
AMECAP
Pas encore d'évaluation
AMECAP
1 page
Préparation Rentrée P3
Pas encore d'évaluation
Préparation Rentrée P3
54 pages
Canevas de programmation 1ère année
Pas encore d'évaluation
Canevas de programmation 1ère année
2 pages
Histoire Mondiale: 15e Siècle à Nos Jours
Pas encore d'évaluation
Histoire Mondiale: 15e Siècle à Nos Jours
17 pages
Méthodologie pour les évaluations communes
Pas encore d'évaluation
Méthodologie pour les évaluations communes
17 pages
Formation Efficace À L Écoute de L Course Content
Pas encore d'évaluation
Formation Efficace À L Écoute de L Course Content
2 pages
Fiche Lean Management Responsable
Pas encore d'évaluation
Fiche Lean Management Responsable
3 pages
Aux Champs Projet Tronc Commun
Pas encore d'évaluation
Aux Champs Projet Tronc Commun
67 pages
Bulletin 4eme Hum Electricite - 053416
Pas encore d'évaluation
Bulletin 4eme Hum Electricite - 053416
1 page
Citations LANGSPACE
Pas encore d'évaluation
Citations LANGSPACE
8 pages
Éducation familiale et identité enfantine
Pas encore d'évaluation
Éducation familiale et identité enfantine
26 pages
Gestion Carrière Enseignant-Chercheur Algérien
Pas encore d'évaluation
Gestion Carrière Enseignant-Chercheur Algérien
22 pages
Profil de Céline Spina : Éducation et Vente
Pas encore d'évaluation
Profil de Céline Spina : Éducation et Vente
1 page
Questions de compréhension orale et écrite
Pas encore d'évaluation
Questions de compréhension orale et écrite
25 pages
Imagier Montessori : Animaux et Méthodes
100% (1)
Imagier Montessori : Animaux et Méthodes
19 pages
ADMEE2016Anais PDF
Pas encore d'évaluation
ADMEE2016Anais PDF
920 pages
Dilane Resume 203
Pas encore d'évaluation
Dilane Resume 203
1 page
Calcul des périmètres avec Scratch
Pas encore d'évaluation
Calcul des périmètres avec Scratch
2 pages
Mémoire de Soutenance, Jury 30, Num 10 RV
Pas encore d'évaluation
Mémoire de Soutenance, Jury 30, Num 10 RV
93 pages
Profils et Méthodes d'Apprentissage
Pas encore d'évaluation
Profils et Méthodes d'Apprentissage
16 pages
Administration Scolaire 082243
Pas encore d'évaluation
Administration Scolaire 082243
20 pages
Programme Web2018uned
Pas encore d'évaluation
Programme Web2018uned
29 pages
Fiches Revisions Admissibilite Cafipemf
Pas encore d'évaluation
Fiches Revisions Admissibilite Cafipemf
14 pages
DM CGE BTs Blanc
Pas encore d'évaluation
DM CGE BTs Blanc
2 pages