L’ensemble learning
AI For You - Morgan Gautherot
La variabilité inter et intra-opérateur
u La variabilité intra-opérateur est la variabilité des résultats que l’on obtient
en comparant les résultats d’un professionnel sur le même problème à
intervalle de temps différent.
u La variabilité inter-opérateur est la variabilité des résultats que l’on obtient
en comparant les résultats de plusieurs professionnels.
AI For You - Morgan Gautherot 2
Segmentation de tumeur
u Dans cette article de recherche paru dans Elsevier en 2004, ils montrent que
lors de la segmentation manuel de tumeur par des radiologues expert la
variabilité intra-opérateur était de 20% +- 15% et de 28% +- 12% pour la
variabilité inter-opérateur.
u Les résultats d’un expert n’est donc pas toujours le plus fiable.
AI For You - Morgan Gautherot 3
La sagesse de la foule
u C’est une théorie qui présuppose que la perception et la résolution d'un problème
sont plus efficaces par une foule que par n'importe quel individu en faisant partie
ou non.
u Selon ce concept, une foule d’amateur peut mieux répondre à un problème d’un
seul expert.
u La foule cependant doit répondre à trois hypothèses pour valider cette théorie :
u la diversité : avoir des personnes de divers milieux avec des idées originales ;
u l’indépendance : permettre à ces avis divers de s’exprimer sans aucune influence ;
u la décentralisation : laisser ces différents jugements s’additionner plutôt que de laisser
une autorité supérieure choisir les idées qu’elle préfère.
AI For You - Morgan Gautherot 4
L’ensemble learning
u De ce concept philosophique on en a retirer une application mathématique
l’ensemble learning.
u Les méthodes d’ensemble learning utilisent plusieurs algorithmes
d’apprentissage et prennent en compte les résultats de ces modèles afin
d’obtenir de meilleures performances prédictives que les modèles pris
séparément.
AI For You - Morgan Gautherot 5
Exemple
Index Modèle 1 Modèle 2 Modèle 3 Modèle 4 Modèle 5
1 1 1 0 0 1
2 1 1 0 1 0
3 0 0 1 1 1
4 0 1 1 1 0
5 1 0 1 0 1
AI For You - Morgan Gautherot 6
Exemple
Index Modèle 1 Modèle 2 Modèle 3 Modèle 4 Modèle 5
1 1 1 0 0 1
2 1 1 0 1 0
3 0 0 1 1 1
4 0 1 1 1 0
5 1 0 1 0 1
AI For You - Morgan Gautherot 7
Exemple
Index Modèle 1 Modèle 2 Modèle 3 Modèle 4 Modèle 5
1 1 1 0 0 1
2 1 1 0 1 0
3 0 0 1 1 1
4 0 1 1 1 0
5 1 0 1 0 1
AI For You - Morgan Gautherot 8
Exemple
Index Modèle 1 Modèle 2 Modèle 3 Modèle 4 Modèle 5
1 1 1 0 0 1
2 1 1 0 1 0
3 0 0 1 1 1
4 0 1 1 1 0
5 1 0 1 0 1
Perf 60% 60% 60% 60% 60%
AI For You - Morgan Gautherot 9
Exemple
Index Modèle 1 Modèle 2 Modèle 3 Modèle 4 Modèle 5 Mélange
1 1 1 0 0 1 1
2 1 1 0 1 0 1
3 0 0 1 1 1 1
4 0 1 1 1 0 1
5 1 0 1 0 1 1
Perf 60% 60% 60% 60% 60% 100%
AI For You - Morgan Gautherot 10
Exemple
Index Modèle 1 Modèle 2 Modèle 3 Modèle 4 Modèle 5 Mélange
1 1 1 0 0 1 1
2 1 1 0 1 0 1
3 0 0 1 1 1 1
4 0 1 1 1 0 1
5 1 0 1 0 1 1
Perf 60% 60% 60% 60% 60% 100%
AI For You - Morgan Gautherot 11
L’importance de la diversité
u Comme on l’a vue avec la sagesse des foules, la diversité est une notion
importante. Les modèles doivent être différent, construit sur des données
différents ou avec des algorithmes d’apprentissage différents.
Modèle Modèle Modèle Modèle Modèle
Index Mélange
1 2 3 4 5
1 1 1 1 1 1 1
2 1 1 1 1 1 1
3 0 0 0 0 0 0
4 0 0 0 0 0 0
5 1 1 1 1 1 1
Perf 60% 60% 60% 60% 60% 60%
AI For You - Morgan Gautherot 12
Voting
Hard Voting Soft Voting
Dataset Dataset
Logistic Random Logistic Random
SVM … SVM …
regression forest regression forest
1 1 0 1 70% 80% 45% 85%
1 70%
AI For You - Morgan Gautherot 13
Utilisation de ce concept
u Bagging/Pasting (Random forest, bagging de regression)
u Boosting (AdaBoost, Gradient Boosting)
u Stacking (Utilisation d’un modèle afin de mélanger les prédictions des
modèles)
AI For You - Morgan Gautherot 14