0% ont trouvé ce document utile (0 vote)
93 vues14 pages

Ensemble Learning

Le document décrit la variabilité des résultats entre experts et pour un même expert, ainsi que le concept de sagesse de la foule. Il présente ensuite l'ensemble learning comme une application mathématique de ce concept, utilisant plusieurs algorithmes dont on combine les résultats. Des exemples illustrent comment cela permet d'obtenir de meilleures performances prédictives. L'importance de la diversité entre modèles est également abordée.

Transféré par

benn yass
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
93 vues14 pages

Ensemble Learning

Le document décrit la variabilité des résultats entre experts et pour un même expert, ainsi que le concept de sagesse de la foule. Il présente ensuite l'ensemble learning comme une application mathématique de ce concept, utilisant plusieurs algorithmes dont on combine les résultats. Des exemples illustrent comment cela permet d'obtenir de meilleures performances prédictives. L'importance de la diversité entre modèles est également abordée.

Transféré par

benn yass
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

L’ensemble learning

AI For You - Morgan Gautherot


La variabilité inter et intra-opérateur

u La variabilité intra-opérateur est la variabilité des résultats que l’on obtient


en comparant les résultats d’un professionnel sur le même problème à
intervalle de temps différent.

u La variabilité inter-opérateur est la variabilité des résultats que l’on obtient


en comparant les résultats de plusieurs professionnels.

AI For You - Morgan Gautherot 2


Segmentation de tumeur

u Dans cette article de recherche paru dans Elsevier en 2004, ils montrent que
lors de la segmentation manuel de tumeur par des radiologues expert la
variabilité intra-opérateur était de 20% +- 15% et de 28% +- 12% pour la
variabilité inter-opérateur.

u Les résultats d’un expert n’est donc pas toujours le plus fiable.

AI For You - Morgan Gautherot 3


La sagesse de la foule

u C’est une théorie qui présuppose que la perception et la résolution d'un problème
sont plus efficaces par une foule que par n'importe quel individu en faisant partie
ou non.

u Selon ce concept, une foule d’amateur peut mieux répondre à un problème d’un
seul expert.

u La foule cependant doit répondre à trois hypothèses pour valider cette théorie :
u la diversité : avoir des personnes de divers milieux avec des idées originales ;
u l’indépendance : permettre à ces avis divers de s’exprimer sans aucune influence ;
u la décentralisation : laisser ces différents jugements s’additionner plutôt que de laisser
une autorité supérieure choisir les idées qu’elle préfère.

AI For You - Morgan Gautherot 4


L’ensemble learning

u De ce concept philosophique on en a retirer une application mathématique


l’ensemble learning.

u Les méthodes d’ensemble learning utilisent plusieurs algorithmes


d’apprentissage et prennent en compte les résultats de ces modèles afin
d’obtenir de meilleures performances prédictives que les modèles pris
séparément.

AI For You - Morgan Gautherot 5


Exemple
Index Modèle 1 Modèle 2 Modèle 3 Modèle 4 Modèle 5

1 1 1 0 0 1

2 1 1 0 1 0

3 0 0 1 1 1

4 0 1 1 1 0

5 1 0 1 0 1

AI For You - Morgan Gautherot 6


Exemple
Index Modèle 1 Modèle 2 Modèle 3 Modèle 4 Modèle 5

1 1 1 0 0 1
2 1 1 0 1 0

3 0 0 1 1 1
4 0 1 1 1 0

5 1 0 1 0 1

AI For You - Morgan Gautherot 7


Exemple
Index Modèle 1 Modèle 2 Modèle 3 Modèle 4 Modèle 5

1 1 1 0 0 1
2 1 1 0 1 0
3 0 0 1 1 1
4 0 1 1 1 0
5 1 0 1 0 1

AI For You - Morgan Gautherot 8


Exemple
Index Modèle 1 Modèle 2 Modèle 3 Modèle 4 Modèle 5

1 1 1 0 0 1
2 1 1 0 1 0
3 0 0 1 1 1
4 0 1 1 1 0
5 1 0 1 0 1
Perf 60% 60% 60% 60% 60%

AI For You - Morgan Gautherot 9


Exemple
Index Modèle 1 Modèle 2 Modèle 3 Modèle 4 Modèle 5 Mélange

1 1 1 0 0 1 1

2 1 1 0 1 0 1

3 0 0 1 1 1 1

4 0 1 1 1 0 1

5 1 0 1 0 1 1

Perf 60% 60% 60% 60% 60% 100%

AI For You - Morgan Gautherot 10


Exemple
Index Modèle 1 Modèle 2 Modèle 3 Modèle 4 Modèle 5 Mélange

1 1 1 0 0 1 1
2 1 1 0 1 0 1
3 0 0 1 1 1 1
4 0 1 1 1 0 1
5 1 0 1 0 1 1
Perf 60% 60% 60% 60% 60% 100%

AI For You - Morgan Gautherot 11


L’importance de la diversité

u Comme on l’a vue avec la sagesse des foules, la diversité est une notion
importante. Les modèles doivent être différent, construit sur des données
différents ou avec des algorithmes d’apprentissage différents.

Modèle Modèle Modèle Modèle Modèle


Index Mélange
1 2 3 4 5
1 1 1 1 1 1 1
2 1 1 1 1 1 1
3 0 0 0 0 0 0
4 0 0 0 0 0 0
5 1 1 1 1 1 1
Perf 60% 60% 60% 60% 60% 60%

AI For You - Morgan Gautherot 12


Voting
Hard Voting Soft Voting

Dataset Dataset

Logistic Random Logistic Random


SVM … SVM …
regression forest regression forest

1 1 0 1 70% 80% 45% 85%

1 70%
AI For You - Morgan Gautherot 13
Utilisation de ce concept

u Bagging/Pasting (Random forest, bagging de regression)

u Boosting (AdaBoost, Gradient Boosting)

u Stacking (Utilisation d’un modèle afin de mélanger les prédictions des


modèles)

AI For You - Morgan Gautherot 14

Vous aimerez peut-être aussi