0% ont trouvé ce document utile (0 vote)
166 vues14 pages

Comprendre le Random Forest en ML

Le random forest est un algorithme d'apprentissage automatique qui combine plusieurs arbres de décision afin d'améliorer la précision et la capacité de généralisation par rapport à un seul arbre. Il utilise des techniques de bagging et pasting pour créer des jeux de données variés et entraîner plusieurs arbres, dont les prédictions sont ensuite moyennées.

Transféré par

benn yass
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
166 vues14 pages

Comprendre le Random Forest en ML

Le random forest est un algorithme d'apprentissage automatique qui combine plusieurs arbres de décision afin d'améliorer la précision et la capacité de généralisation par rapport à un seul arbre. Il utilise des techniques de bagging et pasting pour créer des jeux de données variés et entraîner plusieurs arbres, dont les prédictions sont ensuite moyennées.

Transféré par

benn yass
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Random forest

AI For You - Morgan Gautherot


Prérequis

Pour comprendre la théorie du random forest il faut bien comprendre :

- L’ensemble learning

- Les arbres de décision

AI For You - Morgan Gautherot 2


Le problèmes des arbres

u Les arbres de décision sont facile à entraîner, facile à utilisé et très


interprétable, on peut savoir assez rapidement les règles qui permettent la
prédiction ou la classification de notre exemple.

u Mais derrière ces qualités apparente on peut leur reprocher de ne pas être
assez précis ni assez généralisable. En effet, l’arbre est performant avec le
jeu d’entraînement mais il n’est pas assez flexible pour donner de bonnes
performances sur des données de test. Or, but le d’un algorithme de machine
learning est de pouvoir classifier des données dont on ne connaît pas encore
la prédiction donc se sont des données autres que celle d’entraînement.

AI For You - Morgan Gautherot 3


Random forest

u Pour palier à ce problème de généralisation, les random forest ont vue le


jour. Cet algorithme permet d’utiliser plusieurs arbres de décision afin de
créer une forêt et d’améliorer la généralisation de l’ensemble du modèle. On
va emprunter la théorie de l’ensemble learning afin de faire fonctionner ses
arbres ensemble.

u Le random forest combine donc la simplicité des arbres de décision grâce à


l’ensemble learning afin de gagner de la flexibilité et de la généralisation. Ce
qui donne des modèles de bien meilleur qualité.

AI For You - Morgan Gautherot 4


Bagging & Pasting
Bagging Pasting

Dataset Dataset

Decision Decision Decision Decision Decision Decision


… …
Trees Trees Trees Trees Trees Trees

1 1 0 1 1 1 0 1

1 1
AI For You - Morgan Gautherot 5
1) Création du data set
Data set du Random Forest
Nb de
Surface Garage Prix
pièces

4 80 1 220 000

3 70 0 190 000

2 40 1 140 000

4 60 0 170 000

3 70 1 200 000

AI For You - Morgan Gautherot 6


1) Création du data set
Data set du Random Forest Data set de l’arbre de décision
Nb de Nb de
Surface Garage Prix Surface Garage Prix
pièces pièces

4 80 1 220 000

3 70 0 190 000

2 40 1 140 000

4 60 0 170 000

3 70 1 200 000

AI For You - Morgan Gautherot 7


1) Création du data set
Data set du Random Forest Data set de l’arbre de décision
Nb de Nb de
Surface Garage Prix Surface Garage Prix
pièces pièces

4 80 1 220 000 3 70 0 190 000

3 70 0 190 000

2 40 1 140 000

4 60 0 170 000

3 70 1 200 000

AI For You - Morgan Gautherot 8


1) Création du data set
Data set du Random Forest Data set de l’arbre de décision
Nb de Nb de
Surface Garage Prix Surface Garage Prix
pièces pièces

4 80 1 220 000 3 70 0 190 000

3 70 0 190 000 4 60 0 170 000

2 40 1 140 000

4 60 0 170 000

3 70 1 200 000

AI For You - Morgan Gautherot 9


1) Création du data set
Data set du Random Forest Data set de l’arbre de décision
Nb de Nb de
Surface Garage Prix Surface Garage Prix
pièces pièces

4 80 1 220 000 3 70 0 190 000

3 70 0 190 000 4 60 0 170 000

2 40 1 140 000 3 70 1 200 000

4 60 0 170 000

3 70 1 200 000

AI For You - Morgan Gautherot 10


1) Création du data set
Data set du Random Forest Data set de l’arbre de décision
Nb de Nb de
Surface Garage Prix Surface Garage Prix
pièces pièces

4 80 1 220 000 3 70 0 190 000

3 70 0 190 000 4 60 0 170 000

2 40 1 140 000 3 70 1 200 000

4 60 0 170 000 3 70 0 190 000

3 70 1 200 000

Pour maximiser la variété des arbres !

AI For You - Morgan Gautherot 11


2) Entraînement de l’arbre de décision
Data set de l’arbre de décision
Nb de
Surface Garage Prix
pièces

3 70 0 190 000

4 60 0 170 000

3 70 1 200 000

3 70 0 190 000

Pour maximiser la variété des arbres !

AI For You - Morgan Gautherot 12


3) Répéter les étapes 1 et 2

AI For You - Morgan Gautherot 13


Prédiction Prédiction moyenne : 134 500

130 000
140 000

133 000

135 000
AI For You - Morgan Gautherot 14

Vous aimerez peut-être aussi