0% ont trouvé ce document utile (0 vote)

127 vues3 pages

Construction du 2ème Arbre LightGBM

LightGBM est un algorithme de Gradient Boosting qui utilise un apprentissage basé sur des histogrammes et une croissance des feuilles pour construire des arbres de manière plus rapide et efficace que XGBoost. Le document détaille le processus de construction du 2ème arbre, y compris le calcul des gradients, la construction d'histogrammes, le calcul du gain pour le split, et la mise à jour des prédictions. En conclusion, LightGBM est recommandé pour des ensembles de données volumineux en raison de sa rapidité et de son efficacité.

Transféré par

hemmemseklal72

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

127 vues3 pages

Construction du 2ème Arbre LightGBM

Transféré par

hemmemseklal72

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

📌 Construction du 2ème Arbre dans LightGBM (Calculs Détaillés)

LightGBM (Light Gradient Boosting Machine) est un algorithme basé sur Gradient Boosting, similaire
à XGBoost, mais avec des différences clés :

 Histogram-based Learning : Il construit les arbres plus rapidement en regroupant les valeurs
en histogrammes.

 Leaf-wise Growth (Best-first) : Contrairement à XGBoost qui utilise une croissance level-wise,
LightGBM divise la feuille avec le plus grand gain.

Nous allons détailler comment construire le 2ème arbre dans LightGBM.

🔹 Données & 1ère Itération

yy (valeur y^(1)\hat{y}^{(1)} (prédiction 1er Résidu r(1)=y−y^(1)r^{(1)} = y - \

xx
réelle) arbre) hat{y}^{(1)}

1 5 3.2 +1.8

2 8 7.1 +0.9

3 6 5.1 +0.9

🔹 Étape 1 : Calcul des Gradients et Hessiennes

LightGBM utilise aussi le gradient et la hessienne pour ajuster les arbres :

 Gradient gig_i : gi=∂L∂y^ig_i = \frac{\partial L}{\partial \hat{y}_i}

 Hessienne hih_i : hi=∂2L∂y^i2h_i = \frac{\partial^2 L}{\partial \hat{y}_i^2}

Pour une perte quadratique L=12(y−y^)2L = \frac{1}{2} (y - \hat{y})^2 :

gi=y^i−yi,hi=1g_i = \hat{y}_i - y_i, \quad h_i = 1

xx yy y^(1)\hat{y}^{(1)} gi=y^−yg_i = \hat{y} - y hih_i

1 5 3.2 -1.8 1

2 8 7.1 -0.9 1

3 6 5.1 -0.9 1

🔹 Étape 2 : Construction de l'Histogramme pour LightGBM

LightGBM regroupe les valeurs en bins (intervalles de valeurs).

Supposons que LightGBM divise les valeurs de xx en 2 bins :

xx Bin

1 0
xx Bin

2 1

3 1

LightGBM agrège ensuite les gradients et hessiennes par bin :

Bin GG (somme des gradients) HH (somme des hessiennes)

0 -1.8 1

1 -0.9 - 0.9 = -1.8 1+1=2

🔹 Étape 3 : Calcul du Gain pour le Split

Le gain du split est donné par :

Gain=12(GL2HL+λ+GR2HR+λ−G2H+λ)−γ\text{Gain} = \frac{1}{2} \left( \frac{G_L^2}{H_L + \lambda} + \

frac{G_R^2}{H_R + \lambda} - \frac{G^2}{H + \lambda} \right) - \gamma

 Noeud gauche (bin 0) : GL=−1.8,HL=1G_L = -1.8, H_L = 1

 Noeud droit (bin 1) : GR=−1.8,HR=2G_R = -1.8, H_R = 2

 Total : G=−3.6,H=3G = -3.6, H = 3

Gain=12((−1.8)21+1+(−1.8)22+1−(−3.6)23+1)\text{Gain} = \frac{1}{2} \left( \frac{(-1.8)^2}{1+1} + \

frac{(-1.8)^2}{2+1} - \frac{(-3.6)^2}{3+1} \right) =12(3.242+3.243−12.964)= \frac{1}{2} \left( \
frac{3.24}{2} + \frac{3.24}{3} - \frac{12.96}{4} \right) =12(1.62+1.08−3.24)=−0.27= \frac{1}{2} \
left( 1.62 + 1.08 - 3.24 \right) = -0.27

🚨 Si le gain est négatif ou faible, LightGBM ajuste le seuil de régularisation.

🔹 Étape 4 : Mise à Jour des Prédictions avec le Learning Rate η=0.1\eta = 0.1

Les nouvelles valeurs des feuilles sont calculées comme suit :

wj=−GjHj+λw_j = -\frac{G_j}{H_j + \lambda}

✅ Feuille 1 (bin 0) wL=−−1.81+1=0.9w_L = -\frac{-1.8}{1 + 1} = 0.9

✅ Feuille 2 (bin 1) wR=−−1.82+1=0.6w_R = -\frac{-1.8}{2 + 1} = 0.6

On met à jour les prédictions :

y^(2)=y^(1)+ηw\hat{y}^{(2)} = \hat{y}^{(1)} + \eta w

ww (sortie du 2ème y^(2)=y^(1)+0.1×w\hat{y}^{(2)} = \hat{y}^{(1)} + 0.1 \

xx y^(1)\hat{y}^{(1)}
arbre) times w

1 3.2 0.9 3.2 + 0.1 × 0.9 = 3.29

2 7.1 0.6 7.1 + 0.1 × 0.6 = 7.16

3 5.1 0.6 5.1 + 0.1 × 0.6 = 5.16

ww (sortie du 2ème y^(2)=y^(1)+0.1×w\hat{y}^{(2)} = \hat{y}^{(1)} + 0.1 \
xx y^(1)\hat{y}^{(1)}
arbre) times w

🔹 Étape 5 : Nouveaux Résidus pour la 3ème Itération

r(2)=y−y^(2)r^{(2)} = y - \hat{y}^{(2)}

xx yy y^(2)\hat{y}^{(2)} r(2)=y−y^(2)r^{(2)} = y - \hat{y}^{(2)}

1 5 3.29 +1.71

2 8 7.16 +0.84

3 6 5.16 +0.84

➡ Ces résidus deviennent la nouvelle cible pour le 3ème arbre.

🔹 Différence XGBoost vs LightGBM

Critère XGBoost LightGBM

Level-wise (profondeur
Croissance Leaf-wise (division des feuilles avec max gain)
équilibrée)

Basé sur la valeur exacte des

Split Basé sur des bins d’histogramme (optimisé)
features

Performance Plus lent mais robuste Plus rapide (surtout sur grands datasets)

L1, L2, Pruning + Handling efficace des valeurs

Régularisation L1, L2, Pruning
manquantes

👉 Conclusion

LightGBM est plus rapide que XGBoost et meilleur sur les grands datasets (> 1M lignes).
Si ton dataset a 250 000 lignes, LightGBM est un excellent choix ! 🚀

👉 Tu veux voir une 3ème itération ou tester un autre exemple ? 😊

Vous aimerez peut-être aussi

Exemple Dex G Boost Maths
Pas encore d'évaluation
Exemple Dex G Boost Maths
3 pages
XGBoost
Pas encore d'évaluation
XGBoost
5 pages
XGBoost Guide Gratuit
Pas encore d'évaluation
XGBoost Guide Gratuit
39 pages
ML
Pas encore d'évaluation
ML
7 pages
XG Boost
Pas encore d'évaluation
XG Boost
21 pages
ML Modèle
Pas encore d'évaluation
ML Modèle
9 pages
ML Modèles
Pas encore d'évaluation
ML Modèles
9 pages
Modèle de Gradient Boosting pour Maintenance
Pas encore d'évaluation
Modèle de Gradient Boosting pour Maintenance
2 pages
Avantages et inconvénients de XGBoost
Pas encore d'évaluation
Avantages et inconvénients de XGBoost
4 pages
SVM et Réseaux Neuronaux en Python
Pas encore d'évaluation
SVM et Réseaux Neuronaux en Python
13 pages
Les Arbres de Decisions LE 2025
Pas encore d'évaluation
Les Arbres de Decisions LE 2025
39 pages
TP 9 ML
Pas encore d'évaluation
TP 9 ML
9 pages
Cours - Article Machine Learning
Pas encore d'évaluation
Cours - Article Machine Learning
102 pages
03-Deep Learning Optimization
Pas encore d'évaluation
03-Deep Learning Optimization
102 pages
ML If-Sitn
Pas encore d'évaluation
ML If-Sitn
140 pages
TP SGD
Pas encore d'évaluation
TP SGD
5 pages
Cours de Machine Learning - Séance N°5 Méthodes D'ensemble
Pas encore d'évaluation
Cours de Machine Learning - Séance N°5 Méthodes D'ensemble
20 pages
Ensta App 03 Arbres Ensembles
Pas encore d'évaluation
Ensta App 03 Arbres Ensembles
33 pages
Chimie Informatique Et Modélisation Moléculaire
Pas encore d'évaluation
Chimie Informatique Et Modélisation Moléculaire
44 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
220 pages
ML If-Sitn
Pas encore d'évaluation
ML If-Sitn
122 pages
Classification avec SVM et noyaux
100% (1)
Classification avec SVM et noyaux
5 pages
TD 4
Pas encore d'évaluation
TD 4
10 pages
Guide Complet sur l'Apprentissage Machine
Pas encore d'évaluation
Guide Complet sur l'Apprentissage Machine
26 pages
Classification SVM en Machine Learning
Pas encore d'évaluation
Classification SVM en Machine Learning
39 pages
Examen Ia
Pas encore d'évaluation
Examen Ia
11 pages
Correction Du TD 3
Pas encore d'évaluation
Correction Du TD 3
4 pages
Rapport Final Maach Nouoiar
Pas encore d'évaluation
Rapport Final Maach Nouoiar
16 pages
Algorithmes de Machine Learning en 2023
100% (1)
Algorithmes de Machine Learning en 2023
52 pages
Arbres de décision en science des données
Pas encore d'évaluation
Arbres de décision en science des données
40 pages
Introduction aux SVM et réseaux de neurones
Pas encore d'évaluation
Introduction aux SVM et réseaux de neurones
15 pages
Reseaux de Neurones & Deep Learning 1
Pas encore d'évaluation
Reseaux de Neurones & Deep Learning 1
65 pages
Exam Fouille Extraction Datamining Donnees 2017 2018corrige
100% (1)
Exam Fouille Extraction Datamining Donnees 2017 2018corrige
9 pages
Introduction aux SVM pour ingénieurs
Pas encore d'évaluation
Introduction aux SVM pour ingénieurs
38 pages
Analyse du Dataset SUPPORT2 en ML
Pas encore d'évaluation
Analyse du Dataset SUPPORT2 en ML
6 pages
Identification Important Exercice
Pas encore d'évaluation
Identification Important Exercice
95 pages
Identification Des Systemes PDF
Pas encore d'évaluation
Identification Des Systemes PDF
97 pages
SVM et Arbres de Décision : Concepts Clés
Pas encore d'évaluation
SVM et Arbres de Décision : Concepts Clés
28 pages
Examen Master IDM : Fouille de Données
Pas encore d'évaluation
Examen Master IDM : Fouille de Données
5 pages
ML 1
Pas encore d'évaluation
ML 1
41 pages
Cours
Pas encore d'évaluation
Cours
42 pages
PHOTOMÉTRIE
Pas encore d'évaluation
PHOTOMÉTRIE
7 pages
Feuille Tage
Pas encore d'évaluation
Feuille Tage
25 pages
Analyse des signaux biomécaniques par cyclostationnarité
Pas encore d'évaluation
Analyse des signaux biomécaniques par cyclostationnarité
209 pages
Cours ML Arbres
Pas encore d'évaluation
Cours ML Arbres
52 pages
Chap 8 Notes1
Pas encore d'évaluation
Chap 8 Notes1
6 pages
Techniques ensemblistes en analyse prédictive
Pas encore d'évaluation
Techniques ensemblistes en analyse prédictive
44 pages
Chapitre 2 - Machine Learning - Les Arbres de Décision
Pas encore d'évaluation
Chapitre 2 - Machine Learning - Les Arbres de Décision
10 pages
Calcul des Moments et Réactions en Travée
Pas encore d'évaluation
Calcul des Moments et Réactions en Travée
6 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
180 pages
Concepts clés en télédétection et classification
Pas encore d'évaluation
Concepts clés en télédétection et classification
7 pages
Redresseurs Mono
Pas encore d'évaluation
Redresseurs Mono
24 pages
Sommaire: Système de Stationnement D'Un Parking Intelligent Avec Arduino
Pas encore d'évaluation
Sommaire: Système de Stationnement D'Un Parking Intelligent Avec Arduino
38 pages
Guide complet sur les composants PC
Pas encore d'évaluation
Guide complet sur les composants PC
26 pages
DCC Elroq
Pas encore d'évaluation
DCC Elroq
10 pages
Master Electronique Industrielle Sétif
Pas encore d'évaluation
Master Electronique Industrielle Sétif
67 pages
Iec 60904-2
Pas encore d'évaluation
Iec 60904-2
28 pages
Indicateurs de Performance de Production
Pas encore d'évaluation
Indicateurs de Performance de Production
12 pages
Exo 32 - Menu de Restaurant - HTML-CSS3
100% (1)
Exo 32 - Menu de Restaurant - HTML-CSS3
5 pages
Tableau Appareils Aspen HYSYS
Pas encore d'évaluation
Tableau Appareils Aspen HYSYS
1 page
Étude des séries numériques et convergence
Pas encore d'évaluation
Étude des séries numériques et convergence
11 pages
Guide d'Installation FreePBX Distro
Pas encore d'évaluation
Guide d'Installation FreePBX Distro
110 pages
Le Système de Freinage
Pas encore d'évaluation
Le Système de Freinage
9 pages
Control MP 204 1x235300 A Direct U2
Pas encore d'évaluation
Control MP 204 1x235300 A Direct U2
5 pages
Bascules Synchrone D et JK Maître-Esclave
Pas encore d'évaluation
Bascules Synchrone D et JK Maître-Esclave
37 pages
Aquastream 3g
Pas encore d'évaluation
Aquastream 3g
92 pages
Portes Et Circuits Quantiques
Pas encore d'évaluation
Portes Et Circuits Quantiques
19 pages
LB Comment Créer Un Serious Game
Pas encore d'évaluation
LB Comment Créer Un Serious Game
42 pages
E. Barbin, Un Prétendant Au Titre de Critère de L'acte Administratif - Présentation Du Finaliste
Pas encore d'évaluation
E. Barbin, Un Prétendant Au Titre de Critère de L'acte Administratif - Présentation Du Finaliste
5 pages
COURS L'Analyse Fonctionnelle
Pas encore d'évaluation
COURS L'Analyse Fonctionnelle
5 pages
SE Systèmes Embarqués Avec Design
Pas encore d'évaluation
SE Systèmes Embarqués Avec Design
9 pages
U U N N U U N U N N U N A R N X X X R X R R: Année G.Min. Et G.Mec. Université S3 2020/2021 A.Mira, Béjaïa
Pas encore d'évaluation
U U N N U U N U N N U N A R N X X X R X R R: Année G.Min. Et G.Mec. Université S3 2020/2021 A.Mira, Béjaïa
3 pages
Rétention des prothèses fraisées vs classiques
Pas encore d'évaluation
Rétention des prothèses fraisées vs classiques
6 pages
Cours Complet Culture Digitale
Pas encore d'évaluation
Cours Complet Culture Digitale
4 pages
Examen8+Solution Architecture Des Ordinateurs
Pas encore d'évaluation
Examen8+Solution Architecture Des Ordinateurs
3 pages
Apprendre le C en 20 heures
Pas encore d'évaluation
Apprendre le C en 20 heures
174 pages
Principes du Lean et Management Visuel
100% (1)
Principes du Lean et Management Visuel
3 pages
MEC2500, Final-H16 Questionnaire
Pas encore d'évaluation
MEC2500, Final-H16 Questionnaire
10 pages
Manuel D'utilisation Sage ECF
Pas encore d'évaluation
Manuel D'utilisation Sage ECF
90 pages
CP BioMerieux VIDAS Kube 20221220
Pas encore d'évaluation
CP BioMerieux VIDAS Kube 20221220
3 pages
Filtrage Collaboratif K-NN pour E-Commerce
Pas encore d'évaluation
Filtrage Collaboratif K-NN pour E-Commerce
11 pages