Projet Classification

Ce projet consiste à implémenter deux algorithmes de classification, CART et Random Forest, en créant également une interface graphique pour charger des données et exécuter les algorithmes. L'algorithme CART construit des arbres de décision basés sur des mesures d'impureté, tandis que le Random Forest combine plusieurs arbres pour améliorer la précision des prédictions. Les étudiants doivent comprendre ces algorithmes, proposer leur propre implémentation et développer une application graphique avant la date limite du 20 décembre.

Transféré par

amel GUERAH

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

49 vues5 pages

Projet Classification

Transféré par

amel GUERAH

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Projet : Classification avec Arbre de Décision

et Forêt Aléatoire (version provisoire)

SAE Algorithmiques et Programmation 3
November 11, 2024

Contents
1 Introduction 2

2 Classification: CART et RF 2
2.1 Algorithme CART . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2 Algorithme Random Forest . . . . . . . . . . . . . . . . . . . . 3

3 Création de l’Interface Graphique (GUI) 4

3.1 Structure de l’Interface . . . . . . . . . . . . . . . . . . . . . . 4

4 Votre travail 4

1
1 Introduction
Dans ce ce projet, vous êtes amener à proposer une implémentation de
deux algorithmes de classification en intelligence artificielle, à savoir arbre de
décision et forêt aléatoire. Vous allez coder l’algorithme CART et RF, mais
aussi construire une interface graphique, permettant de charger une donnée
et de choisir l’algorithme à exécuter et montrer le résultat en fonction de
l’exemple choisi.

2 Classification: CART et RF
2.1 Algorithme CART
L’algorithme CART (Classification and Regression Trees) est une méthode
de classification basée sur des arbres de décision binaires. Chaque nœud
effectue une division selon la mesure d’impureté Gini ou l’entropie, perme-
ttant de séparer les classes. Vous pouvez trouver plus d’explications sur le
fonctionnement de cet algorithme sur wikipédia.
L’algorithme CART (Classification and Regression Trees) est une méthode
d’apprentissage supervisé dédié aux tâches de classification et de régression.
Créé par Breiman en 1984, cet algorithme construit des arbres de décision
en segmentant les données en sous-ensembles de plus en plus homogènes. À
chaque étape de l’arbre, une variable et un seuil sont choisis pour diviser les
données, ce qui permet de minimiser l’erreur d’estimation.
Pour la classification, l’algorithme classe les données dans des catégories
spécifiques en formant des ”feuilles” qui représentent les classes cibles. Dans
le cas de la régression, il prévoit une valeur continue pour chaque feuille.
CART utilise des mesures comme le Gini (pour la classification) ou l’erreur
quadratique (pour la régression) afin de choisir les meilleures divisions.
Cet algorithme est populaire pour sa simplicité et sa capacité à produire
des modèles explicables, mais il peut être sensible au surapprentissage si
l’arbre est trop profond.
Pour illustrer l’utilisation de l’algorithme CART avec un exemple de
données sur les prêts bancaires, prenons un petit ensemble de données hy-
pothétique. L’objectif ici est de déterminer si un prêt bancaire sera approuvé
ou non, en fonction de certains critères. Voici un exemple de données et
l’arbre de décision associé :
À partir de cet ensemble de données, l’algorithme CART va construire
un arbre de décision. Voici à quoi pourrait ressembler un arbre simplifié basé
sur ces données :

2
ID Revenu (€) Montant Durée de l’Emploi Historique Prêt
Mensuel du Prêt (€) (années) de Crédit Approuvé
1 3,500 10,000 5 Bon Oui
2 2,000 5,000 3 Mauvais Non
3 4,000 20,000 10 Bon Oui
4 1,500 2,000 2 Mauvais Non
5 3,200 7,000 7 Bon Oui
6 1,800 3,000 1 Mauvais Non
7 3,500 12,000 8 Bon Oui
8 2,500 6,000 4 Mauvais Non

Table 1: Exemple de données pour l’approbation de prêt bancaire

Historique de Crédit

Mauvais Bon

Revenu Mensuel Montant du Prêt

< 2500 € >= 2500 € < 15000 € >= 15000 €

Refusé Refusé Approuvé Refusé

Figure 1: Arbre de décision pour l’approbation de prêt bancaire

2.2 Algorithme Random Forest

Le Random Forest (RF), ou forêt aléatoire, est un algorithme d’apprentissage
supervisé qui combine plusieurs arbres de décision pour améliorer la précision
des prédictions et réduire le risque de sur-apprentissage (ou overfitting).
Développé par Leo Breiman, cet algorithme repose sur le principe de l’ensemble
learning : il utilise un ensemble de modèles faibles (arbres de décision) et
agrège leurs prédictions pour obtenir un modèle global plus robuste et précis.
Dans une forêt aléatoire, chaque arbre est construit en sélectionnant un

3
sous-ensemble aléatoire des données d’entraı̂nement et des caractéristiques.
Lors de la prédiction, chaque arbre de la forêt vote pour une classe (pour
les problèmes de classification) ou prédit une valeur numérique (pour les
problèmes de régression), et le résultat final est obtenu par la majorité des
votes ou la moyenne des prédictions des arbres.
Le Random Forest est largement utilisé en raison de sa précision, de sa
capacité à gérer de grandes quantités de données et de caractéristiques, ainsi
que de sa résilience aux valeurs aberrantes et aux données manquantes. C’est
un choix courant pour les tâches de classification et de régression dans divers
domaines comme la finance, la biologie, et le marketing.

3 Création de l’Interface Graphique (GUI)

L’interface qui vous est demandé doit permettre de charger un fichier con-
tenant la donnée au format CSV. Si le fichier est mal formé, vous devez
afficher un message d’erreur. Votre interface doit permettre aussi de faire
un choix entre CART et RF à lancer. Une fois le modèle construit vous
devez permettre à l’utilisateur de donner un exemple et de pouvoir dire si le
modèle prédit correctement la classe. Un message doit apparaı̂tre pour dire
si la classe est correct ou pas.

Figure 2: Exemple très simplifiée de l’application graphique demandée

4 Votre travail
Votre travail consiste à

1. Comprendre le fonctionnement de CART et RF

2. Proposer votre prpore implémentation pour chacun deux algorithmes

4
3. Proposer une application graphique permettant de charger la donnée
et de choisir l’algorithme à exécuter parmi les deux algorithmes.

4. Ajouter des fonctionalités comme le temps, des mesures comme la

précision, etc.. (optionnel)

Le projet est à rendre le 20 décembre 23h59 dernier délai.

Vous aimerez peut-être aussi

Cours AD
Pas encore d'évaluation
Cours AD
34 pages
Chapitre III ML Les Arbres de Decision
Pas encore d'évaluation
Chapitre III ML Les Arbres de Decision
20 pages
Chapitre 2 - Machine Learning - Les Arbres de Décision
Pas encore d'évaluation
Chapitre 2 - Machine Learning - Les Arbres de Décision
10 pages
Arbre de décision : Algorithme CART
100% (1)
Arbre de décision : Algorithme CART
14 pages
Arbres de Décision en IA
Pas encore d'évaluation
Arbres de Décision en IA
24 pages
Arbres de Décision CART : Concepts et Limites
Pas encore d'évaluation
Arbres de Décision CART : Concepts et Limites
19 pages
Classification par Arbres de Décision CART
Pas encore d'évaluation
Classification par Arbres de Décision CART
19 pages
Arbre de Decision
Pas encore d'évaluation
Arbre de Decision
44 pages
ML Arbres Et Boosting 5 French
Pas encore d'évaluation
ML Arbres Et Boosting 5 French
42 pages
Les Arbres de Decisions LE 2025
Pas encore d'évaluation
Les Arbres de Decisions LE 2025
39 pages
Algorithmes de Machine Learning en 2023
100% (1)
Algorithmes de Machine Learning en 2023
52 pages
Chapitre3 Part3 Classification Arbre Decision
Pas encore d'évaluation
Chapitre3 Part3 Classification Arbre Decision
62 pages
Cours Arbre de Decisionfichier
Pas encore d'évaluation
Cours Arbre de Decisionfichier
60 pages
Classification Decision Tree
Pas encore d'évaluation
Classification Decision Tree
52 pages
Genuer Poggi - Chap JES2016
Pas encore d'évaluation
Genuer Poggi - Chap JES2016
46 pages
Arbres
Pas encore d'évaluation
Arbres
65 pages
Data Mining Algorithms
Pas encore d'évaluation
Data Mining Algorithms
20 pages
Datamining Cours 03
Pas encore d'évaluation
Datamining Cours 03
25 pages
Classification Par Arbre de Décision Cart
Pas encore d'évaluation
Classification Par Arbre de Décision Cart
48 pages
Arbres de Décisions
Pas encore d'évaluation
Arbres de Décisions
11 pages
MLBy HVR-FR
Pas encore d'évaluation
MLBy HVR-FR
74 pages
Chapitre 4. Arbre de Décision
Pas encore d'évaluation
Chapitre 4. Arbre de Décision
26 pages
Chapitre2 DecisionTrees CART
Pas encore d'évaluation
Chapitre2 DecisionTrees CART
53 pages
Ensta App 03 Arbres Ensembles
Pas encore d'évaluation
Ensta App 03 Arbres Ensembles
33 pages
Chap3 Arbres Sahbi
Pas encore d'évaluation
Chap3 Arbres Sahbi
46 pages
AFD - Projet de Fin D'année
Pas encore d'évaluation
AFD - Projet de Fin D'année
61 pages
Cours de Machine Learning - Séance N°5 Méthodes D'ensemble
Pas encore d'évaluation
Cours de Machine Learning - Séance N°5 Méthodes D'ensemble
20 pages
ADD New
Pas encore d'évaluation
ADD New
22 pages
Algorithm
Pas encore d'évaluation
Algorithm
6 pages
Classification supervisée avec R
Pas encore d'évaluation
Classification supervisée avec R
11 pages
Classification 1
Pas encore d'évaluation
Classification 1
29 pages
Projet Arbre de Decision
Pas encore d'évaluation
Projet Arbre de Decision
18 pages
Data Mining
Pas encore d'évaluation
Data Mining
3 pages
Considérer L'applicabilité Des Algorithmes
Pas encore d'évaluation
Considérer L'applicabilité Des Algorithmes
13 pages
Présentation Adm
Pas encore d'évaluation
Présentation Adm
30 pages
TPnote 20232024
Pas encore d'évaluation
TPnote 20232024
2 pages
Guide des Arbres de Décision
Pas encore d'évaluation
Guide des Arbres de Décision
21 pages
Decisiontree CART
Pas encore d'évaluation
Decisiontree CART
16 pages
ATraiter TDTP2
Pas encore d'évaluation
ATraiter TDTP2
4 pages
Exercice Random Forest Classification Bayesienne
Pas encore d'évaluation
Exercice Random Forest Classification Bayesienne
5 pages
Chap2 Machine Learning Et Outils IA
Pas encore d'évaluation
Chap2 Machine Learning Et Outils IA
6 pages
Chapitre 2 Apprentissage Automatique: Les Arbres de Décision
Pas encore d'évaluation
Chapitre 2 Apprentissage Automatique: Les Arbres de Décision
12 pages
Arbre de décision en Data Mining avec Python
100% (1)
Arbre de décision en Data Mining avec Python
6 pages
Travaux Pratiques N°2: Travail À Faire
Pas encore d'évaluation
Travaux Pratiques N°2: Travail À Faire
2 pages
CM 03 - Apprentissage DArbres de Décision 2pp
Pas encore d'évaluation
CM 03 - Apprentissage DArbres de Décision 2pp
9 pages
TP7 Fouille de Données 2025
Pas encore d'évaluation
TP7 Fouille de Données 2025
5 pages
Chapitre V - Arbre de Décision - Introduction À L'apprentissage Automatique
Pas encore d'évaluation
Chapitre V - Arbre de Décision - Introduction À L'apprentissage Automatique
17 pages
Aah
Pas encore d'évaluation
Aah
2 pages
Random Forest
Pas encore d'évaluation
Random Forest
33 pages
INF1421 Excercice Module7 Jan2019
Pas encore d'évaluation
INF1421 Excercice Module7 Jan2019
2 pages
Cours ML Arbres
Pas encore d'évaluation
Cours ML Arbres
52 pages
Chapitre4 DTree&Foret
Pas encore d'évaluation
Chapitre4 DTree&Foret
70 pages
DM Slides DT
Pas encore d'évaluation
DM Slides DT
31 pages
Rapport Converti
Pas encore d'évaluation
Rapport Converti
8 pages
TP: Découverte de CART avec rpart
100% (1)
TP: Découverte de CART avec rpart
12 pages
Random Forest
Pas encore d'évaluation
Random Forest
17 pages
Algorithme Random Forest : Guide SEO
Pas encore d'évaluation
Algorithme Random Forest : Guide SEO
11 pages
Algorithmes clés du data mining
Pas encore d'évaluation
Algorithmes clés du data mining
20 pages
Pipeline
Pas encore d'évaluation
Pipeline
29 pages
Ex Remp-Imn2015
Pas encore d'évaluation
Ex Remp-Imn2015
3 pages
Examen 2014 IMN
Pas encore d'évaluation
Examen 2014 IMN
4 pages
CoursIntro S1 S2 New
Pas encore d'évaluation
CoursIntro S1 S2 New
43 pages
Cours FiltreContours S6
Pas encore d'évaluation
Cours FiltreContours S6
9 pages
Acova Commande Irs Appareils El Air Notice Utilisation 40016513 - 0
Pas encore d'évaluation
Acova Commande Irs Appareils El Air Notice Utilisation 40016513 - 0
17 pages
CT TGT
Pas encore d'évaluation
CT TGT
1 page
3-4CX Ecomax
Pas encore d'évaluation
3-4CX Ecomax
14 pages
04-Sujet DT
Pas encore d'évaluation
04-Sujet DT
6 pages
Traction et Compression des Matériaux
Pas encore d'évaluation
Traction et Compression des Matériaux
21 pages
Torseur Statique et Liaisons Mécaniques
100% (1)
Torseur Statique et Liaisons Mécaniques
4 pages
Description:: Ref: MMA-250DP
Pas encore d'évaluation
Description:: Ref: MMA-250DP
2 pages
Note de Calcul O.A.3.2
Pas encore d'évaluation
Note de Calcul O.A.3.2
51 pages
M5 TD3
Pas encore d'évaluation
M5 TD3
2 pages
Preparation Stages Drone
Pas encore d'évaluation
Preparation Stages Drone
1 page
Système de contrôle pour éviter le rattrapage
Pas encore d'évaluation
Système de contrôle pour éviter le rattrapage
18 pages
1-Bon de Travail
Pas encore d'évaluation
1-Bon de Travail
8 pages
TD 2020
Pas encore d'évaluation
TD 2020
2 pages
Analyse Maintenance: Méthodes 5P, Ishikawa, Pareto
100% (1)
Analyse Maintenance: Méthodes 5P, Ishikawa, Pareto
6 pages
FR Autocad Electrical Detail Brochure Low Res
Pas encore d'évaluation
FR Autocad Electrical Detail Brochure Low Res
16 pages
2 - M2BIVRD - Cours ECLAIRAGE RESEAUX
100% (1)
2 - M2BIVRD - Cours ECLAIRAGE RESEAUX
125 pages
TD5 - 2025 Mecanique Du Fluide
Pas encore d'évaluation
TD5 - 2025 Mecanique Du Fluide
2 pages
ATec 3.3 - 18-958 - V3
Pas encore d'évaluation
ATec 3.3 - 18-958 - V3
135 pages
Évaluation Circuit Électrique 5ème
Pas encore d'évaluation
Évaluation Circuit Électrique 5ème
4 pages
MECAH301 Cours 08a-Rankine
100% (1)
MECAH301 Cours 08a-Rankine
25 pages
Coursuml3 PDF
Pas encore d'évaluation
Coursuml3 PDF
0 page
Accessoires Eeg Emg
Pas encore d'évaluation
Accessoires Eeg Emg
2 pages
Codes de Ligne et Formule de Bennet
Pas encore d'évaluation
Codes de Ligne et Formule de Bennet
17 pages
Système de Freinage 02
Pas encore d'évaluation
Système de Freinage 02
43 pages
Systeme Pas A Pas
Pas encore d'évaluation
Systeme Pas A Pas
1 page
Devis pour Dalles Antidérapantes en Algérie
Pas encore d'évaluation
Devis pour Dalles Antidérapantes en Algérie
3 pages
ASSA ABLOY SL500 SA TechDataSheet
Pas encore d'évaluation
ASSA ABLOY SL500 SA TechDataSheet
2 pages
Onduleurs Agréés pour Réseau BT STEG
Pas encore d'évaluation
Onduleurs Agréés pour Réseau BT STEG
18 pages
TD n0 Les Besoins en M.O 9 Exercices-1
100% (3)
TD n0 Les Besoins en M.O 9 Exercices-1
2 pages
Cours-Industrie de BTP
Pas encore d'évaluation
Cours-Industrie de BTP
24 pages