0% ont trouvé ce document utile (0 vote)

65 vues30 pages

chapter09.7.ML-SL-Decision Trees

Les arbres de décision (AD) sont des structures utilisées pour la classification et l'estimation d'attributs, où chaque nœud représente un test sur un attribut et chaque feuille une valeur cible. La construction d'un AD implique le choix d'attributs basés sur des critères tels que le gain d'information, et des algorithmes comme ID3 et C4.5 sont couramment utilisés pour créer ces arbres en minimisant l'erreur de classification.

Transféré par

benahmedroua2

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

65 vues30 pages

chapter09.7.ML-SL-Decision Trees

Transféré par

benahmedroua2

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Arbres de décision

Notations

• N exemples d’apprentissage

• d variables explicatives

• (Y,X1,X2,…,Xd) les variables de la population

• (yi,xi) est le vecteur des réalisations de (Yi,Xi)

Principe des arbres de décisions (AD)

• À partir de ces exemples d’apprentissage, on construit un

arbre de décision, tel que:

 Un nœud correspond à un test sur la valeur d'un ou

plusieurs attributs;
 Une branche partant d'un nœud correspond à une ou
plusieurs valeurs de ce test;
 Une feuille est associée une valeur de l'attribut cible Y.

3
Principe des arbres de décisions (AD)

• L'arbre de décision est exploité de différentes manières :

1. En y classant de nouvelles données;

2. En faisant de l'estimation d'attributs;

3. En extrayant un jeu de règles de classification;

4. En interprétant la pertinence des attributs.

4
Construction d’un AD – Exemple

• Soit à un ensemble de jours (un jour = un exemple).

• Chaque jour est caractérisé par un numéro et ses conditions

météorologiques (ciel, température, humidité de l'air, force
du vent).

• L'attribut cible étant « jouer au tennis ? », dont les valeurs

possibles sont Y = {oui, non}.

• Une fois l'arbre de décision construit, on pourra classer une

nouvelle donnée pour savoir « si on joue ou non ce jour-là ».

5
Construction d’un AD – Exemple

6
Construction d’un AD – Exemple
• Soit un exemple d’AD:

• L’exemple de ligne 1 du tableau

sera classé comme «oui» ! 7

Construction d’un AD

• La construction d’un AD optimal (minimisant l'erreur de

classification) est un problème NP-complet.

• Au lieu de construire l'arbre de décision optimal pour un jeu

d'exemples donné, on se contente de construire un arbre de
décision ‘correct‘.

• Plusieurs algorithmes ont été proposés pour construire des

AD, dont CART, ID3 et C4.5 :
• ID3 ne prend en compte que des attributs nominaux.
• C4.5 prend également en charge des attributs quantitatifs.

8
Construction d’un AD

• Dans notre exemple, on suppose que tous les attributs sont

nominaux.
• ID3 et C4.5 fonctionnent récursivement comme suit :
Déterminer un attribut à placer en racine de l'arbre. La
racine possède autant de branches que de valeurs pour cet
attribut.
À chaque branche est associé un ensemble d'exemples
dont l'attribut prend la valeur qui étiquette cette branche.
On accroche alors au bout de cette branche l'arbre de
décision construit sur ce sous-ensemble d’exemples, en
considérant tous les attributs excepté celui qui vient d’être
mis à la racine.
9
Arbres de décision: Algorithmes ID3, C4.5

Nœud = racine;

1- att ← meilleur attribut de décision pour prochain nœud;

2- Assigner att comme attribut de décision au nœud;
3- Pour chaque valeur de att, créer un nœud descendant;
4- Trier les exemples d’entrainement dans les feuilles de l’arbre;
5- Si (les exemples sont parfaitement classés)
STOP;
sinon
Itérer sur le nœud feuille.
fin

10
Choix de l’attribut de décision

Soit un exemple de nœud pour lequel on doit choisir un attribut

de décision:
[29+, 35-] a1? [29+, 35-] a2?

[21+, 05-] [8+, 30-] [18+, 33-] [11+, 02-]

Quel attribut de décision choisir, a1 ou a2?

11
Choix de l’attribut de décision

• Les algorithmes de construction d’AD fonctionnent de haut

en bas, en choisissant à chaque étape une variable qui
divise le mieux l’ensemble des exemples.

• Les métriques utilisées pour choisir un meilleur attribut

mesurent en général l’homogénéité de la variable cible
dans les sous-ensembles résultants de la division de nœuds.

• Une autre mesure est le gain d’information, qui se base sur

le concept d’entropie de la théorie de l’information.

12
Choix de l’attribut de décision

Entropie (cas d’une variable avec un attribut x)

• Soit (x) la distribution de la variable x mesurant l’incertitude

sur la valeur de la variable.

• Certaines valeurs de variables sont moins sures que d’autres.

p(x) p(y)
x y

• L’entropie mesure le nombre de bits requis pour encoder x.

13
Choix de l’attribut de décision

• L’entropie (x) d’une variable aléatoire x est définie par:

(x)= - ∑ (x = ) log2( (x = ))
X =

• (x) est le nombre de bits attendu pour encoder les valeurs de

la variable aléatoire x.

• Un code efficace assigne - log2( (x = )) bits pour encoder

un message x = . La valeur attendu de la longueur du code
est alors définie par la formule en haut.
14
Choix de l’attribut de décision (cas binaire)

• Pour K = 2 (deux classes), les éléments de la classe C1 seront

dénotés par ⊕ et ceux de la classe C2 par ⊖. On aura:

x =− ⊕log2( ⊕) − ⊖log2( ⊖)

• ⊕ et ⊖ sont les proportions des deux classes dans le nœud,

avec ⊕ + ⊖ = 1.

On aura aussi:
• 0 ≤ (x)≤ 1.
• Si ⊕= 0 ou ⊖ = 0, alors (x)= 0.
• Si ⊕= ⊖ = 0.5, alors (x)= 1 (entropie maximale).

15
Choix de l’attribut de décision (cas binaire)

• Pour le cas de 2 classes, on aura le graphe suivant de x:

• L’entropie mesure le degré d’impureté d’un nœud.

16
Choix de l’attribut de décision (cas binaire)

• Soit une population d'exemples D . Le gain d'information de D

par rapport à un attribut donné est la variation d'entropie
causée par la partition de D selon .

|D aj=v |
! D, = D − ∑ D aj=v
|D|
∈ %&'()( )

• D aj=v ⊂ D est l’ensemble des exemples ayant = .

• |D|indique la cardinalité de l’ensemble D .

17
Choix de l’attribut de décision (cas binaire)

• Si prends par exemple 3 valeurs ∈ { 1, 2, 3} , la partition

de D va former 3 parties: D aj=v1 ,Daj=v2 ,Daj=v3. Le gain
d’information est donné par:

D aj=v1 |D aj=v2 | D aj=v3

D − D aj=v1 − D aj=v2 − D aj=v3
|D| |D| |D|

• On peut dire donc que le gain est la différence entre

l'entropie moyenne des exemples D et l'entropie moyenne
une fois que D a été partitionné selon les valeurs de .

• On notera que plus cette différence (le gain) est grande, plus
l’homogénéisation est grande.
18
Choix de l’attribut de décision (cas binaire)

Exercice:
a y
6 ⊕  faible
2 ⊖  faible 9⊕
3 ⊕  fort 5⊖
3 ⊖  fort

• Dans cet exemple, il existe 9 ⊕ et 5 ⊖. Parmi ces exemples,

6 ⊕ et 2 ⊖ prennent la valeur «faible» pour l'attribut a,
tandis que les autres exemples prennent la valeur «fort»
pour cet attribut.
• Calculer le gain d’information !(D , ) pour l’attribut , si
on choisi de le placer en racine. 19
Solution:
a y
6 ⊕  faible
2 ⊖  faible 9⊕
3 ⊕  fort 5⊖
3 ⊖  fort

− 8 D − 6 D
! D, = - =faible =fort
14 14
9 9 5 5
- =− log2 − log2 = 0.940
14 14 14 14
6 6 2 2
D =faible = − log2 − log2 = 0.811
8 8 8 8
3 3 3 3
D =fort = − log2 − log2 =1
6 6 6 6
8 6
! D, = 0.940 − 0.811 − 1 = 0.940 − 0.8920 = 0.048
14 14 20
Choix de l’attribut de décision (cas binaire)

• Le principe de l'algorithme ID3 pour déterminer l'attribut à

placer à la racine de l’AD est de:

Chercher l'attribut qui possède le gain d'information

maximum, le placer en racine.

 Itérer pour chaque fils, c.à.d. pour chaque valeur de

l'attribut.

Arrêter l'algorithme quand le gain est négligeable.

21
Étude d’un exemple d’AD

Pour notre exemple: « jouer au tennis?»,

• les exemples n’étant ni tous ⊕, ni tous ⊖, l'ensemble des

attributs n’étant pas vide, on calcule les gains d’information
pour chaque attribut:

• Donc, la racine de l’AD est l’attribut « Ciel ».

22
Étude d’un exemple d’AD

• L'attribut « Ciel » peut prendre 3 valeurs: Ensoleillé, Pluie et

Couvert.
• La branche « Ensoleillé »: ID3, appelé récursivement avec 5
exemples: (1), (2), (8), (9) , (11).

23
Étude d’un exemple d’AD

• L'attribut « Ciel » peut prendre 3 valeurs: Ensoleillé, Pluie et

Couvert.
• La branche « Ensoleillé »: ID3, appelé récursivement avec 5
exemples: (1), (2), (8), (9) , (11).
• Les gains d'information des 3 attributs restants sont alors :

• L'attribut « Humidité » sera donc choisi ;

• on continue la construction de l’AD récursivement.

24
Étude d’un exemple d’AD

• La branche « Pluie »: partant de la racine, ID3 est appelé

récursivement avec 5 exemples: (4), (5), (6), (10), (14).

• On continue la construction de l’AD récursivement .

• La branche « Couvert »: partant de la racine, ID3 est appelé

récursivement avec 4 exemples: (3), (7), (12), (13).

• Dans ce dernier cas, tous les exemples sont ⊕ : on affecte

donc tout de suite la classe « oui » à cette feuille.

25
Étude d’un exemple d’AD

• L’arbre final sera donné par le graphe:

26
Étude d’un exemple d’AD

On peut faire les remarques suivantes sur le graphe:

• L'attribut « Température », n’est pas utilisé dans l’AD, signifie

que cet attribut n'est pas pertinent pour déterminer la classe.

• Si l’attribut « Ciel » vaut « Ensoleillé» , l'attribut « Vent » n'est

pas pertinent.

• Si l'attribut « Ciel » vaut « Pluie », l'attribut « Humidité» n'est

pas pertinent.

27
Classification par AD

En ayant un AD construit à partir d’exemples d’apprentissage D ,

la classification d’une nouvelle donnée x se fait par l’algorithme
suivant:
Algorithme: entrées (AD, x)
• Nc = racine (AD)
• Tant-que (Nc ≠ feuille) faire:
- En fonction de l'attribut testé dans Nc et de sa valeur
dans x, suivre l'une des branches de Nc.
- Le nœud atteint devient Nc.
• Fin tant-que
• Retourner Étiquette (Nc).

28
Classification par AD

Exercice: Classer les exemples suivants:

= (Ensoleillé, Fraîche, Elevée, Fort) ;

= (Ensoleillé, Fraîche, Normale, Fort) ;

= (Pluie, Chaude, Normale, Faible);

= (Pluie, Fraîche, Elevée, Fort).

29
Classification par AD

Exercice: Classer les exemples suivants:

= (Ensoleillé, Fraîche, Elevée, Fort) ;

Non
= (Ensoleillé, Fraîche, Normale, Fort) ;
Oui
= (Pluie, Chaude, Normale, Faible);
Oui
= (Pluie, Fraîche, Elevée, Fort).
Non

Vous aimerez peut-être aussi

Introduction aux arbres de décision
Pas encore d'évaluation
Introduction aux arbres de décision
75 pages
Algorithmes KPPV et Arbres de Décision
Pas encore d'évaluation
Algorithmes KPPV et Arbres de Décision
129 pages
DM-Rapport-Arbres de Decision
Pas encore d'évaluation
DM-Rapport-Arbres de Decision
11 pages
Arbre Decision
Pas encore d'évaluation
Arbre Decision
43 pages
Arbres de décision en apprentissage automatique
Pas encore d'évaluation
Arbres de décision en apprentissage automatique
39 pages
Apprentissage par Arbres de Décision
Pas encore d'évaluation
Apprentissage par Arbres de Décision
37 pages
Exemple d'Arbre de Décision
Pas encore d'évaluation
Exemple d'Arbre de Décision
39 pages
Classification Par Arbre de Décision ID3 C4.5 EXC
Pas encore d'évaluation
Classification Par Arbre de Décision ID3 C4.5 EXC
103 pages
Arbres - Decision 18 19
Pas encore d'évaluation
Arbres - Decision 18 19
76 pages
Arbres de Decision PDF
Pas encore d'évaluation
Arbres de Decision PDF
43 pages
Arbres de Décision : Classification et Segmentation
Pas encore d'évaluation
Arbres de Décision : Classification et Segmentation
43 pages
Arbres de Décision
100% (1)
Arbres de Décision
23 pages
Arbres de décision en classification supervisée
Pas encore d'évaluation
Arbres de décision en classification supervisée
55 pages
Arbre de décision en intelligence artificielle
Pas encore d'évaluation
Arbre de décision en intelligence artificielle
9 pages
Systèmes de Classification par Règles
Pas encore d'évaluation
Systèmes de Classification par Règles
11 pages
Arbre de Décision ET KNN PDF
Pas encore d'évaluation
Arbre de Décision ET KNN PDF
47 pages
Arbres de Décision et FDD par Christelle Scharff
Pas encore d'évaluation
Arbres de Décision et FDD par Christelle Scharff
52 pages
1 Construction D'arbre de Dã©cision 2 Arbre de Dã©cision Et Choix Des PDF
Pas encore d'évaluation
1 Construction D'arbre de Dã©cision 2 Arbre de Dã©cision Et Choix Des PDF
3 pages
Cours Arbres de Décision
Pas encore d'évaluation
Cours Arbres de Décision
6 pages
Série TD3
100% (1)
Série TD3
11 pages
Classification par Arbres de Décision
Pas encore d'évaluation
Classification par Arbres de Décision
56 pages
Arbres de décision : Concepts et Algorithmes
Pas encore d'évaluation
Arbres de décision : Concepts et Algorithmes
29 pages
Arbres de Décision en Apprentissage Automatique
Pas encore d'évaluation
Arbres de Décision en Apprentissage Automatique
6 pages
Chapitre 5 - Les Arbres de D-Cision
Pas encore d'évaluation
Chapitre 5 - Les Arbres de D-Cision
33 pages
Méthodes d'apprentissage automatique
Pas encore d'évaluation
Méthodes d'apprentissage automatique
122 pages
Arbres de Decision
Pas encore d'évaluation
Arbres de Decision
19 pages
Chap Classification Prediction
Pas encore d'évaluation
Chap Classification Prediction
42 pages
Arbres de Décision et Algorithme ID3
Pas encore d'évaluation
Arbres de Décision et Algorithme ID3
17 pages
Arbres de Décision en Machine Learning
Pas encore d'évaluation
Arbres de Décision en Machine Learning
82 pages
Chap5 - Arbres de Décision
Pas encore d'évaluation
Chap5 - Arbres de Décision
55 pages
ID3 Et C4.5
Pas encore d'évaluation
ID3 Et C4.5
7 pages
Arbres de Decision
Pas encore d'évaluation
Arbres de Decision
80 pages
Introduction aux arbres de décision en ML
Pas encore d'évaluation
Introduction aux arbres de décision en ML
17 pages
Arbres de décision : Guide complet
100% (1)
Arbres de décision : Guide complet
19 pages
Cour 3
Pas encore d'évaluation
Cour 3
9 pages
Arbres de décision : Méthodes et exercices
Pas encore d'évaluation
Arbres de décision : Méthodes et exercices
2 pages
Chapitre 2 A
Pas encore d'évaluation
Chapitre 2 A
164 pages
Arbres de Décision en Apprentissage Automatique
Pas encore d'évaluation
Arbres de Décision en Apprentissage Automatique
88 pages
Cours5 ArbresDécision
Pas encore d'évaluation
Cours5 ArbresDécision
35 pages
Arbres de Décision et Prédiction
Pas encore d'évaluation
Arbres de Décision et Prédiction
8 pages
Arbres de décision en apprentissage supervisé
Pas encore d'évaluation
Arbres de décision en apprentissage supervisé
33 pages
Arbres de Décision en Classification
Pas encore d'évaluation
Arbres de Décision en Classification
23 pages
Introduction à l'Apprentissage Automatique
Pas encore d'évaluation
Introduction à l'Apprentissage Automatique
164 pages
Ad Handout PDF
Pas encore d'évaluation
Ad Handout PDF
7 pages
ML Add2
Pas encore d'évaluation
ML Add2
28 pages
Introduction au Datamining : Exercices et Méthodes
Pas encore d'évaluation
Introduction au Datamining : Exercices et Méthodes
3 pages
Chapitre4 DTree&Foret
Pas encore d'évaluation
Chapitre4 DTree&Foret
70 pages
Arbres de décision en apprentissage automatique
Pas encore d'évaluation
Arbres de décision en apprentissage automatique
12 pages
Arbres de Décisions
Pas encore d'évaluation
Arbres de Décisions
11 pages
Cours Machine Learning - Arbre de Décision
Pas encore d'évaluation
Cours Machine Learning - Arbre de Décision
71 pages
Classification en Data Mining : Méthodes et Applications
Pas encore d'évaluation
Classification en Data Mining : Méthodes et Applications
32 pages
DM Slides DT
Pas encore d'évaluation
DM Slides DT
31 pages
Apprentissage Supervisé et Classification
Pas encore d'évaluation
Apprentissage Supervisé et Classification
83 pages
Dic9380 Arbres Decision
Pas encore d'évaluation
Dic9380 Arbres Decision
47 pages
Arbres de décision en apprentissage automatique
Pas encore d'évaluation
Arbres de décision en apprentissage automatique
61 pages
Méthodes de Classification en Apprentissage Supervisé
Pas encore d'évaluation
Méthodes de Classification en Apprentissage Supervisé
63 pages
Module: Fouille de Données TD 1: Classification Par Arbre de Décision
Pas encore d'évaluation
Module: Fouille de Données TD 1: Classification Par Arbre de Décision
3 pages
Apprentissage par Arbres de Décision
Pas encore d'évaluation
Apprentissage par Arbres de Décision
26 pages
2 Quadrature
Pas encore d'évaluation
2 Quadrature
18 pages
Correction Du Devoir Surveillé
Pas encore d'évaluation
Correction Du Devoir Surveillé
6 pages
Leçon 5-IA-Agents Intelligents
Pas encore d'évaluation
Leçon 5-IA-Agents Intelligents
20 pages
TD in
Pas encore d'évaluation
TD in
6 pages
Question Recherche Interpretabilite
Pas encore d'évaluation
Question Recherche Interpretabilite
2 pages
1 Introduction
Pas encore d'évaluation
1 Introduction
12 pages
TD RS
Pas encore d'évaluation
TD RS
2 pages
TD2 Correction
Pas encore d'évaluation
TD2 Correction
4 pages
Atelier 2
Pas encore d'évaluation
Atelier 2
2 pages
Rapport de Projet
Pas encore d'évaluation
Rapport de Projet
7 pages
Chapitre 5 Les Réseaux de Petri
Pas encore d'évaluation
Chapitre 5 Les Réseaux de Petri
44 pages
Phénomène de l'évaporation de l'eau
Pas encore d'évaluation
Phénomène de l'évaporation de l'eau
2 pages
Réseaux Sémantiques en IA
Pas encore d'évaluation
Réseaux Sémantiques en IA
28 pages
Analyse des données et IA en multimédia
Pas encore d'évaluation
Analyse des données et IA en multimédia
3 pages
Devoir
Pas encore d'évaluation
Devoir
10 pages
Graphes Conceptuels en Intelligence Artificielle
Pas encore d'évaluation
Graphes Conceptuels en Intelligence Artificielle
10 pages
Analyse des performances d'un projet logiciel
Pas encore d'évaluation
Analyse des performances d'un projet logiciel
1 page
Cours Plaques
Pas encore d'évaluation
Cours Plaques
31 pages
La Nouvelle Vague Un Cinéma Au Masculin Singulier - Genevieve Sellier
Pas encore d'évaluation
La Nouvelle Vague Un Cinéma Au Masculin Singulier - Genevieve Sellier
352 pages
Sujet Oli 9N 2024
Pas encore d'évaluation
Sujet Oli 9N 2024
2 pages
Memoir Procede de Séchage
Pas encore d'évaluation
Memoir Procede de Séchage
287 pages
Les Murs
Pas encore d'évaluation
Les Murs
7 pages
Évaluation Mathématiques Baccalauréat 2021
Pas encore d'évaluation
Évaluation Mathématiques Baccalauréat 2021
3 pages
Transferts Génétiques Chez Les Bactéries
Pas encore d'évaluation
Transferts Génétiques Chez Les Bactéries
36 pages
Solym HDR
Pas encore d'évaluation
Solym HDR
275 pages
Projet Transport
Pas encore d'évaluation
Projet Transport
3 pages
Manuel Du Systeme
Pas encore d'évaluation
Manuel Du Systeme
2 pages
Délivrance de l'attestation conducteur train
Pas encore d'évaluation
Délivrance de l'attestation conducteur train
118 pages
Créer un diagramme de processus Visio
Pas encore d'évaluation
Créer un diagramme de processus Visio
13 pages
Revu Memoire Diakite - 104644
Pas encore d'évaluation
Revu Memoire Diakite - 104644
85 pages
Étude de dessalement à Mostaganem
100% (2)
Étude de dessalement à Mostaganem
149 pages
Comprendre les préfixes binaires
Pas encore d'évaluation
Comprendre les préfixes binaires
4 pages
Flottation Cours 1
Pas encore d'évaluation
Flottation Cours 1
57 pages
Exercices de Grammaire Française: Articles et Adjectifs
Pas encore d'évaluation
Exercices de Grammaire Française: Articles et Adjectifs
3 pages
CV - 2022-12-26 - Mohamed Amine - BAHRIA
100% (1)
CV - 2022-12-26 - Mohamed Amine - BAHRIA
2 pages
Projet Go-Kart
Pas encore d'évaluation
Projet Go-Kart
32 pages
Activites Sequence 8
Pas encore d'évaluation
Activites Sequence 8
2 pages
Le Tour Effel
Pas encore d'évaluation
Le Tour Effel
2 pages
EXAMEN2024 Controle
Pas encore d'évaluation
EXAMEN2024 Controle
2 pages
1-Pourquoi Une GMAO
Pas encore d'évaluation
1-Pourquoi Une GMAO
18 pages
Le PZT
Pas encore d'évaluation
Le PZT
3 pages
William Branham Prêche Du 26-08-55
Pas encore d'évaluation
William Branham Prêche Du 26-08-55
10 pages
TD Série N 1
Pas encore d'évaluation
TD Série N 1
2 pages
Planification Ceb CM1
78% (9)
Planification Ceb CM1
38 pages
La Science Comme Produit Et Comme Processus
Pas encore d'évaluation
La Science Comme Produit Et Comme Processus
3 pages
Projet de Cession Marjane Holding
Pas encore d'évaluation
Projet de Cession Marjane Holding
24 pages
Papyrus d'Ani : Héritage Spirituel Kémite
100% (1)
Papyrus d'Ani : Héritage Spirituel Kémite
4 pages