ML3

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

37 vues6 pages

ML3

Transféré par

chaimaeelhmami20

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Plan

• Introduction à la science des données

• Notions d’apprentissage statistique
Apprentissage automatique • Bayes Naïf
• Arbres de décision
Lecture 3: Arbres de décision
• Réseaux de neurones artificiels
Département Génie Informatique, FST de Tanger • Labs + 2 Devoirs (Python)
M. AIT KBIR • 1 CC

2018-2019 M. AIT KBIR (MST MBD/SIM) 2

Arbres de décision : Exemples Entropie: Définition

Le terme entropie caractérise le degré de désorganisation, ou

d'imprédictibilité du contenu en information d'un système.

Utile dans :
• Codage de l’information
• Physique statistique
• Apprentissage automatique

2018-2019 M. AIT KBIR (MST MBD/SIM) 3 2018-2019 M. AIT KBIR (MST MBD/SIM) 4
Entropie Entropie : codage de l’information

• Entropie élevée : variable aléatoire est issu d’une distribution plate

• Entropie basse : variable aléatoire issu d’une distribution non plate
(avec des vallées et des pics)

2018-2019 M. AIT KBIR (MST MBD/SIM) 5 2018-2019 M. AIT KBIR (MST MBD/SIM) 6

Entropie : codage de l’information Arbre décision: diviser pour régner

Les états sont équiprobables: Pour créer un arbre de décision, on doit prendre
une décision sur l’ensemble de données pour
savoir la caractéristique à utiliser pour fractionner
les données. Ensuite, diviser le jeu de données en
sous-ensembles. On parcourt ensuite les branches
à partir du nœud créé. Si les données sur une
Longueur moyenne du code: sous-branche appartiennent à la même classe, on
a pas besoin de continuer à les diviser. Si les
données ne sont pas identiques, on doit répéter le
processus de division sur ce sous-ensemble.

2018-2019 M. AIT KBIR (MST MBD/SIM) 7 2018-2019 M. AIT KBIR (MST MBD/SIM) 8
Algorithme : ID3 (Iterative Dichotomiser 3)
Mesure de d’information Développé en 1986 par Ross Quinlan

Le changement d'information avant et après la

division est connu sous le nom de gain
d’information. On fractionne les données en
choisissant chaque fois la division qui donne le
gain d’information le plus élevé.

2018-2019 M. AIT KBIR (MST MBD/SIM) 9 2018-2019 M. AIT KBIR (MST MBD/SIM) 10

Detectlanguage

Algorithme ID3: Stratégie de croissance de l’arbre

Gain d’information
• Règle de fractionnement: qui détermine le seuil de
décision sur les données d'un nœud.
• Condition d’arrêt: qui détermine la fin de la
récursivité. C'est la règle qui détermine si un nœud
est feuille ou non. Par exemple: tous les exemples
appartiennent à la même classe, Il ne reste aucun
attribut pour plus de fractionnement ou il n'y a plus
d’exemples
• Règle d'étiquetage: qui attribue une étiquette de
classe à chaque nœud feuille, le vote à la majorité
est utilisé pour classer la feuille.

2018-2019 M. AIT KBIR (MST MBD/SIM) 11 2018-2019 M. AIT KBIR (MST MBD/SIM) 12
Gain d’information (Exemple : jouer au tennis)
Entropie : Division
Day Outlook Temperature Humidity Wind PlayTennis

1 sunny hot high weak no

2 sunny hot high strong no
3 overcast hot high weak yes
4 rain mild high weak yes
5 rain cool normal weak yes
6 rain cool normal strong no
7 overcast cool normal strong yes
8 sunny mild high weak no
9 sunny cool normal weak yes
10 rain mild normal weak yes
11 sunny mild normal strong yes
12 overcast mild high strong yes
Si on transfert l’unique (+) du deuxième 13 overcast hot normal weak yes
ensemble sur le premier: 14 rain mild high strong no
GI = 0.99-0.45=0,54 > 0,38

2018-2019 M. AIT KBIR (MST MBD/SIM) 13 2018-2019 M. AIT KBIR (MST MBD/SIM) 14

Gain d’information (Exemple : jouer au tennis) Gain d’information (Exemple : jouer au tennis)

2018-2019 M. AIT KBIR (MST MBD/SIM) 15 2018-2019 M. AIT KBIR (MST MBD/SIM) 16
Gain d’information (Exemple : jouer au tennis)
Indice Gini : mesure d’impureté

Le coefficient de Gini est une mesure statistique qui

permet de mesurer des disparités dans une population. Si
S contient des exemples issus de C classes
C
:
Gini ( S ) = 1 − ∑ p ( w j ) 2
j =1

Lors de la construction d’un arbre de décision, il s’agit de

fractionner par rapport à la caractéristique avec la valeur
minimal de l’indice. j 2
1 C Mi ( S im )
Gini ( x i ) = 1 −
S
∑∑
j =1 m =1 S im

2018-2019 M. AIT KBIR (MST MBD/SIM) 17 2018-2019 M. AIT KBIR (MST MBD/SIM) 18

Arbres de décision Arbres de décision: problèmes

Avantages: • Choix d’une mesure qui permet d’évaluer
• Les arbres peuvent gérer les espaces de grande dimensionnalité
aisément. objectivement la qualité d’un fractionnement et ainsi
• Vu la nature hiérarchique de l’algorithme, le calcul des probabilité de sélectionner le meilleur parmi les descripteurs
est extrêmement rapide.
• Les arbres peuvent traiter des données caractéristiques discrètes
candidats par rapport à un nœud.
aussi bien que continues. • Choix d’un ou plusieurs seuil pour les attributs
Inconvénients: continus et la mise en concurrence de ces derniers et
• ID3 n’est pas adapté aux attributs continus
• Souffre de quelques problèmes comme le sur-apprentissage, il peut
les attributs discrets.
donne comme résultat un optimum local et non pas la solution • Utilisation des règles efficaces pour définir la taille
globale.
• L’arbre peut nécessiter l’élagage
adéquate de l’arbre de décision lorsqu’un
Autres algorithmes adaptés aux caractéristiques continues: C4.5 partitionnement pur des observations de la base n’est
et C5.0 (successeurs de ID3) et CART (Classification and pas possible.
Regression Trees). • Utilisation des règles de décision optimales lorsque
qu’une feuille contient des exemples avec des
2018-2019 M. AIT KBIR (MST MBD/SIM)
19 classes différentes.M. AIT KBIR (MST MBD/SIM)
2018-2019
20
Arbres de décision (C 4.5), R. Quinlan, 1993 Arbres de décision : CART
C4.5 est une amélioration de ID3 qui permet de traiter les attributs numériques (Classification and Regression Trees), L. Breiman et al., 1984
continus, par le partitionnement de ces derniers en un ensemble d’intervalles.
L’arbre générée est formulée sous forme d’un nombre de règles SI-ALORS. Cette CART supporte des valeurs numériques continues
technique fractionne par rapport à xi qui maximise le rapport de gain suivant:
pour l’attribut cible (Régression), au lieu d’avoir
comme valeurs possibles un ensemble d’étiquettes.
CART impose une construction d’arbres binaires, les
valeurs des attributs sont regroupées en deux sous-
ensembles de manière à avoir le gain d’information
maximum à chaque nœud. Le critère Gini est utilisé
Il s’agit de trier les valeurs de l’attribut, itérer à travers les seuils, moyenne des pour le fractionnement.
deux valeurs qui correspondent au changement de classe, et séparer le jeu de
données en deux ensembles. Puis calculer le rapport de gain pour chaque valeur Temps de construction de l’arbre est élevé, surtout
du seuil, pour garder celle qui correspond au maximum.
lorsque la base des exemples est de grande taille.
Mais, on obtient un arbre avec des bonnes
performances.
21 22
2018-2019 M. AIT KBIR (MST MBD/SIM) 2018-2019 M. AIT KBIR (MST MBD/SIM)

Arbres de décision (CHAID)

(CHi-squared Automatic Interaction Detection) – G, Kass, 1980

23
2018-2019 M. AIT KBIR (MST MBD/SIM)

Vous aimerez peut-être aussi

Classification Par Arbre de Décision ID3 C4.5 EXC
Pas encore d'évaluation
Classification Par Arbre de Décision ID3 C4.5 EXC
103 pages
Cours AA 11 Octobre
Pas encore d'évaluation
Cours AA 11 Octobre
39 pages
Exemple d'Arbre de Décision
Pas encore d'évaluation
Exemple d'Arbre de Décision
39 pages
Chapitre V - Arbre de Décision - Introduction À L'apprentissage Automatique
Pas encore d'évaluation
Chapitre V - Arbre de Décision - Introduction À L'apprentissage Automatique
17 pages
ID3 Et C4.5
Pas encore d'évaluation
ID3 Et C4.5
7 pages
Cours Arbres de Décision
Pas encore d'évaluation
Cours Arbres de Décision
6 pages
Arbre de décision en intelligence artificielle
Pas encore d'évaluation
Arbre de décision en intelligence artificielle
9 pages
Arbres de Décision et FDD par Christelle Scharff
Pas encore d'évaluation
Arbres de Décision et FDD par Christelle Scharff
52 pages
Chapitre 2 - Arbres - de - Décision - Part1 PDF
Pas encore d'évaluation
Chapitre 2 - Arbres - de - Décision - Part1 PDF
34 pages
Chapitre 2 Arbres de Decision
Pas encore d'évaluation
Chapitre 2 Arbres de Decision
34 pages
Arb Dec
100% (1)
Arb Dec
19 pages
Chap Arbre
Pas encore d'évaluation
Chap Arbre
29 pages
Arbres de Decision PDF
Pas encore d'évaluation
Arbres de Decision PDF
43 pages
Intelligence Artificielle: Pr. Hiba Chougrad Année-Universitaire: 2019-2020
Pas encore d'évaluation
Intelligence Artificielle: Pr. Hiba Chougrad Année-Universitaire: 2019-2020
85 pages
Arbres de Décisions
Pas encore d'évaluation
Arbres de Décisions
11 pages
Chapitre SBC
Pas encore d'évaluation
Chapitre SBC
11 pages
Les Arbres de Decisions LE 2025
Pas encore d'évaluation
Les Arbres de Decisions LE 2025
39 pages
Arbre de Decision
Pas encore d'évaluation
Arbre de Decision
44 pages
Dic9380 Arbres Decision
Pas encore d'évaluation
Dic9380 Arbres Decision
47 pages
Chapitre 2 A
Pas encore d'évaluation
Chapitre 2 A
164 pages
Arbres de Décision en Classification
Pas encore d'évaluation
Arbres de Décision en Classification
23 pages
Arbres de Décision
100% (1)
Arbres de Décision
23 pages
Chap07 DecisionTrees
Pas encore d'évaluation
Chap07 DecisionTrees
82 pages
chapter09.7.ML-SL-Decision Trees
Pas encore d'évaluation
chapter09.7.ML-SL-Decision Trees
30 pages
Chapitre III ML Les Arbres de Decision
Pas encore d'évaluation
Chapitre III ML Les Arbres de Decision
20 pages
Arbres de décision en classification supervisée
Pas encore d'évaluation
Arbres de décision en classification supervisée
55 pages
Présentation AI
Pas encore d'évaluation
Présentation AI
61 pages
Arbres de Décision en Apprentissage Automatique
Pas encore d'évaluation
Arbres de Décision en Apprentissage Automatique
88 pages
DM-Rapport-Arbres de Decision
Pas encore d'évaluation
DM-Rapport-Arbres de Decision
11 pages
Introduction à l'Apprentissage Automatique
Pas encore d'évaluation
Introduction à l'Apprentissage Automatique
164 pages
Chapitre 2 Classification
Pas encore d'évaluation
Chapitre 2 Classification
32 pages
Aah
Pas encore d'évaluation
Aah
2 pages
Chap03.arbres Decision
Pas encore d'évaluation
Chap03.arbres Decision
75 pages
Arbre Decision
Pas encore d'évaluation
Arbre Decision
43 pages
CM5 DecisionTree
Pas encore d'évaluation
CM5 DecisionTree
29 pages
Initiation à la Fouille de Données
Pas encore d'évaluation
Initiation à la Fouille de Données
38 pages
Cours ML Arbres
Pas encore d'évaluation
Cours ML Arbres
52 pages
Chap3 Arbres Sahbi
Pas encore d'évaluation
Chap3 Arbres Sahbi
46 pages
Classification DM 2015 2016
Pas encore d'évaluation
Classification DM 2015 2016
41 pages
Datamining Cours 03
Pas encore d'évaluation
Datamining Cours 03
25 pages
Chapitre 3 Apprentissage A Laide Des Arbres de Decision
Pas encore d'évaluation
Chapitre 3 Apprentissage A Laide Des Arbres de Decision
37 pages
Cour 3
Pas encore d'évaluation
Cour 3
9 pages
Arbre de Décision
Pas encore d'évaluation
Arbre de Décision
25 pages
Arbres de Décision en IA
Pas encore d'évaluation
Arbres de Décision en IA
24 pages
Chap5 - Arbres de Décision
Pas encore d'évaluation
Chap5 - Arbres de Décision
55 pages
Arbres de Decision
Pas encore d'évaluation
Arbres de Decision
80 pages
Ad Handout PDF
Pas encore d'évaluation
Ad Handout PDF
7 pages
TD N°2 Apprentissage M1-IA DTrees 2022-2023 - Corr
Pas encore d'évaluation
TD N°2 Apprentissage M1-IA DTrees 2022-2023 - Corr
16 pages
Arbres de Decision
Pas encore d'évaluation
Arbres de Decision
19 pages
Chapitre 2 Apprentissage Automatique: Les Arbres de Décision
Pas encore d'évaluation
Chapitre 2 Apprentissage Automatique: Les Arbres de Décision
12 pages
Arbre de Décision : Concepts et Applications
Pas encore d'évaluation
Arbre de Décision : Concepts et Applications
21 pages
Chapitre 5 - Les Arbres de D-Cision
Pas encore d'évaluation
Chapitre 5 - Les Arbres de D-Cision
33 pages
Apprentissage Supervisé 1p PDF
Pas encore d'évaluation
Apprentissage Supervisé 1p PDF
122 pages
Chapitre4 DTree&Foret
Pas encore d'évaluation
Chapitre4 DTree&Foret
70 pages
Arbres - Decision 18 19
Pas encore d'évaluation
Arbres - Decision 18 19
76 pages
Cours Machine Learning - Arbre de Décision
Pas encore d'évaluation
Cours Machine Learning - Arbre de Décision
71 pages
Classification Decision Tree
Pas encore d'évaluation
Classification Decision Tree
52 pages
Arbetsege
Pas encore d'évaluation
Arbetsege
14 pages
Exos Corr
Pas encore d'évaluation
Exos Corr
20 pages
R1 Mod
Pas encore d'évaluation
R1 Mod
53 pages
Chapitre Probabilité Et Variables Aléatoires
Pas encore d'évaluation
Chapitre Probabilité Et Variables Aléatoires
24 pages
Exercice S
Pas encore d'évaluation
Exercice S
2 pages
2017 Tal-1 2
Pas encore d'évaluation
2017 Tal-1 2
24 pages
Liris 3447 2016
Pas encore d'évaluation
Liris 3447 2016
7 pages
MasterMBD TD1
Pas encore d'évaluation
MasterMBD TD1
2 pages
Statistiques descriptives univariées
Pas encore d'évaluation
Statistiques descriptives univariées
79 pages
BD Cours3 Amrani
Pas encore d'évaluation
BD Cours3 Amrani
8 pages
Pig Hive Mahout Benali Mounir
Pas encore d'évaluation
Pig Hive Mahout Benali Mounir
30 pages
Stack ELK
Pas encore d'évaluation
Stack ELK
37 pages
CIA
Pas encore d'évaluation
CIA
47 pages
Cap 45
Pas encore d'évaluation
Cap 45
34 pages
Électromagnétisme 2e Année MP-MP PC-PC PSI-PS PDF
100% (1)
Électromagnétisme 2e Année MP-MP PC-PC PSI-PS PDF
274 pages
MPQHSE
Pas encore d'évaluation
MPQHSE
3 pages
Types et Mesures du Frottement
Pas encore d'évaluation
Types et Mesures du Frottement
6 pages
Optimisation de l'abattage à Lupoto
100% (1)
Optimisation de l'abattage à Lupoto
5 pages
Certificat B2 Sorbonne : Épreuves et Exigences
Pas encore d'évaluation
Certificat B2 Sorbonne : Épreuves et Exigences
2 pages
Comprendre les lieux de vie en géographie
Pas encore d'évaluation
Comprendre les lieux de vie en géographie
2 pages
TD de Cours GPS
Pas encore d'évaluation
TD de Cours GPS
4 pages
Méthodologie de la dissertation juridique
Pas encore d'évaluation
Méthodologie de la dissertation juridique
13 pages
Module 1
100% (1)
Module 1
23 pages
Cours 3 - 1 - Conflits Cognitifs Et Sociocognitifs - MD
Pas encore d'évaluation
Cours 3 - 1 - Conflits Cognitifs Et Sociocognitifs - MD
17 pages
Calculs de solutions chimiques et concentrations
Pas encore d'évaluation
Calculs de solutions chimiques et concentrations
2 pages
CRISTALLOGRAPHIE-CRISTALLOCHIMIE-SOLUTION-SERIE-N°1 - S4 - SMC-SMP-15-16-Pr BRITEL
100% (4)
CRISTALLOGRAPHIE-CRISTALLOCHIMIE-SOLUTION-SERIE-N°1 - S4 - SMC-SMP-15-16-Pr BRITEL
30 pages
Enquête Sur Le Comportement Du Consommateur Tunisien Sur Internet
Pas encore d'évaluation
Enquête Sur Le Comportement Du Consommateur Tunisien Sur Internet
43 pages
Algorythme N°66 PDF
100% (2)
Algorythme N°66 PDF
8 pages
Cours D'organisation de Chantier
0% (1)
Cours D'organisation de Chantier
12 pages
CV Lahcen Laajaj
Pas encore d'évaluation
CV Lahcen Laajaj
1 page
Grilles D'evaluation Individuele de l'equipe-MQ - 202J-21
Pas encore d'évaluation
Grilles D'evaluation Individuele de l'equipe-MQ - 202J-21
1 page
Thematiques Des Projets Tutores
Pas encore d'évaluation
Thematiques Des Projets Tutores
5 pages
Jounin - Voyage de Classe - Chapitre1
Pas encore d'évaluation
Jounin - Voyage de Classe - Chapitre1
25 pages
Chapitre 1. Généralités Sur Le Management Et La Notion D'entreprises. Management Fondamental. S2. Section DEF. 2023.2024
Pas encore d'évaluation
Chapitre 1. Généralités Sur Le Management Et La Notion D'entreprises. Management Fondamental. S2. Section DEF. 2023.2024
25 pages
0 - PD - 7 - 2021 3
0% (1)
0 - PD - 7 - 2021 3
6 pages
Cour Méthodes Des Trois Moments
Pas encore d'évaluation
Cour Méthodes Des Trois Moments
6 pages
Dimensionnement et Calculs de Semelle Isolée
Pas encore d'évaluation
Dimensionnement et Calculs de Semelle Isolée
6 pages
Structure de l'ENSAB
Pas encore d'évaluation
Structure de l'ENSAB
1 page
Stage en comptabilité - Hajar Mouad
Pas encore d'évaluation
Stage en comptabilité - Hajar Mouad
1 page
Identité Collective et Enjeux Sociaux
100% (1)
Identité Collective et Enjeux Sociaux
8 pages
Mycologie
Pas encore d'évaluation
Mycologie
59 pages
La Philomene Seraphique Partie Premiere
Pas encore d'évaluation
La Philomene Seraphique Partie Premiere
473 pages
Etude de Cas 1
Pas encore d'évaluation
Etude de Cas 1
2 pages