EXEMPLE
Une bibliothèque dispose des informations suivantes sur un
ensemble de clients:
M : Niveau d’engagement entant que membre.
A : tranche d'âge du client.
R : localité de résidence du client.
E : valeur oui si le client a un niveau d'études supérieures.
I : classe oui correspond à un client qui s'inscrit à un service de
bibliothèque en ligne
CALCUL DE L’INDICE DE GINI
Indice de Gini avant séparation au NIVEAU DE LA RACINE :
I=oui : 3 clients
8 clients
I=non : 5 clients
IG(avant séparation) = 1 – ( (3/8)² + (5/8)² ) = 0.46875
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de la variable M (Niveau d’engagement « Membre »):
I=oui : 1 client
I=non : 2 clients
M= Faible : 3 clients
3 valeurs de M I=oui : 2 clients
M= Moyen: 3 clients
I=non : 1 client
M= Elevé: 2 clients
I=oui : 0 clients
I=non : 2 clients
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils M = Faible :
I=oui : 1 client
3 clients
I=non : 2 clients
IG(M=Faible) = 1 – ( (1/3)² + (2/3)² ) = 0.4444444
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils M = Moyen :
I=oui : 2 clients
3 clients
I=non : 1 client
IG(M=Moyen) = 1 – ( (2/3)² + (1/3)² ) = 0.4444444
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils M = Elevé :
I=oui : 0 clients
2 clients
I=non : 2 clients
IG(M=Elevé) = 1 – ( (0/2)² + (2/2)² ) = 0
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de M:
IG(avant séparation)-[IG(M=Faible)+IG(M=Moyen)+IG(M=Elevé)]
0.46875 – [0.4444444 + 0.4444444 + 0]
-0.4201388
CALCUL DE L’INDICE DE GINI
Indice de Gini de la variable A (Tranche d'âge du client):
I=oui : 1 clients
I=non : 0 client
A= Jeune : 1 client
3 valeurs de A I=oui : 2 clients
A= Moyen: 4 clients
I=non : 2 clients
A= Agé: 3 clients
I=oui : 0 clients
I=non : 3 clients
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils A = Jeune :
I=oui : 1 client
1 client
I=non : 0 clients
IG(A=Jeune) = 1 – ( (1/1)² + (0/1)² ) = 0
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils A = Moyen :
I=oui : 2 clients
4 clients
I=non : 2 clients
IG(A=Moyen) = 1 – ( (2/4)² + (2/4)² ) = 0.5
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils A = Agé :
I=oui : 0 clients
3 clients
I=non : 3 clients
IG(A=Agé) = 1 – ( (0/3)² + (3/3)² ) = 0
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de A:
IG(avant séparation)-[IG(A=Jeune)+IG(A=Moyen)+IG(A=Agé)]
0.46875 – [0 + 0.5 + 0]
-0.03125
CALCUL DE L’INDICE DE GINI
Indice de Gini de la variable R(Localité de résidence du client):
I=oui : 1 clients
I=non : 1 client
R= Village : 2 clients
3 valeurs de R I=oui : 1 client
R= Bourg: 3 clients
I=non : 2 clients
R= Ville: 3 clients
I=oui : 1 client
I=non : 2 clients
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils R= Village :
I=oui : 1 client
2 clients
I=non : 1 client
IG(R= Village) = 1 – ( (1/2)² + (1/2)² ) = 0.5
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils R= Bourg :
I=oui : 1 client
3 clients
I=non : 2 clients
IG(R= Bourg) = 1 – ( (1/3)² + (2/3)² ) = 0.4444444
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils R= Ville:
I=oui : 1 client
3 clients
I=non : 2 clients
IG(R=Ville) = 1 – ( (1/3)² + (2/3)² ) = 0.4444444
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de R:
IG(avant séparation)-[IG(R=Village)+IG(R=Bourg)+IG(R=Ville)]
0.46875 – [0.4444444 + 0.5 + 0.4444444]
-0.9201388
CALCUL DE L’INDICE DE GINI
Indice de Gini de la variable E(Niveau d'études du client):
I=oui : 3 clients
I=non : 2 clients
E= Oui : 5 clients
2 valeurs de E
E= Non: 3 clients
I=oui : 0 clients
I=non : 3 clients
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils E= Oui :
I=oui : 3 clients
5 clients
I=non : 2 clients
IG(E=Oui) = 1 – ( (3/5)² + (2/5)² ) = 0.48
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils E= Non :
I=oui : 0 clients
3 clients
I=non : 3 clients
IG(E=Non) = 1 – ( (0/3)² + (3/3)² ) = 0
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de E:
IG(avant séparation)-[IG(E=Oui)+IG(E=Non)]
0.46875 – [0.48+0]
-0.01125388
PREMIER RESULTAT DE L’INDICE DE
GINI
La variable la plus séparatrice est celle qui maximise :
IG(avant séparation)-[IG(fils1)+IG(fils2)+……+IG(filsn)]
E
CONSTRUCTION DE L’ARBRE
E
OUI NON
I=Non
CALCUL DE L’INDICE DE GINI : E=OUI
Indice de Gini avant séparation avec E = Oui :
I=oui : 3 clients
5 clients
I=non : 2 clients
IG(avant séparation1) = 1 – ( (3/5)² + (2/5)² ) = 0.48
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de la variable M (Niveau d’engagement « Membre »)
avec E=Oui:
I=oui : 1 client
I=non : 0 clients
M= Faible : 1 client
I=oui : 2 clients
3 valeurs de M M= Moyen: 3 clients
I=non : 1 clients
M= Elevé: 1 client
I=oui : 0 clients
I=non : 1 client
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils M = Faible & E = Oui :
I=oui : 1 client
1 client
I=non : 0 clients
IG(M=Faible & E=Oui) = 1 – ( (1/1)² + (0/1)² ) = 0
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils M = Moyen & E = Oui :
I=oui : 2 clients
3 clients
I=non : 1 client
IG(M=Moyen & E=Oui) = 1 – ( (2/3)² + (1/3)² ) = 0.4444444
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils M = Elevé & E = Oui:
I=oui : 0 clients
1 client
I=non : 1 client
IG(M=Elevé & E=Oui) = 1 – ( (0/1)² + (1/1)² ) = 0
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de M avec E=Oui :
IG(avant séparation1)-[IG(M=Faible)+IG(M=Moyen)+IG(M=Elevé)]
0.48 – [0 + 0.4444444 + 0]
0.0355556
CALCUL DE L’INDICE DE GINI
Indice de Gini de la variable A (Tranche d'âge du client) avec
E=Oui :
I=oui : 1 clients
I=non : 0 clients
A= Jeune : 1 client
I=oui : 2 clients
3 valeurs de A A= Moyen: 2 clients
I=non : 0 clients
A= Agé: 2 clients
I=oui : 0 clients
I=non : 2 clients
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils A = Jeune & E = Oui :
I=oui : 1 client
1 client
I=non : 0 clients
IG(A=Jeune & E = Oui) = 1 – ( (1/1)² + (0/1)² ) = 0
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils A = Moyen & E = Oui :
I=oui : 2 clients
2 clients
I=non : 0 clients
IG(A=Moyen & E = Oui ) = 1 – ( (2/2)² + (0/2)² ) = 0
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils A = Agé & E = Oui :
I=oui : 0 clients
2 clients
I=non : 2 clients
IG(A=Agé & E = Oui ) = 1 – ( (0/2)² + (2/2)² ) = 0
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de A avec E=Oui:
IG(avant séparation1)-[IG(A=Jeune)+IG(A=Moyen)+IG(A=Agé)]
0.48 – [0 + 0 + 0]
0.48
CALCUL DE L’INDICE DE GINI
Indice de Gini de la variable R(Localité de résidence du client)
avec E=Oui :
I=oui : 1 client
I=non : 0 clients
R= Village : 1 client
I=oui : 1 client
3 valeurs de R R= Bourg: 1 client
I=non : 0 clients
R= Ville: 3 clients
I=oui : 1 client
I=non : 2 clients
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils R= Village & E = Oui :
I=oui : 1 client
1 clients
I=non : 0 clients
IG(R= Village & E = Oui ) = 1 – ( (1/1)² + (0/1)² ) = 0
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils R= Bourg & E = Oui :
I=oui : 1 client
1 client
I=non : 0 clients
IG(R= Bourg & E = Oui ) = 1 – ( (1/1)² + (0/1)² ) = 0
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils R= Ville & E = Oui :
I=oui : 1 client
3 clients
I=non : 2 clients
IG(R=Ville & E = Oui ) = 1 – ( (1/3)² + (2/3)² ) = 0.4444444
Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de R avec E=Oui: :
◼ IG(avant séparation1)-[IG(R=Village)+IG(R=Bourg)+IG(R=Ville)]
0.48 – [0 + 0 + 0.4444444]
0.0355556
L’ARBRE DE DÉCISION
E
OUI NON
I=Non
A
Jeune Agé
Moyen
I=Oui I=Oui I=Non