0% ont trouvé ce document utile (0 vote)
53 vues40 pages

Solution Ex3

Le document présente le calcul de l'indice de Gini pour différents attributs de clients d'une bibliothèque, tels que le niveau d'engagement, la tranche d'âge, la localité de résidence et le niveau d'études. Les indices de Gini sont calculés avant et après séparation pour chaque variable, permettant d'évaluer leur capacité à discriminer les clients inscrits à un service en ligne. Les résultats montrent que la variable 'E' (niveau d'études) est la plus séparatrice, suivie par d'autres attributs.

Transféré par

aminatakimbiri
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
53 vues40 pages

Solution Ex3

Le document présente le calcul de l'indice de Gini pour différents attributs de clients d'une bibliothèque, tels que le niveau d'engagement, la tranche d'âge, la localité de résidence et le niveau d'études. Les indices de Gini sont calculés avant et après séparation pour chaque variable, permettant d'évaluer leur capacité à discriminer les clients inscrits à un service en ligne. Les résultats montrent que la variable 'E' (niveau d'études) est la plus séparatrice, suivie par d'autres attributs.

Transféré par

aminatakimbiri
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

EXEMPLE

Une bibliothèque dispose des informations suivantes sur un


ensemble de clients:

M : Niveau d’engagement entant que membre.

A : tranche d'âge du client.

R : localité de résidence du client.

E : valeur oui si le client a un niveau d'études supérieures.

I : classe oui correspond à un client qui s'inscrit à un service de


bibliothèque en ligne
CALCUL DE L’INDICE DE GINI
Indice de Gini avant séparation au NIVEAU DE LA RACINE :

I=oui : 3 clients
8 clients
I=non : 5 clients

IG(avant séparation) = 1 – ( (3/8)² + (5/8)² ) = 0.46875

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de la variable M (Niveau d’engagement « Membre »):

I=oui : 1 client
I=non : 2 clients

M= Faible : 3 clients

3 valeurs de M I=oui : 2 clients


M= Moyen: 3 clients
I=non : 1 client
M= Elevé: 2 clients

I=oui : 0 clients
I=non : 2 clients
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils M = Faible :

I=oui : 1 client
3 clients
I=non : 2 clients

IG(M=Faible) = 1 – ( (1/3)² + (2/3)² ) = 0.4444444

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils M = Moyen :

I=oui : 2 clients
3 clients
I=non : 1 client

IG(M=Moyen) = 1 – ( (2/3)² + (1/3)² ) = 0.4444444

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils M = Elevé :

I=oui : 0 clients
2 clients
I=non : 2 clients

IG(M=Elevé) = 1 – ( (0/2)² + (2/2)² ) = 0

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de M:

IG(avant séparation)-[IG(M=Faible)+IG(M=Moyen)+IG(M=Elevé)]

0.46875 – [0.4444444 + 0.4444444 + 0]

-0.4201388
CALCUL DE L’INDICE DE GINI
Indice de Gini de la variable A (Tranche d'âge du client):

I=oui : 1 clients
I=non : 0 client

A= Jeune : 1 client

3 valeurs de A I=oui : 2 clients


A= Moyen: 4 clients
I=non : 2 clients
A= Agé: 3 clients

I=oui : 0 clients
I=non : 3 clients
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils A = Jeune :

I=oui : 1 client
1 client
I=non : 0 clients

IG(A=Jeune) = 1 – ( (1/1)² + (0/1)² ) = 0

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils A = Moyen :

I=oui : 2 clients
4 clients
I=non : 2 clients

IG(A=Moyen) = 1 – ( (2/4)² + (2/4)² ) = 0.5

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils A = Agé :

I=oui : 0 clients
3 clients
I=non : 3 clients

IG(A=Agé) = 1 – ( (0/3)² + (3/3)² ) = 0

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de A:

IG(avant séparation)-[IG(A=Jeune)+IG(A=Moyen)+IG(A=Agé)]

0.46875 – [0 + 0.5 + 0]

-0.03125
CALCUL DE L’INDICE DE GINI
Indice de Gini de la variable R(Localité de résidence du client):

I=oui : 1 clients
I=non : 1 client

R= Village : 2 clients

3 valeurs de R I=oui : 1 client


R= Bourg: 3 clients
I=non : 2 clients
R= Ville: 3 clients

I=oui : 1 client
I=non : 2 clients
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils R= Village :

I=oui : 1 client
2 clients
I=non : 1 client

IG(R= Village) = 1 – ( (1/2)² + (1/2)² ) = 0.5

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils R= Bourg :

I=oui : 1 client
3 clients
I=non : 2 clients

IG(R= Bourg) = 1 – ( (1/3)² + (2/3)² ) = 0.4444444

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils R= Ville:

I=oui : 1 client
3 clients
I=non : 2 clients

IG(R=Ville) = 1 – ( (1/3)² + (2/3)² ) = 0.4444444

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de R:

IG(avant séparation)-[IG(R=Village)+IG(R=Bourg)+IG(R=Ville)]

0.46875 – [0.4444444 + 0.5 + 0.4444444]

-0.9201388
CALCUL DE L’INDICE DE GINI
Indice de Gini de la variable E(Niveau d'études du client):

I=oui : 3 clients
I=non : 2 clients

E= Oui : 5 clients
2 valeurs de E
E= Non: 3 clients

I=oui : 0 clients
I=non : 3 clients
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils E= Oui :

I=oui : 3 clients
5 clients
I=non : 2 clients

IG(E=Oui) = 1 – ( (3/5)² + (2/5)² ) = 0.48

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils E= Non :

I=oui : 0 clients
3 clients
I=non : 3 clients

IG(E=Non) = 1 – ( (0/3)² + (3/3)² ) = 0

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de E:

IG(avant séparation)-[IG(E=Oui)+IG(E=Non)]

0.46875 – [0.48+0]

-0.01125388
PREMIER RESULTAT DE L’INDICE DE
GINI
La variable la plus séparatrice est celle qui maximise :

IG(avant séparation)-[IG(fils1)+IG(fils2)+……+IG(filsn)]

E
CONSTRUCTION DE L’ARBRE

E
OUI NON

I=Non
CALCUL DE L’INDICE DE GINI : E=OUI
Indice de Gini avant séparation avec E = Oui :

I=oui : 3 clients
5 clients
I=non : 2 clients

IG(avant séparation1) = 1 – ( (3/5)² + (2/5)² ) = 0.48

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de la variable M (Niveau d’engagement « Membre »)
avec E=Oui:

I=oui : 1 client
I=non : 0 clients

M= Faible : 1 client

I=oui : 2 clients
3 valeurs de M M= Moyen: 3 clients
I=non : 1 clients
M= Elevé: 1 client

I=oui : 0 clients
I=non : 1 client
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils M = Faible & E = Oui :

I=oui : 1 client
1 client
I=non : 0 clients

IG(M=Faible & E=Oui) = 1 – ( (1/1)² + (0/1)² ) = 0

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils M = Moyen & E = Oui :

I=oui : 2 clients
3 clients
I=non : 1 client

IG(M=Moyen & E=Oui) = 1 – ( (2/3)² + (1/3)² ) = 0.4444444

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils M = Elevé & E = Oui:

I=oui : 0 clients
1 client
I=non : 1 client

IG(M=Elevé & E=Oui) = 1 – ( (0/1)² + (1/1)² ) = 0

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de M avec E=Oui :

IG(avant séparation1)-[IG(M=Faible)+IG(M=Moyen)+IG(M=Elevé)]

0.48 – [0 + 0.4444444 + 0]

0.0355556
CALCUL DE L’INDICE DE GINI
Indice de Gini de la variable A (Tranche d'âge du client) avec
E=Oui :
I=oui : 1 clients
I=non : 0 clients

A= Jeune : 1 client
I=oui : 2 clients
3 valeurs de A A= Moyen: 2 clients
I=non : 0 clients
A= Agé: 2 clients

I=oui : 0 clients
I=non : 2 clients
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils A = Jeune & E = Oui :

I=oui : 1 client
1 client
I=non : 0 clients

IG(A=Jeune & E = Oui) = 1 – ( (1/1)² + (0/1)² ) = 0

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils A = Moyen & E = Oui :

I=oui : 2 clients
2 clients
I=non : 0 clients

IG(A=Moyen & E = Oui ) = 1 – ( (2/2)² + (0/2)² ) = 0

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils A = Agé & E = Oui :

I=oui : 0 clients
2 clients
I=non : 2 clients

IG(A=Agé & E = Oui ) = 1 – ( (0/2)² + (2/2)² ) = 0

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de A avec E=Oui:

IG(avant séparation1)-[IG(A=Jeune)+IG(A=Moyen)+IG(A=Agé)]

0.48 – [0 + 0 + 0]

0.48
CALCUL DE L’INDICE DE GINI
Indice de Gini de la variable R(Localité de résidence du client)
avec E=Oui :
I=oui : 1 client
I=non : 0 clients

R= Village : 1 client
I=oui : 1 client
3 valeurs de R R= Bourg: 1 client
I=non : 0 clients
R= Ville: 3 clients

I=oui : 1 client
I=non : 2 clients
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils R= Village & E = Oui :

I=oui : 1 client
1 clients
I=non : 0 clients

IG(R= Village & E = Oui ) = 1 – ( (1/1)² + (0/1)² ) = 0

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils R= Bourg & E = Oui :

I=oui : 1 client
1 client
I=non : 0 clients

IG(R= Bourg & E = Oui ) = 1 – ( (1/1)² + (0/1)² ) = 0

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de fils R= Ville & E = Oui :

I=oui : 1 client
3 clients
I=non : 2 clients

IG(R=Ville & E = Oui ) = 1 – ( (1/3)² + (2/3)² ) = 0.4444444

Fréquence Fréquence
des I = oui des I = non
CALCUL DE L’INDICE DE GINI
Indice de Gini de R avec E=Oui: :

◼ IG(avant séparation1)-[IG(R=Village)+IG(R=Bourg)+IG(R=Ville)]

0.48 – [0 + 0 + 0.4444444]

0.0355556
L’ARBRE DE DÉCISION

E
OUI NON

I=Non
A
Jeune Agé
Moyen

I=Oui I=Oui I=Non

Vous aimerez peut-être aussi