0% ont trouvé ce document utile (0 vote)

112 vues5 pages

Exploration des Règles d'Association en Python

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

112 vues5 pages

Exploration des Règles d'Association en Python

Transféré par

Yassine Assadiki

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TP : Règles d’Association

Dans ce TP, nous découvrirons l’exploration de règles d'association en Python (ARM) et

nous ferons un exercice pratique sur un ensemble de données. Nous utiliserons l'algorithme
apriori et nous examinerons ses principaux composants. Nous commençons ce TP par une
brève introduction à l’exploration de règles d’association.

La règle d’association en Data Mining et ses avantages

La règle d’association en Mining est un processus qui utilise l'apprentissage automatique pour
analyser les données pour les modèles, la cooccurrence et la relation entre différents attributs
ou éléments de l'ensemble de données. Dans le monde réel, l'exploration des règles
d'association est utile en Python ainsi que dans d'autres langages de programmation pour le
regroupement d'articles, l'agencement des magasins et l'analyse du panier de consommation.

Les règles d'association comprennent deux parties, un antécédent (si) et une conséquence
(alors), qui est l'association si-alors qui se produit le plus fréquemment dans l'ensemble de
données.

Par exemple, {Bread} => {Milk} peut être une association dans un supermarché. Cette
relation implique que si (antécédent) une personne achète du pain, alors (par conséquent) le
client achètera très probablement du lait. Il peut y avoir de nombreuses relations entre
plusieurs ensembles d'articles qui peuvent être utilisés pour réaliser l'agencement du
magasin. Ainsi, les clients n’auraient plus besoin d’aller bien loin pour rechercher chaque
produit. Pour augmenter les ventes du magasin, ces produits peuvent bénéficier de réductions
combinées et ces associations peuvent être utiles de nombreuses autres manières.

Pour ce TP, nous utiliserons un ensemble de données contenant une liste de 20 commandes
comprenant le nom des éléments de commande. Vous pouvez télécharger l'ensemble de
données via votre code classroom.

Il existe de nombreux algorithmes qui utilisent des règles d'association comme AIS , SETM,
Apriori, etc. L’algorithme Apriori est le plus largement utilisé qui manipule des règles
d'association et nous l'utiliserons dans notre code. Importons maintenant les modules
nécessaires et modifions notre ensemble de données pour le rendre exploitable.

Importation et Modification de l’ensemble des données

Dans ce paragraphe, nous allons comprendre l'exploration de règles d'association à l'aide de la
bibliothèque apyori Python.
Installez la bibliothèque apyori à l'aide de la ligne de commande en exécutant la commande
pip suivante.

pip installer apyori

5
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
from apyori import apriori

Maintenant, importons les données et appliquons quelques modifications aux données :

data = pd.read_csv("order_data.csv",delimiter=" ",header=None)

data.head()

Le paramètre delimiter=" " divisera les entrées des données chaque fois qu'un espace est
rencontré et header=None empêchera de prendre la première ligne comme en-tête et un en-
tête par défaut sera attribué. Notre bloc de données prendra la forme suivante :

Examinons quelques composants de l'algorithme Apriori qu'il est nécessaire de comprendre

pour créer un bon modèle.

Composants de l’algorithme Apriori

Il existe trois composants principaux de l’algorithme Apriori qui sont les suivants :

 Support – C'est la mesure de la popularité d'un ensemble d'éléments, c'est-à-dire le

nombre de transactions dans lesquelles un élément apparaît par rapport au nombre
total de transactions. Il s’agit simplement de la probabilité qu’un client achète un
article. La formule mathématique pour représenter le support de l'élément X est :
Support(X) = ( Nombre de transactions dans lesquelles X apparaît)/ (Nombre
total de transactions)

Calcul de la valeur de support pour {Bread} dans notre ensemble de données :

5
Nombre de transactions dans lesquelles Bread apparaît = 11 ; Nombre total de
transactions = 20, alors : Support({Bread }) = 11/20 = 0,55

o Valeur du support minimale = Il s'agit d'une valeur seuil au-dessus de

laquelle le produit peut avoir un effet significatif sur le profit.

 Confiance – Ce paramètre détermine l'impact d'un produit sur un autre, c'est-à-dire la

probabilité que si une personne achète le produit X, elle achètera également le produit
Y. Sa représentation en termes mathématiques est
Confiance({X} => {Y}) = (Transactions contenant à la fois X et
Y)/(Transactions contenant X)

Calcul de la confiance ({Bread} => {Milk}) dans notre ensemble de données

confiance ({Bread} => {Milk}) = la probabilité d'acheter du lait si le pain est déjà
acheté.
o Nombre de transactions dans lesquelles le pain et le lait apparaissent = 5
o Nombre de transactions contenant du Pain = 11
o Confiance ({Bread} => {Milk}) = 5/11 = 0,4545
Un inconvénient majeur de la confiance est qu’elle ne prend en compte que la popularité de
l’article X et non de Y. Ceci peut diminuer la valeur de la confiance et peut donc par la suite
induire en erreur la compréhension de l’association entre différents produits. Pour
surmonter cet inconvénient, nous disposons d’une autre mesure connue sous le nom de Lift.

 Lift – Surmonte les limites de la mesure de la confiance et calculera une nouvelle

confiance qui tient compte de la popularité des deux éléments. La représentation
mathématique du Lift est :
Lift({X} => {Y}) = Confidence({X} => {Y}) / Support(Y)

Si la mesure Lift est supérieure à 1, cela signifie que Y est susceptible d'être acheté
avec X, tandis qu'une valeur inférieure à 1 indique qu'il est peu probable que Y soit
acheté avec X. Une valeur de Lift proche de 1 indique que les deux ensembles
d'éléments dans les transactions apparaissent souvent ensemble mais il n'y a aucune
association entre elles.

Calcul du Lift({Bread} => {Milk}) dans notre ensemble de données

Confiance ({Bread} => {Milk}= 0,4545
Support (Milk) = 9/20 = 0,45
Lift({Bread} => {Milk}) = 0,4545/0,45 = 1,01

Implémentation de l’algorithme Apriori

Pour utiliser l'algorithme Apriori, il est nécessaire de convertir l'ensemble des données
transactionnelles en une seule liste où chaque ligne sera une liste dans cette liste.

5
data_list = []
for row in range(0, 20):
data_list.append([str(data.values[row,column]) for column in range(0,
9)])

algo = apriori(data_list, min_support=0.25, min_confidence=0.2, min_lift=2,

min_length=2)
results = list(algo)

Nous avons créé une liste de listes, puis nous avons utilisé la méthode apriori du
module apriori et enfin transformé le type de données du générateur en une liste et
nous l'avons enregistré dans une variable nommée results. Pour prendre les bonnes
décisions et augmenter la vitesse de l'algorithme apriori, les méthodes apriori prennent
plusieurs arguments qui sont les suivants :

 data - Le premier paramètre qui prend la liste qui contient les données
transactionnelles dans les listes intérieures.
 min_support - Il s'agit de la valeur seuil de support pour les éléments à prendre
en compte. Supposons que nous voulions prendre des décisions pour notre
ensemble de données et que nous voulions inclure uniquement les éléments qui
apparaissent dans au moins 5 transactions sur le total, c'est-à-dire une valeur de
soutien de 5/20 = 0,25.
 min_confidence - Il s'agit de la valeur seuil de confiance qui doit exister entre
chaque combinaison d'un ensemble d'éléments. Nous avons pris une valeur de
confiance de 0,2.
 min_lift - Il s'agit de la valeur de lift minimale pour les règles sélectionnées.
Généralement, nous prenons une valeur de lift égale à 2 ou plus pour filtrer les
itemsets qui ont une association plus fréquente.
 min_length - Nombre d'éléments à prendre en compte dans les règles.

Voyons la sortie du programme ci-dessous et imprimons les 3 premières règles que nous
avons obtenues.

for i in range(0,3):
print(f"Required Association No. {i+1} is: {results[i]}")
print('-'*25)

Required Association No. 1 is: RelationRecord(items=frozenset({'toothpaste',

'brush'}), support=0.25,
ordered_statistics=[OrderedStatistic(items_base=frozenset({'brush'}),
items_add=frozenset({'toothpaste'}), confidence=1.0, lift=2.5),
OrderedStatistic(items_base=frozenset({'toothpaste'}),
items_add=frozenset({'brush'}), confidence=0.625, lift=2.5)])

5
-------------------------
Required Association No. 2 is: RelationRecord(items=frozenset({'mouthwash',
'toothpaste'}), support=0.3,
ordered_statistics=[OrderedStatistic(items_base=frozenset({'mouthwash'}),
items_add=frozenset({'toothpaste'}), confidence=0.8571428571428572,
lift=2.142857142857143),
OrderedStatistic(items_base=frozenset({'toothpaste'}),
items_add=frozenset({'mouthwash'}), confidence=0.7499999999999999,
lift=2.142857142857143)])
-------------------------
Required Association No. 3 is: RelationRecord(items=frozenset({'honey',
'bread', 'butter'}), support=0.25,
ordered_statistics=[OrderedStatistic(items_base=frozenset({'butter'}),
items_add=frozenset({'honey', 'bread'}), confidence=0.625,
lift=2.0833333333333335), OrderedStatistic(items_base=frozenset({'honey',
'bread'}), items_add=frozenset({'butter'}), confidence=0.8333333333333334,
lift=2.0833333333333335)])
-------------------------

Explication des résultats

Si l'on considère l'association n° 1 de la sortie ci-dessus, on obtient tout d'abord une
association entre le dentifrice et la brosse et l'on constate que ces articles sont fréquemment
achetés ensemble. Ensuite, la valeur du Support est donnée (0,25) et nous avons les valeurs
de confiance et de Lift pour les ensembles d'éléments, un par un, en changeant l'ordre de
l'ensemble d'éléments. Par exemple, les mesures de confiance et de Lift pour la probabilité
d'acheter du dentifrice si une brosse est achetée sont respectivement de 1,0 et 2,5. Après
modification de l'ordre, les mesures de confiance et de Lift sont respectivement de 0,625 et
de 2,5.

Vous aimerez peut-être aussi

Apprentissage par Règles d'Association
Pas encore d'évaluation
Apprentissage par Règles d'Association
7 pages
Apriori Algorithm
Pas encore d'évaluation
Apriori Algorithm
3 pages
Règles d'association et algorithmes associés
Pas encore d'évaluation
Règles d'association et algorithmes associés
23 pages
Examen Data Mining 2022-2023 - Institut Galilée
Pas encore d'évaluation
Examen Data Mining 2022-2023 - Institut Galilée
2 pages
LK TdReglesAssociationDemarrage 24 25
Pas encore d'évaluation
LK TdReglesAssociationDemarrage 24 25
3 pages
Règles d'association et algorithmes d'extraction
Pas encore d'évaluation
Règles d'association et algorithmes d'extraction
31 pages
Analyse des habitudes d'achat avec Apriori
Pas encore d'évaluation
Analyse des habitudes d'achat avec Apriori
2 pages
Règles d'association en fouille de données
Pas encore d'évaluation
Règles d'association en fouille de données
4 pages
Groupe 04 Finale
Pas encore d'évaluation
Groupe 04 Finale
18 pages
Recherche de motifs fréquents en data mining
Pas encore d'évaluation
Recherche de motifs fréquents en data mining
19 pages
Cours REGLE d'ASSOCIATION
Pas encore d'évaluation
Cours REGLE d'ASSOCIATION
26 pages
Analyse des règles d'association
Pas encore d'évaluation
Analyse des règles d'association
31 pages
TD1 Apriori
100% (1)
TD1 Apriori
2 pages
Règles d'association et algorithmes d'extraction
Pas encore d'évaluation
Règles d'association et algorithmes d'extraction
56 pages
Data Science 1.docx 1
Pas encore d'évaluation
Data Science 1.docx 1
15 pages
Cours1 Regles Association
Pas encore d'évaluation
Cours1 Regles Association
23 pages
Chapitre 4 Extraction Des Motifs Fréquents Et Règles D - Association
Pas encore d'évaluation
Chapitre 4 Extraction Des Motifs Fréquents Et Règles D - Association
43 pages
Règles d'association et itemsets fréquents
Pas encore d'évaluation
Règles d'association et itemsets fréquents
8 pages
Data Mining
Pas encore d'évaluation
Data Mining
31 pages
SERIE EXO Règles Associat 2020 2021
Pas encore d'évaluation
SERIE EXO Règles Associat 2020 2021
2 pages
Cours sur la Fouille de Données et Règles d'Association
Pas encore d'évaluation
Cours sur la Fouille de Données et Règles d'Association
58 pages
Exercices d'algorithmes Apriori
Pas encore d'évaluation
Exercices d'algorithmes Apriori
5 pages
Analyse des Règles d'Association
Pas encore d'évaluation
Analyse des Règles d'Association
55 pages
Découverte des Règles d'Association
Pas encore d'évaluation
Découverte des Règles d'Association
15 pages
Analyse de Données et Règles d'Association
Pas encore d'évaluation
Analyse de Données et Règles d'Association
11 pages
Correction Exercices Règles D'association
67% (3)
Correction Exercices Règles D'association
26 pages
Règles d'association : Extraction et Analyse
Pas encore d'évaluation
Règles d'association : Extraction et Analyse
32 pages
Règles d'Associations en Fouille de Données
Pas encore d'évaluation
Règles d'Associations en Fouille de Données
2 pages
Analyse des Règles d'Association en Data Mining
Pas encore d'évaluation
Analyse des Règles d'Association en Data Mining
24 pages
Découverte des Règles d'Association
Pas encore d'évaluation
Découverte des Règles d'Association
31 pages
Exercices sur les Règles d'Association
Pas encore d'évaluation
Exercices sur les Règles d'Association
8 pages
Règles D'association
Pas encore d'évaluation
Règles D'association
35 pages
Inconvénients de l'Exploitation des Règles
Pas encore d'évaluation
Inconvénients de l'Exploitation des Règles
67 pages
Règles d'Association en Data Mining
100% (1)
Règles d'Association en Data Mining
21 pages
Cours7 Apriori
Pas encore d'évaluation
Cours7 Apriori
26 pages
Travaux Dirigés N°1: Découverte Des Règles D'association
Pas encore d'évaluation
Travaux Dirigés N°1: Découverte Des Règles D'association
2 pages
Analyse des Règles d'Association en Data Mining
Pas encore d'évaluation
Analyse des Règles d'Association en Data Mining
28 pages
Introduction aux Réseaux Bayesiens
Pas encore d'évaluation
Introduction aux Réseaux Bayesiens
41 pages
Série N 02ra
Pas encore d'évaluation
Série N 02ra
3 pages
Exercices sur les règles d'association en informatique
Pas encore d'évaluation
Exercices sur les règles d'association en informatique
3 pages
Arbre de Décision et Algorithmes Apriori
Pas encore d'évaluation
Arbre de Décision et Algorithmes Apriori
5 pages
Génération d'itemsets fréquents et règles d'association
Pas encore d'évaluation
Génération d'itemsets fréquents et règles d'association
14 pages
Extraction de Motifs et Règles d'Associations
Pas encore d'évaluation
Extraction de Motifs et Règles d'Associations
10 pages
Règles d'association avec Apriori en supermarché
Pas encore d'évaluation
Règles d'association avec Apriori en supermarché
1 page
7.règles D'association Python.0
Pas encore d'évaluation
7.règles D'association Python.0
31 pages
Regles D'Associations
0% (1)
Regles D'Associations
28 pages
TD Data Mining
Pas encore d'évaluation
TD Data Mining
3 pages
Règles d'association en data mining
Pas encore d'évaluation
Règles d'association en data mining
11 pages
TD 3 Règles D'association PDF
33% (3)
TD 3 Règles D'association PDF
1 page
3 Exemples de Données
Pas encore d'évaluation
3 Exemples de Données
5 pages
Analyse D Association Concepts de Base Et Algorithmes
Pas encore d'évaluation
Analyse D Association Concepts de Base Et Algorithmes
7 pages
Projet TP 2.1 Règles Association Oct2020
Pas encore d'évaluation
Projet TP 2.1 Règles Association Oct2020
6 pages
Ilovepdf Merged
Pas encore d'évaluation
Ilovepdf Merged
99 pages
Pré-traitement des données d'attaques de requins
Pas encore d'évaluation
Pré-traitement des données d'attaques de requins
29 pages
diaposExempleBlocs 24-25
Pas encore d'évaluation
diaposExempleBlocs 24-25
38 pages
Correction Examen Data Mining 2015
Pas encore d'évaluation
Correction Examen Data Mining 2015
1 page
Support TP - Admin Rés Et Environnement Client Serveur
100% (1)
Support TP - Admin Rés Et Environnement Client Serveur
75 pages
Chefs-d'œuvre des Cathédrales
Pas encore d'évaluation
Chefs-d'œuvre des Cathédrales
78 pages
Calcul et Types de Fondations
Pas encore d'évaluation
Calcul et Types de Fondations
9 pages
Guide Débutant Arduino: Principes de Base
Pas encore d'évaluation
Guide Débutant Arduino: Principes de Base
19 pages
Reconstruction du pont sur la route 199
Pas encore d'évaluation
Reconstruction du pont sur la route 199
14 pages
Poutrelles et Planchers Creux 16+4
Pas encore d'évaluation
Poutrelles et Planchers Creux 16+4
2 pages
Types et dimensions de poutres en béton
Pas encore d'évaluation
Types et dimensions de poutres en béton
4 pages
Cours Architecture SI - 2SIG - 2021
Pas encore d'évaluation
Cours Architecture SI - 2SIG - 2021
63 pages
Topo Ar
Pas encore d'évaluation
Topo Ar
6 pages
Guide Pratique du Génie Civil Professionnel
Pas encore d'évaluation
Guide Pratique du Génie Civil Professionnel
10 pages
Lecon2 Design Pattern
Pas encore d'évaluation
Lecon2 Design Pattern
3 pages
Extension de 3 Classes à Mostaganem
Pas encore d'évaluation
Extension de 3 Classes à Mostaganem
46 pages
Guide des chevilles Hilti
Pas encore d'évaluation
Guide des chevilles Hilti
130 pages
Réseaux sans fil émergents : Concepts clés
Pas encore d'évaluation
Réseaux sans fil émergents : Concepts clés
63 pages
Problèmes de Construction de Ponts Modulaires
Pas encore d'évaluation
Problèmes de Construction de Ponts Modulaires
42 pages
p119 Cases Obus Extraits
100% (1)
p119 Cases Obus Extraits
34 pages
Circulation Et Entrees Des Hopitaux+chambre de Malades+concluion
Pas encore d'évaluation
Circulation Et Entrees Des Hopitaux+chambre de Malades+concluion
3 pages
TP Techno - Batiment
Pas encore d'évaluation
TP Techno - Batiment
5 pages
Dossier Technique Garage Automobile
Pas encore d'évaluation
Dossier Technique Garage Automobile
6 pages
Maison de Faune à Pompéi : Histoire et Architecture
Pas encore d'évaluation
Maison de Faune à Pompéi : Histoire et Architecture
3 pages
Dessin de Bâtiment
Pas encore d'évaluation
Dessin de Bâtiment
2 pages
Interconnexion des réseaux et équipements
Pas encore d'évaluation
Interconnexion des réseaux et équipements
2 pages
Gothique PDF
100% (2)
Gothique PDF
19 pages
Inventaire architectural Arles-Tarascon
Pas encore d'évaluation
Inventaire architectural Arles-Tarascon
13 pages
Reseaux GSB
Pas encore d'évaluation
Reseaux GSB
20 pages
PLANCHE1 Model
Pas encore d'évaluation
PLANCHE1 Model
1 page
Manuel de conception des structures 2008
Pas encore d'évaluation
Manuel de conception des structures 2008
358 pages
Fichiers en C : Ouverture et Manipulation
Pas encore d'évaluation
Fichiers en C : Ouverture et Manipulation
39 pages
Koffi et Diabaté : Architectes de l'avenir
Pas encore d'évaluation
Koffi et Diabaté : Architectes de l'avenir
9 pages
Systeme D Nexploitation Et Reseaux Informatiques 3eme Annee Sciences Informatique PDF
Pas encore d'évaluation
Systeme D Nexploitation Et Reseaux Informatiques 3eme Annee Sciences Informatique PDF
167 pages