0% ont trouvé ce document utile (0 vote)
230 vues3 pages

Apriori Algorithm

L'algorithme Apriori est utilisé pour l'extraction de règles d'association dans les données transactionnelles, en se basant sur le principe que si un ensemble d'éléments est fréquent, tous ses sous-ensembles le sont également. Il fonctionne en générant des itemsets fréquents, en filtrant les infrequents et en créant des règles d'association basées sur des critères de support et de confiance. Bien qu'il soit facile à comprendre et efficace pour des ensembles de données de taille modérée, il présente des limitations en termes de coût computationnel et de mémoire pour les grandes bases de données.

Transféré par

loicblue86
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
230 vues3 pages

Apriori Algorithm

L'algorithme Apriori est utilisé pour l'extraction de règles d'association dans les données transactionnelles, en se basant sur le principe que si un ensemble d'éléments est fréquent, tous ses sous-ensembles le sont également. Il fonctionne en générant des itemsets fréquents, en filtrant les infrequents et en créant des règles d'association basées sur des critères de support et de confiance. Bien qu'il soit facile à comprendre et efficace pour des ensembles de données de taille modérée, il présente des limitations en termes de coût computationnel et de mémoire pour les grandes bases de données.

Transféré par

loicblue86
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

Bien sûr !

L'algorithme Apriori est un algorithme largement utilisé pour l'extraction de règles


d'association dans le domaine de l'analyse des données, notamment pour la découverte de
relations intéressantes dans des ensembles de données transactionnelles. Il est particulièrement
connu pour son application dans le domaine du panier d'achats (ex. : "Si un client achète du
pain, il achète aussi du beurre").

🧠 Principe de l'algorithme Apriori :

L'algorithme Apriori repose sur un principe fondamental appelé "l'élémentaire de


l'anticomplément" :
Si un ensemble d'éléments est fréquent, tous ses sous-ensembles doivent également être
fréquents. Ce principe est utilisé pour réduire la taille de l'espace de recherche, en éliminant
rapidement les éléments ou ensembles d'éléments qui ne sont pas fréquemment rencontrés dans
les transactions.

🚀 Fonctionnement de l'algorithme Apriori :

L'algorithme peut être expliqué en plusieurs étapes clés :

1. Générer les itemsets fréquents (ou ensembles d'éléments) :

L'algorithme commence par rechercher tous les éléments qui apparaissent fréquemment dans les
transactions. Ces éléments sont appelés itemsets de taille 1.

2. Itération sur les itemsets de taille croissante :

Ensuite, l'algorithme génère des itemsets de taille croissante (de taille 2, 3, etc.), en combinant
les itemsets fréquents précédemment trouvés. Par exemple, à partir des itemsets de taille 1
(éléments individuels fréquents), on génère des itemsets de taille 2 (paires d'éléments) et ainsi de
suite.

3. Filtrage des itemsets infrequents :

Si un itemset n'est pas assez fréquent (en fonction d'un seuil de support donné), il est éliminé. Ce
processus d'élagage permet de réduire le nombre d'itemsets à tester et d'améliorer l'efficacité de
l'algorithme.

4. Générer les règles d'association :

Une fois que les itemsets fréquents sont identifiés, Apriori génère des règles d'association qui
permettent d'exprimer des relations entre les éléments. Par exemple, une règle peut être de la
forme :

Si un client achète {A}, alors il achète aussi {B}.

Les règles d'association sont basées sur deux critères :


 Le support : La fréquence d'apparition d'un itemset dans l'ensemble des transactions.
 La confiance : La probabilité qu'un itemset {B} soit acheté lorsqu'un autre itemset {A}
est acheté.

5. Évaluation des règles :

Les règles d'association sont ensuite évaluées à l'aide de l'indice de confiance et du lift :

 Support : Support de la règle


S(A→B)=Transactions contenant A∪BTotal des transactionsS(A \rightarrow B) = \frac{\
text{Transactions contenant } A \cup B}{\text{Total des
transactions}}S(A→B)=Total des transactionsTransactions contenant A∪B.
 Confiance : Confiance de la règle
C(A→B)=Transactions contenant A∪BTransactions contenant AC(A \rightarrow B) = \
frac{\text{Transactions contenant } A \cup B}{\text{Transactions contenant }
A}C(A→B)=Transactions contenant ATransactions contenant A∪B.
 Lift : Indicateur de la force d'une règle, mesurant la dépendance entre A et B,
L(A→B)=C(A→B)S(B)L(A \rightarrow B) = \frac{C(A \rightarrow B)}
{S(B)}L(A→B)=S(B)C(A→B).

🔍 Exemple Pratique de l'Algorithme Apriori :

Imaginons un magasin de vêtements où nous avons les transactions suivantes :

Transaction 1 : {pain, beurre, lait}


Transaction 2 : {pain, beurre}
Transaction 3 : {pain, lait}
Transaction 4 : {beurre, lait}

1. Éléments fréquents de taille 1 (seuil de support = 50%) :


o Support pour pain = 3/4 = 75%
o Support pour beurre = 3/4 = 75%
o Support pour lait = 3/4 = 75%

Tous les éléments sont fréquents.

2. Génération de paires (itemsets de taille 2) avec des éléments fréquents :


o {pain, beurre} : Support = 2/4 = 50%
o {pain, lait} : Support = 2/4 = 50%
o {beurre, lait} : Support = 2/4 = 50%

Ces itemsets sont également fréquents.

3. Génération des règles d'association :


o Si pain => beurre : Support = 2/4 = 50%, Confiance = 2/3 = 67%
o Si pain => lait : Support = 2/4 = 50%, Confiance = 2/3 = 67%
o Si beurre => lait : Support = 2/4 = 50%, Confiance = 2/3 = 67%

Cela vous donne des règles du type :

 "Si un client achète du pain, il achète probablement du beurre."


 "Si un client achète du pain, il achète probablement du lait."

🏆 Avantages de l'algorithme Apriori :

 Facile à comprendre et à implémenter.


 Utilisé pour découvrir des règles d'association intéressantes dans de grands ensembles de
données.
 Réduit l'espace de recherche grâce à la propriété de l'anticomplément.

❌ Limitations de l'algorithme Apriori :

 Coût computationnel élevé pour des bases de données volumineuses. Le nombre de


combinaisons possibles augmente rapidement avec la taille des ensembles d'éléments.
 Nécessite une grande mémoire pour stocker tous les itemsets candidats.
 Peut être inefficace lorsqu'il y a une grande variété d'éléments dans les transactions.

💡 Conclusion :

L'algorithme Apriori est un outil puissant pour l'analyse de données transactionnelles, utilisé
pour extraire des règles d'association et découvrir des relations cachées dans les données.
Cependant, il peut devenir coûteux en termes de calculs pour de très grandes bases de données,
ce qui a conduit à des améliorations comme l'algorithme FP-growth pour résoudre ces problèmes
d'efficacité.

Vous aimerez peut-être aussi