Algorithm

The document describes the Apriori algorithm for association rule learning and frequent itemset mining. It provides Python code to implement the Apriori algorithm and demonstrates generating frequent itemsets and association rules from sample transaction data.

Uploaded by

kumar207y1a3330

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

45 views8 pages

Algorithm

Uploaded by

kumar207y1a3330

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 8

Apriori Algorithm:

Program:
from itertools import combinations
def load_data():
# Sample transactional dataset
dataset = [
['bread', 'milk', 'beer'],
['bread', 'diaper', 'beer', 'egg'],
['milk', 'diaper', 'beer', 'cola'],
['bread', 'milk', 'diaper', 'beer'],
['bread', 'milk', 'diaper', 'cola']
]
return dataset

def create_c1(dataset):
c1 = set()
for transaction in dataset:
for item in transaction:
c1.add(frozenset([item]))
return c1

def filter_candidates(dataset, candidates, min_support):

candidate_counts = {}
for transaction in dataset:
for candidate in candidates:
if candidate.issubset(transaction):
candidate_counts[candidate] = candidate_counts.get(candidate, 0) + 1

num_transactions = float(len(dataset))
qualified_items = []
support_data = {}
for candidate, count in candidate_counts.items():
support = count / num_transactions
if support >= min_support:
qualified_items.append(candidate)
support_data[candidate] = support
return qualified_items, support_data

def generate_candidates(Lk, k):

candidates = []
len_Lk = len(Lk)
for i in range(len_Lk):
for j in range(i + 1, len_Lk):
L1 = list(Lk[i])[:k - 2]
L2 = list(Lk[j])[:k - 2]
L1.sort()
L2.sort()
if L1 == L2:
candidates.append(Lk[i] | Lk[j])
return candidates

def apriori(dataset, min_support=0.5):

C1 = create_c1(dataset)
D = list(map(set, dataset))
L1, support_data = filter_candidates(D, C1, min_support)
L = [L1]
k=2
while len(L[k - 2]) > 0:
candidates = generate_candidates(L[k - 2], k)
Lk, support_k = filter_candidates(D, candidates, min_support)
support_data.update(support_k)
L.append(Lk)
k += 1
return L, support_data

def generate_rules(L, support_data, min_confidence=0.7):

rules = []
for i in range(1, len(L)):
for freq_set in L[i]:
for subset in combinations(freq_set, r=i):
confidence = support_data[freq_set] / support_data[freq_set - set(subset)]
if confidence >= min_confidence:
rules.append((set(subset), freq_set - set(subset), confidence))
return rules

def print_results(L, support_data, rules):

for i, itemset in enumerate(L):
print(f"Frequent {i+1}-itemsets")
print("===================")
for item in itemset:
print(f"{item} - support: {support_data[item]}")
print()
print("Association Rules")
print("===================")
for rule in rules:
antecedent, consequent, confidence = rule
print(f"{antecedent} => {consequent} - confidence: {confidence}")
if __name__ == "__main__":
dataset = load_data()
L, support_data = apriori(dataset, min_support=0.4)
rules = generate_rules(L, support_data, min_confidence=0.7)
print_results(L, support_data, rules)

Output:
Frequent 1-itemsets
===================
frozenset({'bread'}) - support: 0.8
frozenset({'beer'}) - support: 0.8
frozenset({'milk'}) - support: 0.8
frozenset({'diaper'}) - support: 0.8
frozenset({'cola'}) - support: 0.4

Frequent 2-itemsets
===================
frozenset({'beer', 'bread'}) - support: 0.6
frozenset({'milk', 'bread'}) - support: 0.6
frozenset({'beer', 'milk'}) - support: 0.6
frozenset({'diaper', 'bread'}) - support: 0.6
frozenset({'beer', 'diaper'}) - support: 0.6
frozenset({'diaper', 'milk'}) - support: 0.6
frozenset({'milk', 'cola'}) - support: 0.4
frozenset({'diaper', 'cola'}) - support: 0.4

Frequent 3-itemsets
===================
frozenset({'beer', 'milk', 'bread'}) - support: 0.4
frozenset({'beer', 'diaper', 'bread'}) - support: 0.4
frozenset({'beer', 'diaper', 'milk'}) - support: 0.4
frozenset({'diaper', 'milk', 'cola'}) - support: 0.4
frozenset({'diaper', 'milk', 'bread'}) - support: 0.4

Frequent 4-itemsets
===================

Association Rules
===================
{'beer'} => frozenset({'bread'}) - confidence: 0.7499999999999999
{'bread'} => frozenset({'beer'}) - confidence: 0.7499999999999999
{'milk'} => frozenset({'bread'}) - confidence: 0.7499999999999999
{'bread'} => frozenset({'milk'}) - confidence: 0.7499999999999999
{'beer'} => frozenset({'milk'}) - confidence: 0.7499999999999999
{'milk'} => frozenset({'beer'}) - confidence: 0.7499999999999999
{'diaper'} => frozenset({'bread'}) - confidence: 0.7499999999999999
{'bread'} => frozenset({'diaper'}) - confidence: 0.7499999999999999
{'beer'} => frozenset({'diaper'}) - confidence: 0.7499999999999999
{'diaper'} => frozenset({'beer'}) - confidence: 0.7499999999999999
{'diaper'} => frozenset({'milk'}) - confidence: 0.7499999999999999
{'milk'} => frozenset({'diaper'}) - confidence: 0.7499999999999999
{'milk'} => frozenset({'cola'}) - confidence: 1.0
{'diaper'} => frozenset({'cola'}) - confidence: 1.0
{'diaper', 'milk'} => frozenset({'cola'}) - confidence: 1.0
FP Growth Algorithm:
Program:
from mlxtend.frequent_patterns import fpgrowth
import pandas as pd
dataset = [
['milk', 'bread', 'biscuit'],
['bread', 'butter'],
['milk', 'bread', 'butter'],
['milk', 'bread'],
['milk', 'bread', 'biscuit', 'butter'],
['jam', 'butter'],
['jam', 'bread'],
['milk', 'jam'],
['bread', 'butter']
]
df = pd.DataFrame(dataset)
encoded_df = pd.get_dummies(df.apply(lambda x: pd.Series(x)), prefix='', prefix_sep='')
frequent_itemsets = fpgrowth(encoded_df, min_support=0.2, use_colnames=True)
print(frequent_itemsets)

Note: Before running program install mlxtend package

Type “pip install mlxtend” command in terminal
Output:
support itemsets
0 0.555556 (bread)
1 0.555556 (milk)
2 0.222222 (biscuit)
3 0.333333 (butter)
4 0.222222 (bread)
5 0.222222 (jam)
6 0.444444 (bread, milk)
7 0.222222 (biscuit, milk)
8 0.222222 (biscuit, bread)
9 0.222222 (biscuit, bread, milk)
10 0.222222 (butter, bread)
Naïve Bayes Algorithm:
Program:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import accuracy_score
iris = load_iris()
X = iris.data
y = iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
naive_bayes = GaussianNB()
naive_bayes.fit(X_train, y_train)
y_pred = naive_bayes.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

Output:
Accuracy: 1.0

Ex 9 TH
No ratings yet
Ex 9 TH
7 pages
DWM Exp8
No ratings yet
DWM Exp8
8 pages
Apriori Algorithm for Itemset Mining
No ratings yet
Apriori Algorithm for Itemset Mining
28 pages
Apriori Algorithm for Groceries
No ratings yet
Apriori Algorithm for Groceries
3 pages
Chota Bheem
No ratings yet
Chota Bheem
6 pages
DataAnalytics Practical3
No ratings yet
DataAnalytics Practical3
3 pages
Weantuday: T Deuhh Anytha
No ratings yet
Weantuday: T Deuhh Anytha
23 pages
Data Mining Unit 2 Assignment
No ratings yet
Data Mining Unit 2 Assignment
15 pages
Exp 9
No ratings yet
Exp 9
9 pages
De Exp 3
No ratings yet
De Exp 3
6 pages
Automobile Data Mining Analysis
No ratings yet
Automobile Data Mining Analysis
23 pages
Ds 2
No ratings yet
Ds 2
3 pages
Fa22-Bcs-025 MOAZ Assignment 1
No ratings yet
Fa22-Bcs-025 MOAZ Assignment 1
9 pages
Apriori Algorithm with Onion Dataset
No ratings yet
Apriori Algorithm with Onion Dataset
1 page
Program
No ratings yet
Program
2 pages
Abc
No ratings yet
Abc
5 pages
Data Warehousing and Data Mining
No ratings yet
Data Warehousing and Data Mining
24 pages
Homework 1 Data
No ratings yet
Homework 1 Data
5 pages
Big Data Prcatical
No ratings yet
Big Data Prcatical
3 pages
Apriori Algorithm Example Problems
100% (1)
Apriori Algorithm Example Problems
8 pages
Document 1116
No ratings yet
Document 1116
6 pages
ML Algorithm
No ratings yet
ML Algorithm
12 pages
Prac7 8 9 10
No ratings yet
Prac7 8 9 10
12 pages
Apriori Algorithm Explained
No ratings yet
Apriori Algorithm Explained
4 pages
Vinay Kumar Kannegala Siddalingappa HW4D
No ratings yet
Vinay Kumar Kannegala Siddalingappa HW4D
1 page
Answer To Assignment 3
No ratings yet
Answer To Assignment 3
9 pages
FP Growth Algorithm Guide
No ratings yet
FP Growth Algorithm Guide
6 pages
Apriori Algorithm
No ratings yet
Apriori Algorithm
7 pages
Da Pra Week 15 (Apriori Algo) - 114413
No ratings yet
Da Pra Week 15 (Apriori Algo) - 114413
11 pages
Mining Frequent Itemsets and Rules
No ratings yet
Mining Frequent Itemsets and Rules
27 pages
Apriori Algorithm
No ratings yet
Apriori Algorithm
3 pages
Apriori Algorithm
No ratings yet
Apriori Algorithm
13 pages
DMCT Assgn 4 ROLL - 507
No ratings yet
DMCT Assgn 4 ROLL - 507
51 pages
DMT Cia2
No ratings yet
DMT Cia2
11 pages
Ass 2
No ratings yet
Ass 2
3 pages
Da Exp 9
No ratings yet
Da Exp 9
5 pages
Interesting Python
No ratings yet
Interesting Python
5 pages
Apriori
No ratings yet
Apriori
5 pages
MSApriori Algorithm Steps
No ratings yet
MSApriori Algorithm Steps
5 pages
Pract4 63
No ratings yet
Pract4 63
3 pages
Ex 1
No ratings yet
Ex 1
8 pages
Apriori Algorithm (Python 3.0) - A Data Analyst
No ratings yet
Apriori Algorithm (Python 3.0) - A Data Analyst
13 pages
1 - All Python Codes + Neo4j Samples
No ratings yet
1 - All Python Codes + Neo4j Samples
16 pages
Ashwin Report
No ratings yet
Ashwin Report
18 pages
Unit 4
No ratings yet
Unit 4
113 pages
Apriori Algorithm: Frequent Itemsets
No ratings yet
Apriori Algorithm: Frequent Itemsets
4 pages
DWDM Lab Report
No ratings yet
DWDM Lab Report
10 pages
Solutions To All Problem (1) - Compressed
No ratings yet
Solutions To All Problem (1) - Compressed
25 pages
Ex. 9 Association Rule Learning Using Apriori Algorithm
No ratings yet
Ex. 9 Association Rule Learning Using Apriori Algorithm
3 pages
Assignment 6
No ratings yet
Assignment 6
7 pages
Association Rule Mining Explained
No ratings yet
Association Rule Mining Explained
5 pages
Indexdw
No ratings yet
Indexdw
34 pages
DWDM Answer
No ratings yet
DWDM Answer
19 pages
S6 - Data Mining Lab Experiments (Except 1)
No ratings yet
S6 - Data Mining Lab Experiments (Except 1)
6 pages
DM Lab Cycle 7 1
No ratings yet
DM Lab Cycle 7 1
7 pages
FIND-S and Candidate-Elimination Algorithms
No ratings yet
FIND-S and Candidate-Elimination Algorithms
26 pages
Association Rule Miningsolvedexamples
No ratings yet
Association Rule Miningsolvedexamples
8 pages
Starship Manual
No ratings yet
Starship Manual
24 pages
E-Way Bill: Common Issues & Solutions
No ratings yet
E-Way Bill: Common Issues & Solutions
33 pages
Health Products and Food Branch Inspectorate: Guidance For Medical Device Complaint Handling and Recalls
No ratings yet
Health Products and Food Branch Inspectorate: Guidance For Medical Device Complaint Handling and Recalls
14 pages
Toshiba 2SK241 N-Channel MOSFET
No ratings yet
Toshiba 2SK241 N-Channel MOSFET
7 pages
Blueprint Master Arm Manual V2.0
No ratings yet
Blueprint Master Arm Manual V2.0
6 pages
Converting a $1 Eddy Kite to Fighter
No ratings yet
Converting a $1 Eddy Kite to Fighter
18 pages
Indian Wine Industry Analysis 2023
100% (1)
Indian Wine Industry Analysis 2023
23 pages
Year 10 Mathematics Investigation 2 Optimisation Take Home 2025
No ratings yet
Year 10 Mathematics Investigation 2 Optimisation Take Home 2025
6 pages
Size Analysis Assignment
No ratings yet
Size Analysis Assignment
2 pages
Cat Cake Recipes for Special Occasions
No ratings yet
Cat Cake Recipes for Special Occasions
23 pages
Tools and Equipment
No ratings yet
Tools and Equipment
3 pages
33 CFR Part 401 (Up To Date As of 2-05-2024)
No ratings yet
33 CFR Part 401 (Up To Date As of 2-05-2024)
60 pages
Heating Systems in Buildings - Design For Water-Based Heating Systems
100% (4)
Heating Systems in Buildings - Design For Water-Based Heating Systems
76 pages
ITIL Capacity Management Overview
100% (1)
ITIL Capacity Management Overview
23 pages
Chapter 2 Exercise
No ratings yet
Chapter 2 Exercise
5 pages
SAT Math: Advanced Problem Solving
No ratings yet
SAT Math: Advanced Problem Solving
10 pages
SN3148 - Use of Limestone in Cements
No ratings yet
SN3148 - Use of Limestone in Cements
78 pages
DPWH Cost Estimation
92% (12)
DPWH Cost Estimation
67 pages
Center of Mass vs. Center of Gravity
No ratings yet
Center of Mass vs. Center of Gravity
10 pages
Hair and Scalp Properties Overview
No ratings yet
Hair and Scalp Properties Overview
215 pages
Tange's Skopje Reconstruction Master Plan
No ratings yet
Tange's Skopje Reconstruction Master Plan
25 pages
Khepera: Egyptian God of Renewal
100% (1)
Khepera: Egyptian God of Renewal
2 pages
The Self: Philosophical Perspectives
No ratings yet
The Self: Philosophical Perspectives
31 pages
9th Grade Mid Term 2 Test on Pollution
50% (2)
9th Grade Mid Term 2 Test on Pollution
2 pages
Laptop
No ratings yet
Laptop
33 pages
Questions On Wind Load
100% (1)
Questions On Wind Load
7 pages
Sandal Upper Assembly Guide
No ratings yet
Sandal Upper Assembly Guide
5 pages
Tweco Welding Catalogue 2001
0% (1)
Tweco Welding Catalogue 2001
84 pages
Pinout 2 F150
No ratings yet
Pinout 2 F150
1 page
Criba
100% (2)
Criba
104 pages

Algorithm

Uploaded by

Algorithm

Uploaded by

Apriori Algorithm:

def filter_candidates(dataset, candidates, min_support):

def generate_candidates(Lk, k):

def apriori(dataset, min_support=0.5):

def generate_rules(L, support_data, min_confidence=0.7):

def print_results(L, support_data, rules):

Note: Before running program install mlxtend package

You might also like