0% found this document useful (0 votes)

14 views12 pages

Apriori Algorithm

Uploaded by

asta9578

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

14 views12 pages

Apriori Algorithm

Uploaded by

asta9578

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 12

APRIORI ALGORITHM

# Install necessary packages

!pip install mlxtend pandas

import pandas as pd
from mlxtend.frequent_patterns import apriori, association_rules

# Sample data: Each row is a transaction, columns are items (1 = bought, 0 = not bought)
data = {
'milk': [1,1,0,1,0],
'bread': [1,1,1,1,1],
'cheese': [0,1,0,1,1],
'butter': [1,0,1,1,0]
}

# Create DataFrame
df = pd.DataFrame(data)

# Find frequent itemsets with minimum support of 0.5

frequent_itemsets = apriori(df, min_support=0.5, use_colnames=True)

print("Frequent Itemsets:")
print(frequent_itemsets)

# Generate association rules with minimum confidence of 1.0 (100%)

rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=1.0)

print("\nAssociation Rules:")
print(rules)

FP-GROWTH
# Correct imports
from mlxtend.frequent_patterns import fpgrowth
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules
import pandas as pd
# Sample dataset
data = {
'Bread': [True, True, True, False, False],
'Milk': [True, True, False, True, True],
'Butter': [False, True, True, True, True],
'Cheese': [True, False, True, True, False],
'Yogurt': [False, True, True, False, True]
}

# Create a DataFrame
df = pd.DataFrame(data)

# Apply FP-Growth
frequent_itemsets = fpgrowth(df, min_support=0.5, use_colnames=True)

# Print the result

print("Frequent itemsets (using FP-Growth):")
print(frequent_itemsets)

DECISION TREE
# Correct imports
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt

# Load the Iris dataset

iris = load_iris()
X, y = iris.data, iris.target

# Split the dataset

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42)

# Train the Decision Tree model

model = DecisionTreeClassifier(max_depth=2)
model.fit(X_train, y_train)
# Plot the decision tree
plt.figure(figsize=(10, 6))
plot_tree(
model,
filled=True,
feature_names=iris.feature_names,
class_names=iris.target_names
)
plt.show()

NAIVE BAYES

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay, accuracy_score
import matplotlib.pyplot as plt

# Load the Iris dataset

iris = datasets.load_iris()
X = iris.data
y = iris.target

# Split the data (90% train, 10% test)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=12)

# Train the Gaussian Naive Bayes model

model = GaussianNB()
model.fit(X_train, y_train)

# Predict on the test data

y_pred = model.predict(X_test)

# Calculate accuracy
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
# Generate and display the confusion matrix
cm = confusion_matrix(y_test, y_pred)
disp = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=iris.target_names)

# Plot the confusion matrix

disp.plot(cmap=plt.cm.Blues)
plt.title("Naive Bayes - Confusion Matrix")
plt.grid(False)
plt.show()

KNN ALGORITHM
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay, accuracy_score
from sklearn.inspection import DecisionBoundaryDisplay

# Load data (2 features for 2D plot)

iris = load_iris()
X, y = iris.data[:, :2], iris.target

# Split data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Train KNN
model = KNeighborsClassifier(n_neighbors=3)
model.fit(X_train, y_train)

# Decision boundary
disp = DecisionBoundaryDisplay.from_estimator(
model, X, response_method="predict", cmap=plt.cm.Set1,
xlabel=iris.feature_names[0], ylabel=iris.feature_names[1]
)
disp.ax_.scatter(X[:, 0], X[:, 1], c=y, edgecolor="k")
plt.title("KNN Decision Boundary (k=3)")
plt.show()
# Predict and evaluate
y_pred = model.predict(X_test)
acc = accuracy_score(y_test, y_pred)
print(f"Accuracy: {acc * 100:.2f}%")

# Confusion matrix
cm = confusion_matrix(y_test, y_pred)
ConfusionMatrixDisplay(cm, display_labels=iris.target_names).plot(cmap=plt.cm.Blues)
plt.title("KNN - Confusion Matrix")
plt.grid(False)
plt.show()

LINEAR REGRESSION
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_diabetes
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score

# Load dataset (Diabetes dataset is a good regression example)

data = load_diabetes()
X = data.data # Features
y = data.target # Target (disease progression)

# Split into train and test sets

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Create and train the model

model = LinearRegression()
model.fit(X_train, y_train)

# Predict
y_pred = model.predict(X_test)

# Evaluate
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f"Mean Squared Error: {mse:.2f}")

print(f"R² Score: {r2:.2f}")

# Plot predicted vs actual

plt.scatter(y_test, y_pred, color='blue')
plt.plot([y_test.min(), y_test.max()], [y_test.min(), y_test.max()], 'k--', lw=2)
plt.xlabel("Actual")
plt.ylabel("Predicted")
plt.title("Linear Regression: Actual vs Predicted")
plt.show()

EUCLIDEAN DISTANCE

import math
import matplotlib.pyplot as plt

# Function to calculate Euclidean distance

def euclidean_distance(x1, y1, x2, y2):
return math.sqrt((x2 - x1)**2 + (y2 - y1)**2)

# Points
x1, y1 = 2, 3
x2, y2 = 5, 7

# Calculate distance
distance = euclidean_distance(x1, y1, x2, y2)
print(f"The Euclidean distance between ({x1},{y1}) and ({x2},{y2}) is {distance:.2f}")

# Plotting
plt.figure(figsize=(6, 6))
plt.scatter([x1, x2], [y1, y2], color="blue", label="Points")
plt.plot([x1, x2], [y1, y2], color="green", linestyle="dashed")

# Labels and grid

plt.xlabel("x-axis")
plt.ylabel("y-axis")
plt.title(f"Euclidean Distance: {distance:.2f}")
plt.grid(True)
plt.legend()
plt.show()

MINKOWSKI DISTANCE
import math
import matplotlib.pyplot as plt

# Function to calculate Minkowski Distance

def minkowski_distance(x1, y1, x2, y2, p):
return ((abs(x2 - x1)**p + abs(y2 - y1)**p))**(1/p)

# Points
x1, y1 = 2, 3
x2, y2 = 5, 7
p = 3 # You can change p to 1 (Manhattan), 2 (Euclidean), etc.

# Calculate Minkowski Distance

distance = minkowski_distance(x1, y1, x2, y2, p)
print(f"The Minkowski distance (p={p}) between ({x1},{y1}) and ({x2},{y2}) is {distance:.2f}")

# Plotting
plt.figure(figsize=(6, 6))
plt.scatter([x1, x2], [y1, y2], color="purple", label="Points")
plt.plot([x1, x2], [y1, y2], color="orange", linestyle="dashed")

# Annotate points
plt.text(x1, y1, f"({x1},{y1})", fontsize=12, verticalalignment='bottom',
horizontalalignment='right')
plt.text(x2, y2, f"({x2},{y2})", fontsize=12, verticalalignment='bottom', horizontalalignment='left')
# Labels and grid
plt.xlabel("x-axis")
plt.ylabel("y-axis")
plt.title(f"Minkowski Distance (p={p}): {distance:.2f}")
plt.grid(True)
plt.legend()
plt.show()

MAHATTAN DISTANCE

import math
import matplotlib.pyplot as plt

# Function to calculate Manhattan Distance

def manhattan_distance(x1, y1, x2, y2):
return abs(x2 - x1) + abs(y2 - y1)

# Points
x1, y1 = 2, 3
x2, y2 = 5, 7

# Calculate Manhattan Distance

distance = manhattan_distance(x1, y1, x2, y2)
print(f"The Manhattan distance between ({x1},{y1}) and ({x2},{y2}) is {distance:.2f}")

# Plotting
plt.figure(figsize=(6, 6))
plt.scatter([x1, x2], [y1, y2], color="red", label="Points")

# Show horizontal and vertical path to illustrate Manhattan distance

plt.plot([x1, x2], [y1, y1], color='gray', linestyle='dotted')
plt.plot([x2, x2], [y1, y2], color='gray', linestyle='dotted')

# Annotate points
plt.text(x1, y1, f"({x1},{y1})", fontsize=12, verticalalignment='bottom',
horizontalalignment='right')
plt.text(x2, y2, f"({x2},{y2})", fontsize=12, verticalalignment='bottom', horizontalalignment='left')
# Labels and grid
plt.xlabel("x-axis")
plt.ylabel("y-axis")
plt.title(f"Manhattan Distance: {distance:.2f}")
plt.grid(True)
plt.legend()
plt.show()

K MEANS
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans

# Generate sample data

X, _ = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)

# Apply KMeans
kmeans = KMeans(n_clusters=4, random_state=0)
y_kmeans = kmeans.fit_predict(X)

# Plot
plt.scatter(X[:, 0], X[:, 1], c=y_kmeans, cmap='viridis')
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], s=100, c='red',
label='Centroids')
plt.title("K-Means Clustering")
plt.legend()
plt.show()

HIERARCHICAL CLUSTERING
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.cluster import AgglomerativeClustering
import scipy.cluster.hierarchy as sch

# Generate sample data

X, _ = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)
# Dendrogram
plt.figure(figsize=(8, 4))
dendrogram = sch.dendrogram(sch.linkage(X, method='ward'))
plt.title("Dendrogram (Hierarchical Clustering)")
plt.xlabel("Sample Index")
plt.ylabel("Distance")
plt.show()

# Agglomerative Clustering
hc = AgglomerativeClustering(n_clusters=4, affinity='euclidean', linkage='ward')
y_hc = hc.fit_predict(X)

# Plot clusters
plt.scatter(X[:, 0], X[:, 1], c=y_hc, cmap='rainbow')
plt.title("Hierarchical Clustering")
plt.show()

DBSCAN
import matplotlib.pyplot as plt
from sklearn.datasets import make_moons
from sklearn.cluster import DBSCAN
from sklearn.preprocessing import StandardScaler

# Generate non-spherical data

X, _ = make_moons(n_samples=300, noise=0.05, random_state=0)
X = StandardScaler().fit_transform(X)

# Apply DBSCAN
db = DBSCAN(eps=0.3, min_samples=5)
y_db = db.fit_predict(X)

# Plot DBSCAN results

plt.scatter(X[:, 0], X[:, 1], c=y_db, cmap='plasma')
plt.title("DBSCAN Clustering")
plt.show()
GREEN CREDIT DATA
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

from sklearn.preprocessing import MinMaxScaler

from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score
from scipy.cluster.hierarchy import dendrogram, linkage
from mlxtend.frequent_patterns import apriori, association_rules

# Step 1: Load your CSV file

df = pd.read_csv("sas.csv")
print("Initial Shape:", df.shape)

# Step 2: Fill missing values if any

df.fillna(method="ffill", inplace=True)

# Step 3: Encode categorical columns

for col in df.select_dtypes(include='object').columns:
df[col] = pd.factorize(df[col])[0]

# Step 4: Normalize the dataset

scaler = MinMaxScaler()
df_scaled = pd.DataFrame(scaler.fit_transform(df), columns=df.columns)

# Step 5: Correlation heatmap

plt.figure(figsize=(10, 6))
sns.heatmap(df_scaled.corr(), annot=True, cmap='coolwarm')
plt.title("Correlation Heatmap")
plt.tight_layout()
plt.show()

# Step 6: K-Means Clustering

kmeans = KMeans(n_clusters=3, random_state=42)
labels = kmeans.fit_predict(df_scaled)
print("Silhouette Score (K-Means):", silhouette_score(df_scaled, labels))
# Step 7: Hierarchical Clustering
linked = linkage(df_scaled, method='ward')
plt.figure(figsize=(10, 6))
dendrogram(linked, no_labels=True)
plt.title("Dendrogram - Hierarchical Clustering")
plt.tight_layout()
plt.show()

# Step 8: Association Rule Mining (Apriori)

# Discretize numerical columns into bins
df_bin = df.copy()
for col in df_bin.columns:
try:
df_bin[col] = pd.qcut(df_bin[col].rank(method="first"), q=4, labels=False)
except ValueError:
df_bin[col] = df_bin[col]

df_bin = df_bin.astype(str) # Convert to string for one-hot encoding

df_encoded = pd.get_dummies(df_bin)

# Apply Apriori algorithm

frequent_items = apriori(df_encoded, min_support=0.3, use_colnames=True)

# Generate association rules

rules = association_rules(frequent_items, metric="lift", min_threshold=1.0)

# Show sample rules

print("\nSample Association Rules:")
print(rules[['antecedents', 'consequents', 'support', 'confidence', 'lift']].head())

convert these into PDF

Unit2 ML Programs
No ratings yet
Unit2 ML Programs
7 pages
Python For Data Science IA 1 Programs
No ratings yet
Python For Data Science IA 1 Programs
14 pages
Wa0003
No ratings yet
Wa0003
16 pages
V
No ratings yet
V
8 pages
Aam Codes
No ratings yet
Aam Codes
8 pages
ML Programs
No ratings yet
ML Programs
14 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
Python For Data Science IA 1 Programs
No ratings yet
Python For Data Science IA 1 Programs
14 pages
MLLab Manual
No ratings yet
MLLab Manual
24 pages
Assignment #1: K Nearest Neighbor Classifier: Name: Srikanth Mujjiga (Roll No: 2015-50-831
No ratings yet
Assignment #1: K Nearest Neighbor Classifier: Name: Srikanth Mujjiga (Roll No: 2015-50-831
8 pages
Assignment 4
No ratings yet
Assignment 4
9 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
9 pages
ML Experiment WithDataset
No ratings yet
ML Experiment WithDataset
23 pages
Machine Learning Lab
No ratings yet
Machine Learning Lab
33 pages
Programs Lab Bca
No ratings yet
Programs Lab Bca
16 pages
Python ML Algorithms Guide
No ratings yet
Python ML Algorithms Guide
7 pages
LAB-4 Report
No ratings yet
LAB-4 Report
21 pages
Mlalllabprgs
No ratings yet
Mlalllabprgs
17 pages
1st PGM
No ratings yet
1st PGM
10 pages
Titanic Shuffle Analysis in ML Lab
No ratings yet
Titanic Shuffle Analysis in ML Lab
24 pages
DM ML Practical
No ratings yet
DM ML Practical
13 pages
Machine Learning Programs
No ratings yet
Machine Learning Programs
10 pages
ML Journal External
No ratings yet
ML Journal External
14 pages
Mlda - Lab
No ratings yet
Mlda - Lab
35 pages
Experiment 1111
No ratings yet
Experiment 1111
25 pages
Implementing KNN Algorithm On The Iris Dataset
No ratings yet
Implementing KNN Algorithm On The Iris Dataset
7 pages
Machine Learning Algorithms Guide
No ratings yet
Machine Learning Algorithms Guide
34 pages
Lab Manual
No ratings yet
Lab Manual
9 pages
S6 - Data Mining Lab Experiments (Except 1)
No ratings yet
S6 - Data Mining Lab Experiments (Except 1)
6 pages
1
No ratings yet
1
13 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
18 pages
Machine Learning
100% (5)
Machine Learning
56 pages
Linearregression SVM
No ratings yet
Linearregression SVM
3 pages
Lab4 KNN
No ratings yet
Lab4 KNN
9 pages
Argha's ML LAB - 240927 - 121838
No ratings yet
Argha's ML LAB - 240927 - 121838
13 pages
DSM 2
No ratings yet
DSM 2
7 pages
KNN Distance Calculation Explained
No ratings yet
KNN Distance Calculation Explained
14 pages
Iii Aid - ML
No ratings yet
Iii Aid - ML
30 pages
ML Short Code - Under Updating
No ratings yet
ML Short Code - Under Updating
4 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
Data Science Code Implementations
No ratings yet
Data Science Code Implementations
274 pages
EX - NO:3: Algorithm
No ratings yet
EX - NO:3: Algorithm
11 pages
Ai Lab Programs
No ratings yet
Ai Lab Programs
5 pages
Iris Dataset Analysis with KNN & K-Means
No ratings yet
Iris Dataset Analysis with KNN & K-Means
6 pages
Minor Assignment 4
No ratings yet
Minor Assignment 4
17 pages
Data Analytics
No ratings yet
Data Analytics
10 pages
SOLUTION ONLY CODE DWDM - Lab - All
No ratings yet
SOLUTION ONLY CODE DWDM - Lab - All
8 pages
EE 559 HW2Code PDF
No ratings yet
EE 559 HW2Code PDF
7 pages
Aml Lab
No ratings yet
Aml Lab
6 pages
KNN and K-Means with Iris Dataset
No ratings yet
KNN and K-Means with Iris Dataset
6 pages
ML
No ratings yet
ML
11 pages
ML Lab
No ratings yet
ML Lab
23 pages
Machine Learning Practical File MRIEM
No ratings yet
Machine Learning Practical File MRIEM
49 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
26 pages
Minor Lab
No ratings yet
Minor Lab
4 pages
Strangers
No ratings yet
Strangers
8 pages
DMT Cia2
No ratings yet
DMT Cia2
11 pages
ML II Lab
No ratings yet
ML II Lab
5 pages
Machine Learning LAB
No ratings yet
Machine Learning LAB
20 pages
Worksheet Answers HandwrittenStyle
No ratings yet
Worksheet Answers HandwrittenStyle
2 pages
LSTM Variable 1.1
No ratings yet
LSTM Variable 1.1
11 pages
GBT Unit-1
No ratings yet
GBT Unit-1
41 pages
Online Voting System Design
No ratings yet
Online Voting System Design
9 pages
Numerical Analysis: Error Propagation Techniques
No ratings yet
Numerical Analysis: Error Propagation Techniques
52 pages
1.introduction To Artificial Neural Networks (ANNs)
No ratings yet
1.introduction To Artificial Neural Networks (ANNs)
2 pages
To Find Zeroes of A Quadratic Polynomials Graphically
No ratings yet
To Find Zeroes of A Quadratic Polynomials Graphically
3 pages
To Write A Program To Compute GCD of Two Number
No ratings yet
To Write A Program To Compute GCD of Two Number
19 pages
B.Tech Operations Research Tasks
No ratings yet
B.Tech Operations Research Tasks
2 pages
Single Source Shortest Paths
No ratings yet
Single Source Shortest Paths
17 pages
Complex Number Solutions Full
No ratings yet
Complex Number Solutions Full
2 pages
Linear Equations in Data Science
No ratings yet
Linear Equations in Data Science
20 pages
Geeta Bi Math 10 (Sat 2) 2025
No ratings yet
Geeta Bi Math 10 (Sat 2) 2025
7 pages
Evaluating and Graphing Polynomial Functions
No ratings yet
Evaluating and Graphing Polynomial Functions
30 pages
An Assignment Problem Is A Particular Case of Transportation Problem
No ratings yet
An Assignment Problem Is A Particular Case of Transportation Problem
7 pages
DAA Exp 8 - 40
No ratings yet
DAA Exp 8 - 40
7 pages
Lect 4
No ratings yet
Lect 4
54 pages
L-2005-05-Divide and Conquer
No ratings yet
L-2005-05-Divide and Conquer
25 pages
CS - 404!1!202520 Analysis of Algorithms - Northeastern Illinois University
No ratings yet
CS - 404!1!202520 Analysis of Algorithms - Northeastern Illinois University
11 pages
Perceptron Convergence Theorem
No ratings yet
Perceptron Convergence Theorem
15 pages
Operations Research Solved MCQs (Set-1)
No ratings yet
Operations Research Solved MCQs (Set-1)
5 pages
Programming Assignment 1
No ratings yet
Programming Assignment 1
1 page
Example PSO
100% (1)
Example PSO
5 pages
Overview of Finite Element Method
No ratings yet
Overview of Finite Element Method
3 pages
MATLAB Bisection & Regula-Falsi Guide
No ratings yet
MATLAB Bisection & Regula-Falsi Guide
12 pages
Full-Factorial Experiment Design Data
No ratings yet
Full-Factorial Experiment Design Data
9 pages
Chapter 2 - Polynomials
No ratings yet
Chapter 2 - Polynomials
27 pages
What Is Backtracking Search in CSPs
No ratings yet
What Is Backtracking Search in CSPs
1 page
Ai 11
No ratings yet
Ai 11
15 pages
Math Quiz Bee School Based
100% (6)
Math Quiz Bee School Based
4 pages
Ncert Solutions Class 10 Maths Chapter 2 Ex 2 2
No ratings yet
Ncert Solutions Class 10 Maths Chapter 2 Ex 2 2
10 pages
CLL113 Quiz 2 Solutions
No ratings yet
CLL113 Quiz 2 Solutions
22 pages
Finding General Rules for Sequences
No ratings yet
Finding General Rules for Sequences
10 pages
Quadratic
No ratings yet
Quadratic
3 pages

Apriori Algorithm

Uploaded by

Apriori Algorithm

Uploaded by

APRIORI ALGORITHM

# Install necessary packages

# Find frequent itemsets with minimum support of 0.5

# Generate association rules with minimum confidence of 1.0 (100%)

# Print the result

# Load the Iris dataset

# Split the dataset

# Train the Decision Tree model

# Load the Iris dataset

# Split the data (90% train, 10% test)

# Train the Gaussian Naive Bayes model

# Predict on the test data

# Plot the confusion matrix

# Load data (2 features for 2D plot)

# Load dataset (Diabetes dataset is a good regression example)

# Split into train and test sets

# Create and train the model

print(f"Mean Squared Error: {mse:.2f}")

# Plot predicted vs actual

# Function to calculate Euclidean distance

# Labels and grid

# Function to calculate Minkowski Distance

# Calculate Minkowski Distance

# Function to calculate Manhattan Distance

# Calculate Manhattan Distance

# Show horizontal and vertical path to illustrate Manhattan distance

# Generate sample data

# Generate sample data

# Generate non-spherical data

# Plot DBSCAN results

from sklearn.preprocessing import MinMaxScaler

# Step 1: Load your CSV file

# Step 2: Fill missing values if any

# Step 3: Encode categorical columns

# Step 4: Normalize the dataset

# Step 5: Correlation heatmap

# Step 6: K-Means Clustering

# Step 8: Association Rule Mining (Apriori)

df_bin = df_bin.astype(str) # Convert to string for one-hot encoding

# Apply Apriori algorithm

# Generate association rules

# Show sample rules

convert these into PDF

You might also like