0% found this document useful (0 votes)

53 views5 pages

Iris Classifier Accuracy Comparison

The document uses Naive Bayes, K-nearest neighbors, and decision tree classifiers on iris data. It compares the accuracy of the classifiers using different training and test set splits, as well as scaling the data.

Uploaded by

BHAVIKA MALHOTRA

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

53 views5 pages

Iris Classifier Accuracy Comparison

Uploaded by

BHAVIKA MALHOTRA

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 5

Use Naive bayes, K-nearest, and Decision tree classification algorithms and build classifiers.

Divide the data set into training and test set. Compare the accuracy of the different classifiers
under the following situations:

import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.neighbors import KNeighborsClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

# Load Iris dataset

iris = load_iris()
# Create a DataFrame
iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names)

# Add the target variable (species) to the DataFrame

iris_df['species'] = iris.target

X = iris.data
y = iris.target

print(iris_df.head(5))

sepal length (cm) sepal width (cm) petal length (cm) petal width
(cm) \
0 5.1 3.5 1.4
0.2
1 4.9 3.0 1.4
0.2
2 4.7 3.2 1.3
0.2
3 4.6 3.1 1.5
0.2
4 5.0 3.6 1.4
0.2

species
0 0
1 0
2 0
3 0
4 0

Splitting the data into training and test sets (75% training, 25% test)

# Define classifiers
nb_classifier = GaussianNB()
knn_classifier = KNeighborsClassifier()
dt_classifier = DecisionTreeClassifier()

# Splitting the data into training and test sets (75% training, 25%
test)
X_train_a, X_test_a, y_train_a, y_test_a = train_test_split(X, y,
test_size=0.25, random_state=42)

# Train classifiers on the training set

nb_classifier.fit(X_train_a, y_train_a)
knn_classifier.fit(X_train_a, y_train_a)
dt_classifier.fit(X_train_a, y_train_a)

# Make predictions on the test set

nb_pred_a = nb_classifier.predict(X_test_a)
knn_pred_a = knn_classifier.predict(X_test_a)
dt_pred_a = dt_classifier.predict(X_test_a)

# Calculate accuracy scores

nb_accuracy_a = accuracy_score(y_test_a, nb_pred_a)
knn_accuracy_a = accuracy_score(y_test_a, knn_pred_a)
dt_accuracy_a = accuracy_score(y_test_a, dt_pred_a)

print("Accuracy using 75-25 split:")

print("Naive Bayes Classifier Accuracy:", nb_accuracy_a)
print("K-Nearest Neighbors Classifier Accuracy:", knn_accuracy_a)
print("Decision Tree Classifier Accuracy:", dt_accuracy_a)

Accuracy using 75-25 split:

Naive Bayes Classifier Accuracy: 1.0
K-Nearest Neighbors Classifier Accuracy: 1.0
Decision Tree Classifier Accuracy: 1.0

Splitting the data into training and test sets (2/3rd training, 1/3rd test)

X_train_b, X_test_b, y_train_b, y_test_b = train_test_split(X, y,

test_size=0.33, random_state=42)

# Train classifiers on the training set

nb_classifier.fit(X_train_b, y_train_b)
knn_classifier.fit(X_train_b, y_train_b)
dt_classifier.fit(X_train_b, y_train_b)

# Make predictions on the test set

nb_pred_b = nb_classifier.predict(X_test_b)
knn_pred_b = knn_classifier.predict(X_test_b)
dt_pred_b = dt_classifier.predict(X_test_b)

# Calculate accuracy scores

nb_accuracy_b = accuracy_score(y_test_b, nb_pred_b)
knn_accuracy_b = accuracy_score(y_test_b, knn_pred_b)
dt_accuracy_b = accuracy_score(y_test_b, dt_pred_b)

print("\nAccuracy using 66.6-33.3 split:")

print("Naive Bayes Classifier Accuracy:", nb_accuracy_b)
print("K-Nearest Neighbors Classifier Accuracy:", knn_accuracy_b)
print("Decision Tree Classifier Accuracy:", dt_accuracy_b)

Accuracy using 66.6-33.3 split:

Naive Bayes Classifier Accuracy: 0.96
K-Nearest Neighbors Classifier Accuracy: 0.98
Decision Tree Classifier Accuracy: 1.0

5.2 (a) Hold-out Method:

# Hold-out method
X_train_holdout, X_test_holdout, y_train_holdout, y_test_holdout =
train_test_split(X, y, test_size=0.2, random_state=42)

# Train classifiers on the training set

nb_classifier.fit(X_train_holdout, y_train_holdout)
knn_classifier.fit(X_train_holdout, y_train_holdout)
dt_classifier.fit(X_train_holdout, y_train_holdout)

# Make predictions on the test set

nb_pred_holdout = nb_classifier.predict(X_test_holdout)
knn_pred_holdout = knn_classifier.predict(X_test_holdout)
dt_pred_holdout = dt_classifier.predict(X_test_holdout)

# Calculate accuracy scores

nb_accuracy_holdout = accuracy_score(y_test_holdout, nb_pred_holdout)
knn_accuracy_holdout = accuracy_score(y_test_holdout,
knn_pred_holdout)
dt_accuracy_holdout = accuracy_score(y_test_holdout, dt_pred_holdout)

print("\nAccuracy using Hold-out Method:")

print("Naive Bayes Classifier Accuracy:", nb_accuracy_holdout)
print("K-Nearest Neighbors Classifier Accuracy:",
knn_accuracy_holdout)
print("Decision Tree Classifier Accuracy:", dt_accuracy_holdout)

Accuracy using Hold-out Method:

Naive Bayes Classifier Accuracy: 1.0
K-Nearest Neighbors Classifier Accuracy: 1.0
Decision Tree Classifier Accuracy: 1.0

(ii) Random subsampling

# Random Subsampling
accuracies_nb = []
accuracies_knn = []
accuracies_dt = []

for _ in range(10): # Perform 10 random subsampling iterations

X_train_sub, X_test_sub, y_train_sub, y_test_sub =
train_test_split(X, y, test_size=0.2)

# Train classifiers on the training set

nb_classifier.fit(X_train_sub, y_train_sub)
knn_classifier.fit(X_train_sub, y_train_sub)
dt_classifier.fit(X_train_sub, y_train_sub)

# Make predictions on the test set

nb_pred_sub = nb_classifier.predict(X_test_sub)
knn_pred_sub = knn_classifier.predict(X_test_sub)
dt_pred_sub = dt_classifier.predict(X_test_sub)

# Calculate accuracy scores and append to the list

accuracies_nb.append(accuracy_score(y_test_sub, nb_pred_sub))
accuracies_knn.append(accuracy_score(y_test_sub, knn_pred_sub))
accuracies_dt.append(accuracy_score(y_test_sub, dt_pred_sub))

# Calculate average accuracy

avg_accuracy_nb = sum(accuracies_nb) / len(accuracies_nb)
avg_accuracy_knn = sum(accuracies_knn) / len(accuracies_knn)
avg_accuracy_dt = sum(accuracies_dt) / len(accuracies_dt)

print("\nAverage accuracy using Random Subsampling:")

print("Naive Bayes Classifier Accuracy:", avg_accuracy_nb)
print("K-Nearest Neighbors Classifier Accuracy:", avg_accuracy_knn)
print("Decision Tree Classifier Accuracy:", avg_accuracy_dt)

Average accuracy using Random Subsampling:

Naive Bayes Classifier Accuracy: 0.9366666666666668
K-Nearest Neighbors Classifier Accuracy: 0.9566666666666667
Decision Tree Classifier Accuracy: 0.9400000000000001

(iii) Cross Validation

from sklearn.model_selection import cross_val_score

# Cross-validation
cv_scores_nb = cross_val_score(nb_classifier, X, y, cv=5)
cv_scores_knn = cross_val_score(knn_classifier, X, y, cv=5)
cv_scores_dt = cross_val_score(dt_classifier, X, y, cv=5)

print("\nCross-validation scores:")
print("Naive Bayes Classifier Accuracy:", cv_scores_nb.mean())
print("K-Nearest Neighbors Classifier Accuracy:",
cv_scores_knn.mean())
print("Decision Tree Classifier Accuracy:", cv_scores_dt.mean())

Cross-validation scores:
Naive Bayes Classifier Accuracy: 0.9533333333333334
K-Nearest Neighbors Classifier Accuracy: 0.9733333333333334
Decision Tree Classifier Accuracy: 0.9600000000000002

5.3 Data is scaled to standard format.

from sklearn.preprocessing import StandardScaler

# Standardize features
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Split the scaled data into training and test sets

X_train_scaled, X_test_scaled, y_train_scaled, y_test_scaled =
train_test_split(X_scaled, y, test_size=0.2, random_state=42)

# Train classifiers on the scaled training set

nb_classifier.fit(X_train_scaled, y_train_scaled)
knn_classifier.fit(X_train_scaled, y_train_scaled)
dt_classifier.fit(X_train_scaled, y_train_scaled)

# Make predictions on the scaled test set

nb_pred_scaled = nb_classifier.predict(X_test_scaled)
knn_pred_scaled = knn_classifier.predict(X_test_scaled)
dt_pred_scaled = dt_classifier.predict(X_test_scaled)

# Calculate accuracy scores

nb_accuracy_scaled = accuracy_score(y_test_scaled, nb_pred_scaled)
knn_accuracy_scaled = accuracy_score(y_test_scaled, knn_pred_scaled)
dt_accuracy_scaled = accuracy_score(y_test_scaled, dt_pred_scaled)

print("\nAccuracy after scaling the data:")

print("Naive Bayes Classifier Accuracy:", nb_accuracy_scaled)
print("K-Nearest Neighbors Classifier Accuracy:", knn_accuracy_scaled)
print("Decision Tree Classifier Accuracy:", dt_accuracy_scaled)

Accuracy after scaling the data:

Naive Bayes Classifier Accuracy: 1.0
K-Nearest Neighbors Classifier Accuracy: 1.0
Decision Tree Classifier Accuracy: 1.0

Scikit Learn Cross-Validation Guide
No ratings yet
Scikit Learn Cross-Validation Guide
141 pages
Lab - 5 (CB - En.u4ece22115)
No ratings yet
Lab - 5 (CB - En.u4ece22115)
5 pages
EX - NO:3: Algorithm
No ratings yet
EX - NO:3: Algorithm
11 pages
Programs Lab Bca
No ratings yet
Programs Lab Bca
16 pages
ML5 Implementation
No ratings yet
ML5 Implementation
32 pages
ML Using Python Programs
No ratings yet
ML Using Python Programs
12 pages
Decision Tree
No ratings yet
Decision Tree
2 pages
3 Classification
No ratings yet
3 Classification
16 pages
Aam Codes
No ratings yet
Aam Codes
8 pages
Lab06 KNN 01
No ratings yet
Lab06 KNN 01
3 pages
ML Lab-1
No ratings yet
ML Lab-1
32 pages
Decision Tree
No ratings yet
Decision Tree
6 pages
Comparison of Classifiers
No ratings yet
Comparison of Classifiers
6 pages
Machine Learning Aiml
No ratings yet
Machine Learning Aiml
7 pages
ML Lab Programs 2
No ratings yet
ML Lab Programs 2
16 pages
NaiveBayesClassifier - Jupyter Notebook
No ratings yet
NaiveBayesClassifier - Jupyter Notebook
2 pages
Code Examples in Space
No ratings yet
Code Examples in Space
13 pages
ML Remaining Jds
No ratings yet
ML Remaining Jds
35 pages
Dsbda 10
No ratings yet
Dsbda 10
5 pages
ML Lab Manual
No ratings yet
ML Lab Manual
6 pages
Tutorial 6
No ratings yet
Tutorial 6
8 pages
L3 - Classification - RandomForest - Jupyter Notebook
No ratings yet
L3 - Classification - RandomForest - Jupyter Notebook
6 pages
Ai/Ml Lab-4: Name: Pratik Jadhav PRN: 20190802050
No ratings yet
Ai/Ml Lab-4: Name: Pratik Jadhav PRN: 20190802050
5 pages
ML Lab Programs
No ratings yet
ML Lab Programs
23 pages
Linearregression SVM
No ratings yet
Linearregression SVM
3 pages
Prakhar - Week 5
No ratings yet
Prakhar - Week 5
8 pages
LAB-4 Report
No ratings yet
LAB-4 Report
21 pages
Decision Trees for Data Scientists
No ratings yet
Decision Trees for Data Scientists
1 page
All in One
No ratings yet
All in One
13 pages
Data Mining and Warehousing Concepts Lab: (ITPC - 228)
No ratings yet
Data Mining and Warehousing Concepts Lab: (ITPC - 228)
6 pages
ML
No ratings yet
ML
11 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
6 pages
TranMinhTu1 bt2 2
No ratings yet
TranMinhTu1 bt2 2
5 pages
DM ML Practical
No ratings yet
DM ML Practical
13 pages
Implementing KNN Algorithm On The Iris Dataset
No ratings yet
Implementing KNN Algorithm On The Iris Dataset
7 pages
KNN and Random Forests Guide
No ratings yet
KNN and Random Forests Guide
6 pages
Machine Learning Evaluation Guide
100% (1)
Machine Learning Evaluation Guide
504 pages
Python ML Algorithms Guide
No ratings yet
Python ML Algorithms Guide
7 pages
AI Assignment-6
No ratings yet
AI Assignment-6
7 pages
AML Lab
No ratings yet
AML Lab
14 pages
Machine Learning Assignment
No ratings yet
Machine Learning Assignment
8 pages
ML Algorithms
100% (1)
ML Algorithms
1 page
ML
No ratings yet
ML
7 pages
Practical 5
No ratings yet
Practical 5
11 pages
KNN and Decision Tree Analysis
No ratings yet
KNN and Decision Tree Analysis
5 pages
Lab Manual
No ratings yet
Lab Manual
9 pages
VAMSHI PR (1) 2 Edit
No ratings yet
VAMSHI PR (1) 2 Edit
16 pages
Ai Int-1
No ratings yet
Ai Int-1
6 pages
Unit 2
No ratings yet
Unit 2
5 pages
ML Codes
No ratings yet
ML Codes
9 pages
Perform The Data Classification Using SVM Classifier - BI Prac 1
No ratings yet
Perform The Data Classification Using SVM Classifier - BI Prac 1
8 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
Case Study - Classifier
No ratings yet
Case Study - Classifier
5 pages
TASK01 IrisFlowerClassificationwithMachineLearning 1752340862
No ratings yet
TASK01 IrisFlowerClassificationwithMachineLearning 1752340862
3 pages
Iris Dataset EDA and ML Models
No ratings yet
Iris Dataset EDA and ML Models
17 pages
00 KNN Classification
No ratings yet
00 KNN Classification
8 pages
MSDS - Acetyl Hexapeptide-8 (Argireline)
No ratings yet
MSDS - Acetyl Hexapeptide-8 (Argireline)
4 pages
24
No ratings yet
24
21 pages
Solenoides Ss Series Parker
No ratings yet
Solenoides Ss Series Parker
34 pages
71 - Ansi Agma 2008-D11
No ratings yet
71 - Ansi Agma 2008-D11
49 pages
Bures 1989
No ratings yet
Bures 1989
5 pages
Impact of Node Mobility On MANET Routing Protocols Models: Bhavyesh Divecha, Ajith Abraham and Sugata Sanyal
No ratings yet
Impact of Node Mobility On MANET Routing Protocols Models: Bhavyesh Divecha, Ajith Abraham and Sugata Sanyal
11 pages
Carrier Condensador 38ckc
No ratings yet
Carrier Condensador 38ckc
36 pages
Testing Rate at RUET 5-9-18
100% (4)
Testing Rate at RUET 5-9-18
5 pages
Jsae Jaso M305-1988
100% (1)
Jsae Jaso M305-1988
25 pages
Ec 1 Module 5 Vectors and Its Applications
No ratings yet
Ec 1 Module 5 Vectors and Its Applications
3 pages
Plate Hydraulic Design Procedure111
No ratings yet
Plate Hydraulic Design Procedure111
17 pages
Q88 29.08.2022 - Habi
No ratings yet
Q88 29.08.2022 - Habi
6 pages
Bad Movie Physics Final
No ratings yet
Bad Movie Physics Final
10 pages
Hướng Dẫn Sử Dụng Giới Từ Thời Gian
No ratings yet
Hướng Dẫn Sử Dụng Giới Từ Thời Gian
2 pages
Sony Fda-Ev1s Ver.1.0 SM
No ratings yet
Sony Fda-Ev1s Ver.1.0 SM
8 pages
Brewmaster and Scavenger Skills Guide
No ratings yet
Brewmaster and Scavenger Skills Guide
1 page
Audio-Video Product Service Guide
No ratings yet
Audio-Video Product Service Guide
63 pages
Centre of Mass, Torque & Angular Momentum
No ratings yet
Centre of Mass, Torque & Angular Momentum
18 pages
Molar Mass Determination of Volatile Liquid
No ratings yet
Molar Mass Determination of Volatile Liquid
8 pages
HR Project Report
100% (2)
HR Project Report
100 pages
Unit-9 Full
No ratings yet
Unit-9 Full
6 pages
Tooth Morphology Basics
No ratings yet
Tooth Morphology Basics
86 pages
Model No.: N101Lge SUFFIX: L11 (Rev C1) : Product Specification
No ratings yet
Model No.: N101Lge SUFFIX: L11 (Rev C1) : Product Specification
31 pages
Serious Problems With The Jesus Only Doctrine
No ratings yet
Serious Problems With The Jesus Only Doctrine
20 pages
SOR 2010 for DWS Pipe Handling
No ratings yet
SOR 2010 for DWS Pipe Handling
114 pages
Quick Disconnect Couplings Guide
No ratings yet
Quick Disconnect Couplings Guide
14 pages
The Universal Medicine
No ratings yet
The Universal Medicine
37 pages
Café Supplies Price List 2023
No ratings yet
Café Supplies Price List 2023
3 pages
Sarcomas of Soft Tissue: Brian A. Van Tine
No ratings yet
Sarcomas of Soft Tissue: Brian A. Van Tine
50 pages
Palletpack 460: Function Package
No ratings yet
Palletpack 460: Function Package
2 pages

Iris Classifier Accuracy Comparison

Uploaded by

Iris Classifier Accuracy Comparison

Uploaded by

Use Naive bayes, K-nearest, and Decision tree classification algorithms and build classifiers.

# Load Iris dataset

# Add the target variable (species) to the DataFrame

# Train classifiers on the training set

# Make predictions on the test set

# Calculate accuracy scores

print("Accuracy using 75-25 split:")

Accuracy using 75-25 split:

X_train_b, X_test_b, y_train_b, y_test_b = train_test_split(X, y,

# Train classifiers on the training set

# Make predictions on the test set

# Calculate accuracy scores

print("\nAccuracy using 66.6-33.3 split:")

Accuracy using 66.6-33.3 split:

5.2 (a) Hold-out Method:

# Train classifiers on the training set

# Make predictions on the test set

# Calculate accuracy scores

print("\nAccuracy using Hold-out Method:")

Accuracy using Hold-out Method:

(ii) Random subsampling

for _ in range(10): # Perform 10 random subsampling iterations

# Train classifiers on the training set

# Make predictions on the test set

# Calculate accuracy scores and append to the list

# Calculate average accuracy

print("\nAverage accuracy using Random Subsampling:")

Average accuracy using Random Subsampling:

(iii) Cross Validation

from sklearn.model_selection import cross_val_score

5.3 Data is scaled to standard format.

from sklearn.preprocessing import StandardScaler

# Split the scaled data into training and test sets

# Train classifiers on the scaled training set

# Make predictions on the scaled test set

# Calculate accuracy scores

print("\nAccuracy after scaling the data:")

Accuracy after scaling the data:

You might also like