0% found this document useful (0 votes)

14 views9 pages

Program

The document contains a series of Python programs that demonstrate various data analysis techniques on the Iris dataset using libraries such as pandas, sklearn, and matplotlib. It covers data encoding, visualization, linear and logistic regression, Naïve Bayes classification, K-means clustering, normalization, imputation, PCA, support vector machines, decision trees, and KNN classification. Each part includes code snippets and explanations for implementing these techniques.

Uploaded by

Adhil E S

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

14 views9 pages

Program

Uploaded by

Adhil E S

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

part A

1. Write a program to describe the dataset using pandasdataframe commands and

encode the

same.

Program Code :

fromsklearn import datasets

importnumpy as np

import pandas as pd

fromsklearn.preprocessing import LabelEncoder, OneHotEncoder

data=pd.read_csv(r"C:\Users\jackw\Downloads\iris.csv")

iris=datasets.load_iris()

data=pd.DataFrame(data=np.c_[iris['data'],iris['target']],

columns=iris['feature_names']+['target'])

data['target_names']=data['target'].replace(dict(enumerate(iris.target_names)))

print(data.head())

data.info()

print(data.describe())

Label_encoder=LabelEncoder()

data['target_names']=Label_encoder.fit_transform(data['target_names'])

print(data['target_names'])

print(Label_encoder.classes_)

print(data['target_names'].value_counts())

One_hot=OneHotEncoder()

transformed_data=One_hot.fit_transform(data['target_names'].values.reshape(-1,1)
).toarray()

print(One_hot.categories_)

transformed_data=pd.DataFrame(transformed_data,
columns=['setosa','versicolor','virginica'])

print(transformed_data.head())

2. Write a program to visualize the iris dataset using sepal and petal values.

Program Code:

fromsklearn import datasets

importnumpy as np

import pandas as pd
importmatplotlib.pyplot as plt

iris = datasets.load_iris()

data = pd.DataFrame(data=iris.data, columns=iris.feature_names)

print(data)

fig, ax = plt.subplots() # Assign fig here

scatter = ax.scatter(iris.data[:, 0], iris.data[:, 1], c=iris.target)

ax.set(xlabel=iris.feature_names[0], ylabel=iris.feature_names[1])

ax.legend(scatter.legend_elements()[0], iris.target_names, loc="lower right",

title="Classes")

plt.show()

fig, ax = plt.subplots()

scatter = ax.scatter(iris.data[:, 0], iris.data[:, 1], c=iris.target)

ax.set(xlabel=iris.feature_names[2], ylabel=iris.feature_names[3])

ax.legend(scatter.legend_elements()[0], iris.target_names, loc="lower right",

title="Classes")

plt.show()

3. Write a program to apply linear regression on the iris dataset and find the
error of prediction.

Ans: from sklearn import datasets, decomposition

import pandas as pd

fromsklearn.linear_model import LinearRegression

fromsklearn.model_selection import train_test_split

fromsklearn.metrics import mean_squared_error

importmatplotlib.pyplot as plt

iris = datasets.load_iris()

X = iris.data

y = iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,

random_state=42)

model = LinearRegression()

model.fit(X_train, y_train)

y_pred = model.predict(X_test)

mse = mean_squared_error(y_test, y_pred)

print("Mean Squared Error:", mse)

4. Write a program to apply logistic regression on the iris dataset.

Ans: from sklearn import datasets, decomposition

import pandas as pd

fromsklearn.linear_model import LogisticRegression

fromsklearn.model_selection import train_test_split

fromsklearn.metrics import mean_squared_error

iris = datasets.load_iris()

data = pd.DataFrame(data=iris.data, columns=iris.feature_names)

X = data

y = iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,

random_state=42)

logreg = LogisticRegression(solver='lbfgs', penalty='l2', max_iter=10000)

logreg.fit(X_train, y_train)

y_pred = logreg.predict(X_test)

mse = mean_squared_error(y_test, y_pred)

print("Mean Squared Error:", mse)

accuracy = logreg.score(X_test, y_test)

print("Logistic regression Accuracy:", accuracy)

5. Write a program to apply naïve bayes classifier on the iris dataset.

Ans: from sklearn import datasets, decomposition

import pandas as pd

fromsklearn.model_selection import train_test_split

fromsklearn.naive_bayes import GaussianNB

fromsklearn.metrics import accuracy_score

iris = datasets.load_iris()

X = iris.data

y = iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,

random_state=42)

model = GaussianNB()

model.fit(X_train, y_train)

y_pred = model.predict(X_test)
accuray = accuracy_score(y_pred, y_test)

print("Accuracy score is:", accuray)

6.Write a program to apply k-means clustering on the iris dataset.

Ans: from sklearn import datasets, decomposition

import pandas as pd

fromsklearn.model_selection import train_test_split

fromsklearn.cluster import KMeans

importmatplotlib.pyplot as plt

iris = datasets.load_iris()

X = iris.data

y = iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,

random_state=42)

kmeans = KMeans(n_clusters = 3, init = 'k-means++', max_iter = 300, n_init = 10,

random_state = 0)

y_kmeans = kmeans.fit_predict(X)

plt.scatter(X[y_kmeans == 0, 0], X[y_kmeans == 0, 1], s = 100, c = 'purple',

label = 'Iris-setosa')

plt.scatter(X[y_kmeans == 1, 0], X[y_kmeans == 1, 1], s = 100, c = 'orange',

label = 'Iris-versicolour')

plt.scatter(X[y_kmeans == 2, 0], X[y_kmeans == 2, 1], s = 100, c = 'green',

label = 'Iris-virginica')

plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:,1], s =

100, c = 'red', label =

'Centroids')

plt.legend()

plt.show()

Part B

1. Write a program to normalize the iris dataset using standardization.

Program Code:

fromsklearn import datasets

import pandas as pd

fromsklearn.preprocessing import StandardScaler, MinMaxScaler

import warnings

iris = datasets.load_iris()

data = pd.DataFrame(data=iris.data, columns=iris.feature_names)

print(data)

print('Average of Feature')

print(data.mean())

print('\nFeature Variance')

print(data.var())

scaler = StandardScaler()

scaler.fit(data)

iris_scaled_std = scaler.transform(data)

iris_df_std_scaled = pd.DataFrame(data=iris_scaled_std,
columns=iris.feature_names)

print('Standardized Feature Average')

print(iris_df_std_scaled.mean())

print('\nStandardized Feature Variance')

print(iris_df_std_scaled.var())

scaler = MinMaxScaler()

scaler.fit(data)

iris_scaled_minmax = scaler.transform(data)

iris_df_minmax_scaled = pd.DataFrame(data=iris_scaled_minmax,
columns=iris.feature_names)

print('MinMax Scaled Feature Average')

print(iris_df_minmax_scaled.mean())

print('\nMinMax Scaled Feature Variance')

print(iris_df_minmax_scaled.var())

print('\nMinMax Scaled Min Value')

print(iris_df_minmax_scaled.min())

print('\nMinMax Scaled Max Value')

print(iris_df_minmax_scaled.max())

2. Write a program to impute the missing values and perform discrete

transformation on the iris

dataset.

Program Code:

fromsklearn import datasets

importnumpy as np

import pandas as pd
fromsklearn.preprocessing import KBinsDiscretizer

fromsklearn.impute import SimpleImputer

import warnings

iris = datasets.load_iris()

data = pd.DataFrame(data=iris.data, columns=iris.feature_names)

print(data)

imputer = SimpleImputer(missing_values=np.nan, strategy='mean')

print(imputer)

imputer = imputer.fit(data)

imputed_dataset = imputer.transform(data)

print(imputed_dataset)

iris_quantile_transform = KBinsDiscretizer(n_bins=10, encode='ordinal',

strategy='quantile')

quantile_transformed_data = iris_quantile_transform.fit_transform(data)

print(pd.DataFrame(quantile_transformed_data))

iris_uniform_transform = KBinsDiscretizer(n_bins=10, encode='ordinal',

strategy='uniform')

uniform_transformed_data = iris_uniform_transform.fit_transform(data)

print(pd.DataFrame(uniform_transformed_data))

3. Write a program to apply principal component analysis on the iris dataset.

Program Code:

fromsklearn import datasets, decomposition

importnumpy as np

import pandas as pd

importmatplotlib.pyplot as plt

import mpl_toolkits.mplot3d

iris = datasets.load_iris()

data = pd.DataFrame(data=iris.data, columns=iris.feature_names)

X = data

y = iris.target

print(data)

fig = plt.figure(1, figsize=(4, 3))

plt.clf()
ax = fig.add_subplot(111, projection="3d", elev=48, azim=134)

ax.set_position([0, 0, 0.95, 1])

plt.cla()

pca = decomposition.PCA(n_components=3)

pca.fit(X)

X = pca.transform(X)

print(X)

for name, label in [("Setosa", 0), ("Versicolour", 1), ("Virginica", 2)]:

ax.text3D(

X[y == label, 0].mean(),

X[y == label, 1].mean() + 1.5,

X[y == label, 2].mean(),

name,

horizontalalignment="center",

bbox=dict(alpha=0.5, edgecolor="w", facecolor="w"), )

y = np.choose(y, [1, 2, 0]).astype(float)

ax.scatter(X[:, 0], X[:, 1], X[:, 2], c=y, cmap=plt.cm.nipy_spectral,

edgecolor="k")
ax.xaxis.set_ticklabels([])

ax.yaxis.set_ticklabels([])

ax.zaxis.set_ticklabels([])

plt.show()

4. Write a program to apply support vector machine classifier on the iris

dataset and generate a

confusion matrix of the classifier.

Ans: from sklearn import datasets, decomposition

import pandas as pd

fromsklearn.model_selection import train_test_split

fromsklearn.svm import SVC

fromsklearn.metrics import confusion_matrix

fromsklearn.model_selection import cross_val_score

iris = datasets.load_iris()

X = iris.data
y = iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,

random_state=42)

SVM_classifier = SVC(kernel='linear', random_state=0)

SVM_classifier.fit(X_train, y_train)

accuracy = cross_val_score(estimator=SVM_classifier, X=X_train, y=y_train,

cv=10)

print("Accuracy: {:.2f} %".format(accuracy.mean()*100))

y_pred = SVM_classifier.predict(X_test)

SVM_cm = confusion_matrix(y_test, y_pred)

print("The confusion matrix is:")

print(SVM_cm)

5.Develop Decision Tree Classification model for a given dataset and use it to
classify a

new sample.

from sklearn import datasets

from sklearn.model_selection import train_test_split

from sklearn.tree import DecisionTreeClassifier

from sklearn.metrics import accuracy_score, confusion_matrix,

classification_report

iris = datasets.load_iris()

X = iris.data
y = iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,
random_state=42)

dt_classifier = DecisionTreeClassifier(random_state=42)

dt_classifier.fit(X_train, y_train)

y_pred = dt_classifier.predict(X_test)

accuracy = accuracy_score(y_test, y_pred)

conf_matrix = confusion_matrix(y_test, y_pred)

class_report = classification_report(y_test, y_pred)

print(f"Accuracy: {accuracy * 100:.2f}%")

print("\nConfusion Matrix:")

print(conf_matrix)

print("\nClassification Report:")

print(class_report)
new_sample = [[5.1, 3.5, 1.4, 0.2]] # Example: a new Iris sample (sepal_length,
sepal_width,

petal_length, petal_width)

new_prediction = dt_classifier.predict(new_sample)

print(f"\nPredicted class for the new sample: {iris.target_names[new_prediction]

[0]}")

6.Build KNN Classification model for a given dataset.

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, confusion_matrix,
classification_report
iris = datasets.load_iris()
X = iris.data
y = iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,
random_state=42)
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)
y_pred = knn.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)

conf_matrix = confusion_matrix(y_test, y_pred)

class_report = classification_report(y_test, y_pred)

print(f"Accuracy: {accuracy * 100:.2f}%")

print("\nConfusion Matrix:")

print(conf_matrix)

print("\nClassification Report:")

print(class_report)

new_sample = [[5.1, 3.5, 1.4, 0.2]]

new_prediction = knn.predict(new_sample)

print(f"\nPredicted class for the new sample: {iris.target_names[new_prediction]

[0]}")

Machine Learning Algorithms Guide
No ratings yet
Machine Learning Algorithms Guide
34 pages
Assignment 4
No ratings yet
Assignment 4
9 pages
To Study About Numpy, Pandas and Matplotlib Libraries in Python
No ratings yet
To Study About Numpy, Pandas and Matplotlib Libraries in Python
21 pages
Exercise and Experiment 3
No ratings yet
Exercise and Experiment 3
14 pages
ML
No ratings yet
ML
11 pages
Minor Assignment 4
No ratings yet
Minor Assignment 4
17 pages
ML Yogesh
No ratings yet
ML Yogesh
23 pages
Machine Learning Programs
No ratings yet
Machine Learning Programs
10 pages
Strangers
No ratings yet
Strangers
8 pages
Machine Learning Practical File MRIEM
No ratings yet
Machine Learning Practical File MRIEM
49 pages
Stats Lab (10-12)
No ratings yet
Stats Lab (10-12)
4 pages
Batch1 Ds
No ratings yet
Batch1 Ds
15 pages
Experiment 3 PCA On Iris Dataset
No ratings yet
Experiment 3 PCA On Iris Dataset
2 pages
Mlalllabprgs
No ratings yet
Mlalllabprgs
17 pages
Lab Extern L
No ratings yet
Lab Extern L
8 pages
MLLab Manual
No ratings yet
MLLab Manual
24 pages
ML Spy Programs
No ratings yet
ML Spy Programs
16 pages
Data Science Practical
No ratings yet
Data Science Practical
22 pages
1
No ratings yet
1
13 pages
Assignment 3 Solution
No ratings yet
Assignment 3 Solution
7 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
18 pages
Artificial Intelligence Advance Practical
No ratings yet
Artificial Intelligence Advance Practical
12 pages
ML Short Code - Under Updating
No ratings yet
ML Short Code - Under Updating
4 pages
M PDF
No ratings yet
M PDF
13 pages
K Means
No ratings yet
K Means
3 pages
Final ML Programs 075005
No ratings yet
Final ML Programs 075005
15 pages
AIML Record 56
No ratings yet
AIML Record 56
28 pages
ML Programs
No ratings yet
ML Programs
14 pages
Titanic Shuffle Analysis in ML Lab
No ratings yet
Titanic Shuffle Analysis in ML Lab
24 pages
AAM PR QB
No ratings yet
AAM PR QB
13 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
9 pages
Week6 - Colab
No ratings yet
Week6 - Colab
3 pages
ML Lab
No ratings yet
ML Lab
14 pages
Python ML Lab for Beginners
No ratings yet
Python ML Lab for Beginners
10 pages
ML Minimized Programs
No ratings yet
ML Minimized Programs
9 pages
SOLUTION ONLY CODE DWDM - Lab - All
No ratings yet
SOLUTION ONLY CODE DWDM - Lab - All
8 pages
ML Manual
No ratings yet
ML Manual
30 pages
ML Lab File
No ratings yet
ML Lab File
43 pages
BCSL606 Machine Learning Lab
No ratings yet
BCSL606 Machine Learning Lab
33 pages
Python Data Analysis with Iris Dataset
No ratings yet
Python Data Analysis with Iris Dataset
7 pages
ML Project Assigment
No ratings yet
ML Project Assigment
32 pages
Unit1 ML Programs
No ratings yet
Unit1 ML Programs
5 pages
ML Labmanual
No ratings yet
ML Labmanual
33 pages
Big Data Practical
No ratings yet
Big Data Practical
20 pages
ML II Lab
No ratings yet
ML II Lab
5 pages
ML Journal External
No ratings yet
ML Journal External
14 pages
Mlpy 2
No ratings yet
Mlpy 2
18 pages
Da Program
No ratings yet
Da Program
18 pages
ML 3
No ratings yet
ML 3
24 pages
ML Lab Manual for CSE Students
No ratings yet
ML Lab Manual for CSE Students
32 pages
Machine Learning Lab
No ratings yet
Machine Learning Lab
33 pages
ML Short
No ratings yet
ML Short
2 pages
ML Practical Solutions
No ratings yet
ML Practical Solutions
15 pages
Program
No ratings yet
Program
1 page
ML Lab Manual
No ratings yet
ML Lab Manual
6 pages
ML Lab Mannual1
No ratings yet
ML Lab Mannual1
37 pages
Data Science Libraries
No ratings yet
Data Science Libraries
4 pages
Machine Learning Lab Dlihebca6sem
100% (1)
Machine Learning Lab Dlihebca6sem
25 pages
1 Assignment 3 - Classification
No ratings yet
1 Assignment 3 - Classification
16 pages
Team - 2 Term Glossary
No ratings yet
Team - 2 Term Glossary
5 pages
Evaluation Metrics For Your Regression Model - Analytics Vidhya
No ratings yet
Evaluation Metrics For Your Regression Model - Analytics Vidhya
6 pages
MSE-2024-25 - ML-Question Bank
No ratings yet
MSE-2024-25 - ML-Question Bank
2 pages
Image Classification Handson-Image - Test
No ratings yet
Image Classification Handson-Image - Test
5 pages
CP4252 ML QB
No ratings yet
CP4252 ML QB
9 pages
Credit Card Fraud Detection via ML & DL
No ratings yet
Credit Card Fraud Detection via ML & DL
16 pages
Dimensionality Reduction Techniques Explained
No ratings yet
Dimensionality Reduction Techniques Explained
51 pages
A Classification Study For Turkish Folk Music Makam Recognition Using Machine Learning With Data Augmentation Techniques
No ratings yet
A Classification Study For Turkish Folk Music Makam Recognition Using Machine Learning With Data Augmentation Techniques
19 pages
55 Machine Learning Engineer Questions To Find The Perfect Candidate
100% (1)
55 Machine Learning Engineer Questions To Find The Perfect Candidate
14 pages
RPubs Lab 06 K Means Clustering With R
No ratings yet
RPubs Lab 06 K Means Clustering With R
22 pages
Aspiring Data Analyst Profile
No ratings yet
Aspiring Data Analyst Profile
1 page
AI - Manoj CW3 DISSERTATION
No ratings yet
AI - Manoj CW3 DISSERTATION
76 pages
Scikit Learn Docs PDF
No ratings yet
Scikit Learn Docs PDF
2,663 pages
Huawei ICT Academy Course Catalog 2023
No ratings yet
Huawei ICT Academy Course Catalog 2023
27 pages
Deep Learning of Path-Based Tree Classifiers For Large-Scale Plant Species
No ratings yet
Deep Learning of Path-Based Tree Classifiers For Large-Scale Plant Species
6 pages
Data Driven Retail Price Optimization Using XGBoost and Predictive Modeling
No ratings yet
Data Driven Retail Price Optimization Using XGBoost and Predictive Modeling
6 pages
2023-PRedItOR Text Guided Image Editing With Diffusion Prior
No ratings yet
2023-PRedItOR Text Guided Image Editing With Diffusion Prior
26 pages
Framing Questions for Data Analytics
No ratings yet
Framing Questions for Data Analytics
59 pages
Finalll - Ipynb - Colab
No ratings yet
Finalll - Ipynb - Colab
11 pages
ICIRIST EBook 31012024
No ratings yet
ICIRIST EBook 31012024
476 pages
Practical English M1!25!26
No ratings yet
Practical English M1!25!26
2 pages
MONEY
No ratings yet
MONEY
2 pages
Blockchain for AI Data Integrity in Cybersecurity
No ratings yet
Blockchain for AI Data Integrity in Cybersecurity
13 pages
Fusing Global and Local Features For Generalized AI-synthesized Image Detection
No ratings yet
Fusing Global and Local Features For Generalized AI-synthesized Image Detection
5 pages
Word Sense Disambiguation Survey
No ratings yet
Word Sense Disambiguation Survey
22 pages
Technology's Impact on Audit Efficiency
No ratings yet
Technology's Impact on Audit Efficiency
103 pages
Expert Help for Computer Science Dissertations
100% (2)
Expert Help for Computer Science Dissertations
6 pages
#Data From Kaggle: June 1, 2024
No ratings yet
#Data From Kaggle: June 1, 2024
10 pages
Artificial Intelligence - Past Papers Solution
100% (1)
Artificial Intelligence - Past Papers Solution
17 pages
Big Data Analytics Course Guide
No ratings yet
Big Data Analytics Course Guide
78 pages