0% found this document useful (0 votes)

10 views15 pages

Final ML Programs 075005

The document contains several Python programs that demonstrate various machine learning techniques using libraries such as scikit-learn, pandas, and matplotlib. Key programs include KMeans clustering on breast cancer data, Gaussian Naive Bayes classification on olive faces, decision tree classification, linear regression on California housing data, and local weighted regression. Additionally, it includes data visualization techniques such as scatter plots and histograms to analyze datasets.

Uploaded by

debugthebug336

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

10 views15 pages

Final ML Programs 075005

Uploaded by

debugthebug336

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 15

Program 10

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

from sklearn.datasets import load_breast_cancer

from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler
from sklearn.decomposi on import PCA
from sklearn.metrics import classiﬁca on_report,confusion_matrix,accuracy_score

data = load_breast_cancer()
X = data.data

Y = data.target

scaler = StandardScaler()
X_scaler = scaler.ﬁt_transform(X)

kmeans = KMeans(n_clusters=2,random_state=42)
y_kmeans = kmeans.ﬁt_predict(X_scaler)

print("Accuracy SCore: ")

print(accuracy_score(Y,y_kmeans))
print("Classiﬁca on Report...")
print(classiﬁca on_report(Y,y_kmeans))
print("Confusion Mateisx...")
print(confusion_matrix(Y,y_kmeans))

pca = PCA(n_components=2)
x_pca = pca.ﬁt_transform(X_scaler)

df = pd.DataFrame(x_pca,columns=['PC1','PC2'])
df['cluster']= y_kmeans
df['True Labels'] = Y

plt.ﬁgure(ﬁgsize=(8,6))
sns.sca erplot(data=df,
x='PC1',y='PC2',hue='cluster',s=100,pale e='Set1',alpha=0.7,edgecolor='black')
plt. tle("Clustering on K-Means Cluster Algorithm")

plt.xlabel("Principal Component 1")

plt.ylabel("Principal Component 2")
plt.show()

plt.ﬁgure(ﬁgsize=(8,6))
sns.sca erplot(data=df, x='PC1',y='PC2',hue='True
Labels',s=100,pale e='coolwarm',alpha=0.7,edgecolor='black')
plt. tle("Clustering on True Labels")
plt.xlabel("Principal Component 1")
plt.ylabel("Principal Component 2")

plt.show()

plt.ﬁgure(ﬁgsize=(8,6))
sns.sca erplot(data=df,
x='PC1',y='PC2',hue='cluster',s=100,pale e='Set1',alpha=0.9,edgecolor='black')
centers = pca.transform(kmeans.cluster_centers_)
plt.sca er(x=centers[:,0],y=centers[:,1],color='red',marker='X',s=200,label='centroids')
plt. tle("Clustering on Kmeans along with Centroids")
plt.xlabel("Principal Component 1")

plt.ylabel("Principal Component 2")

plt. tle(label='Centroid')
plt.legend( tle='Cluster')
plt.show()

Program 9
import numpy as np

from sklearn.datasets import fetch_olive _faces

from sklearn.naive_bayes import GaussianNB
from sklearn.model_selec on import train_test_split
from sklearn.metrics import accuracy_score, confusion_matrix
from sklearn.model_selec on import cross_val_score

data = fetch_olive _faces(shuﬄe=True,random_state=42)

X = data.data
Y = data.target

X_train,X_test,Y_train,Y_test = train_test_split(X,Y,test_size=0.3,random_state=42)

gnb = GaussianNB()
gnb.ﬁt(X_train,Y_train)

Y_pred = gnb.predict(X_test)
print(accuracy_score(Y_test,Y_pred))

print(confusion_matrix(Y_test,Y_pred))

print(classiﬁca on_report(Y_test,Y_pred))

cross_val = cross_val_score(gnb,X,Y,cv=5,scoring='accuracy')
print(cross_val.mean())

ﬁg, axes = plt.subplots(3,5,ﬁgsize=(12,6))

for ax, image, predic on, True_label in zip(axes.ravel(),X_train,Y_pred,Y_test):
ax.imshow(image.reshape(64,64),cmap=plt.cm.gray)
ax.set_ tle(f"True : {True_label}, Pred : {predic on}")
ax.axis('oﬀ')
plt.show()

Program 8
import numpy as np

from sklearn.datasets import load_breast_cancer

from sklearn.model_selec on import train_test_split
from sklearn.tree import DecisionTreeClassiﬁer
from sklearn.metrics import accuracy_score
from sklearn import tree

data = load_breast_cancer()
X = data.data
Y = data.target

X_train, X_test, Y_train, Y_test = train_test_split(X,Y,test_size=0.2,random_state=42)

clf = DecisionTreeClassiﬁer()
clf.ﬁt(X_train,Y_train)

Y_pred = clf.predict(X_test)

print(accuracy_score(Y_test,Y_pred) * 100)

new_sample = np.array([X_test[10]])
predict = clf.predict(new_sample)

if predict == 1:
predic on_class='Bengin'
elif predict == 0:
predic on_class='Malignant'

print("The Predicted Class Is ......",predic on_class)

plt.figure(figsize=(30,50))
tree.plot_tree(clf,feature_names = data.feature_names, class_names =
data.target_names,filled=True)
plt.show()

Progarm 7
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

from sklearn.datasets import fetch_california_housing

from sklearn.model_selec on import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import StandardScaler, PolynomialFeatures
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.pipeline import make_pipeline

def liner_reg():
data = fetch_california_housing(as_frame=True)
X = data.data[['AveRooms']]
Y = data.target

X_train, X_test, Y_train, Y_test = train_test_split(X,Y,test_size=0.2,random_state=42)

model = LinearRegression()
model.ﬁt(X_train,Y_train)

Y_predict = model.predict(X_test)

print("Mean Error")
print(mean_squared_error(Y_test,Y_predict))

print("R2 Error")
print(r2_score(Y_test,Y_predict))

plt.ﬁgure(ﬁgsize=(8,6))
plt.sca er(X_test,Y_test,color='blue')
plt.plot(X_test,Y_predict,color='red')
plt.show()

def poly():

url = 'h ps://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-

mpg.data'
names = ['mpg','cylinders','displacement','horse
power','weight','accelera on','model','origin','car name']

data = pd.read_csv(
url, sep='\s+',names=names,na_values='?')
data=data.dropna()
X = data['displacement'].values.reshape(-1,1)
Y = data['mpg'].values

X_train, X_test, Y_train, Y_test = train_test_split(X,Y,test_size=0.2,random_state=42)

model =
make_pipeline(PolynomialFeatures(degree=2),StandardScaler(),LinearRegression())
model.ﬁt(X_train,Y_train)

Y_predict = model.predict(X_test)

print("Mean Error")
print(mean_squared_error(Y_test,Y_predict))

print("R2 Error")
print(r2_score(Y_test,Y_predict))
plt.ﬁgure(ﬁgsize=(8,6))
plt.sca er(X_test,Y_test,color='blue')

plt.plot(X_test,Y_predict,color='red')
plt.show()

if __name__=='__main__':
liner_reg()
poly()

program 6
import numpy as np
import matplotlib.pyplot as plt

def gaussian_kernel(x, xi, tau):

return np.exp(-(np.sum(x-xi)**2)/(2*tau**2))

def local_weight_reg(x, X, y, tau):

m = X.shape[0]

weights = np.array([gaussian_kernel(x,X[i],tau) for i in range(m)])

W = np.diag(weights)
X_trans_W = X.T @ W

theta = np.linalg.inv(X_trans_W @ X) @ X_trans_W @ y

return x @ theta
np.random.seed(42)

X = np.linspace(0,2*np.pi,100)
y = np.sin(X) + 0.1 *(np.random.randn(100))

X_bias = np.c_[np.ones(X.shape),X]

X_test = np.linspace(0,2*np.pi,200)
X_bias_test = np.c_[np.ones(X_test.shape),X_test]
tau =0.5

y_pred = np.array([local_weight_reg(x ,X_bias ,y ,tau) for x in X_bias_test])

plt.ﬁgure(ﬁgsize=(8,6))
plt.sca er(X,y,color='red',label='tarin')
plt.plot(X_test,y_pred,color='blue',label='test')
plt.grid(alpha=0.2)
plt.legend()
plt.show()

Program 5
import numpy as np

from sklearn.neighbors import KNeighborsClassiﬁer

import matplotlib.pyplot as plt

data = np.random.rand(100)

labels = ['class1' if x<=0.5 else 'class2' for x in data[:50] ]

train_data = data[:50].reshape(-1,1)

train_labels = labels

test_data = data[50:].reshape(-1,1)

k_values = [1,2,3,4,5,20,30]

for k in k_values:

knn = KNeighborsClassiﬁer(n_neighbors=k)
knn.ﬁt(train_data,train_labels)

pred = knn.predict(test_data)

for i, pr in enumerate(pred,start=51):
print(f"Point x{i} ={test_data[i-51][0]:.2f} is class {pr}")

class1 = [test_data[i][0] for i in range(len(pred)) if pred[i] == 'class1']

class2 = [test_data[i][0] for i in range(len(pred)) if pred[i] == 'class2']

plt.ﬁgure(ﬁgsize=(8,6))

plt.sca er(train_data,[0]*len(train_data),c=['blue' if label=='class1' else 'red' for label in

train_labels],marker='o',label='training')
plt.sca er(class1,[1]*len(class1),c='blue',marker='X',label='clas1 (test)')
plt.sca er(class2,[1]*len(class2),c='red',marker='X',label='clas2 (test)')
plt. tle(f'k={k}')
plt.legend()
plt.show()
Program 4

import pandas as pd

def find_s_algo(filepath):
df = pd.read_csv(filepath)
print("Training Data")
print(df)

a ributes = df.columns[:-1]
class_label = df.columns[-1]

hypothesis = ['?' for _ in a ributes]

for index,row in df.iterrows():

if row[class_label] == 'Yes':
if '?' in hypothesis:
hypothesis = list(row[:-1])
else:
for i in range(len(hypothesis)):
if hypothesis[i] != row[i]:
hypothesis[i] = '?'
print(f' Step {index} Hypothessi : {hypothesis}')
return hypothesis

filepath= r"C:\Users\priya\Downloads\enjoysport_training_data.csv"
a= find_s_algo(filepath)
print("Finsl")
print(a)

Training Data
Sky Temp Humidity Wind Water Forecast EnjoySport
0 Sunny Warm Normal Strong Warm Same Yes
1 Sunny Warm High Strong Warm Same Yes
2 Rainy Cold High Strong Warm Change No
3 Sunny Warm High Strong Cool Change Yes
4 Sunny Warm Normal Strong Warm Same Yes
Step 0 Hypothessi : ['Sunny', 'Warm', 'Normal', 'Strong', 'Warm', 'Same']
Step 1 Hypothessi : ['Sunny', 'Warm', '?', 'Strong', 'Warm', 'Same']
Step 3 Hypothessi : ['Sunny', 'Warm', 'High', 'Strong', 'Cool', 'Change']
Step 4 Hypothessi : ['Sunny', 'Warm', '?', 'Strong', '?', '?']
Finsl
['Sunny', 'Warm', '?', 'Strong', '?', '?']

Program 1
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_california_housing

data = fetch_california_housing(as_frame=True)
housing_df = data.frame
housing_df=housing_df.dropna()

numerical_features = housing_df.select_dtypes(include=[np.number]).columns
plt.ﬁgure(ﬁgsize=(15,10))
for i,features in enumerate(numerical_features):

plt.subplot(3,3,i+1)
sns.histplot(housing_df[features],bins=30,kde=True,color='blue')
plt. tle('Distribu on of Features of California Hosusing')
plt. ght_layout()
plt.show()

plt.ﬁgure(ﬁgsize=(15,10))
for i,features in enumerate(numerical_features):
plt.subplot(3,3,i+1)
sns.boxplot(housing_df[features],color='orange')
plt. tle("box plot")
plt. ght_layout()
plt.show()

outliers_sum = {}
for feature in numerical_features:
Q1 = housing_df[feature].quan le(0.25)
Q3 = housing_df[feature].quan le(0.75)
IQR = Q3 - Q1
lower_bound = Q1-1.5*IQR
upper_bound = Q3+1.5*IQR
outlier = housing_df[(housing_df[feature] < lower_bound) | (housing_df[feature] >
upper_bound) ]
outliers_sum[feature] = len(outlier)

print(f" Feature {feature} is {len(outlier)}...")

Program 2
import numpy as np

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_california_housing

data = fetch_california_housing(as_frame=True)
housing_df = data.frame

comat = housing_df.corr()
plt.ﬁgure(ﬁgsize=(8,6))

sns.heatmap(comat,annot=True,cmap='coolwarm')
plt.show()

sns.pairplot(housing_df)
plt.show()

Program 3
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.decomposi on import PCA
from sklearn.datasets import load_iris

iris = load_iris()
data = iris.data
labels = iris.target
label_names = iris.target_names

pca = PCA(n_components=2)
x_pca = pca.ﬁt_transform(data)

df = pd.DataFrame(x_pca, columns= ['PC1','PC2'])

df['Labels'] = labels

colors = ['r','g','b']

plt.ﬁgure(ﬁgsize=(8,6))
for i, label in enumerate(np.unique(labels)):

plt.sca er(df[df['Labels']==label]['PC1'],df[df['Labels']==label]['PC2'],c=colors[i],label=labe
l_names[label])
plt.xlabel('PC1')
plt.ylabel('PC2')
plt.legend()
plt.show()

ML Journal External
No ratings yet
ML Journal External
14 pages
ML
No ratings yet
ML
11 pages
ML
No ratings yet
ML
5 pages
ML Lab 4,5,6,7,8,9,10
No ratings yet
ML Lab 4,5,6,7,8,9,10
7 pages
ML Minimized Programs
No ratings yet
ML Minimized Programs
9 pages
ML Spy Programs
No ratings yet
ML Spy Programs
16 pages
ML Programs
No ratings yet
ML Programs
14 pages
ML Lab Manual
No ratings yet
ML Lab Manual
12 pages
ML Experiment WithDataset
No ratings yet
ML Experiment WithDataset
23 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
9 pages
All in One
No ratings yet
All in One
13 pages
1
No ratings yet
1
13 pages
Machine Learning Practical File MRIEM
No ratings yet
Machine Learning Practical File MRIEM
49 pages
ML Lab Experiment Shortened With Same Output
No ratings yet
ML Lab Experiment Shortened With Same Output
6 pages
ML Manual
No ratings yet
ML Manual
9 pages
Machine Learning Programs
No ratings yet
Machine Learning Programs
10 pages
AI&ML
No ratings yet
AI&ML
9 pages
ML Lab
No ratings yet
ML Lab
5 pages
ML Manual
No ratings yet
ML Manual
30 pages
ML1408-Machine Learning Lab Programs
No ratings yet
ML1408-Machine Learning Lab Programs
17 pages
ML Short Code - Under Updating
No ratings yet
ML Short Code - Under Updating
4 pages
MLLab Manual
No ratings yet
MLLab Manual
24 pages
ML5 Implementation
No ratings yet
ML5 Implementation
32 pages
Aml Lab
No ratings yet
Aml Lab
6 pages
Mlalllabprgs
No ratings yet
Mlalllabprgs
17 pages
Aiml Lab
No ratings yet
Aiml Lab
14 pages
Lab Extern L
No ratings yet
Lab Extern L
8 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
26 pages
Titanic Data Analysis with Python
No ratings yet
Titanic Data Analysis with Python
20 pages
Fibulae Neighbors Analysis
No ratings yet
Fibulae Neighbors Analysis
7 pages
Machine Learning Algorithms Guide
No ratings yet
Machine Learning Algorithms Guide
34 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
18 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
CP4252 Lab Manual
No ratings yet
CP4252 Lab Manual
13 pages
Screenshot 2023-12-07 at 11.07.49 AM
No ratings yet
Screenshot 2023-12-07 at 11.07.49 AM
14 pages
Aiml Practical
No ratings yet
Aiml Practical
17 pages
Programs Lab Bca
No ratings yet
Programs Lab Bca
16 pages
Python ML Algorithms Guide
No ratings yet
Python ML Algorithms Guide
7 pages
ML Lab Works
No ratings yet
ML Lab Works
14 pages
ML II Lab
No ratings yet
ML II Lab
5 pages
Titanic Shuffle Analysis in ML Lab
No ratings yet
Titanic Shuffle Analysis in ML Lab
24 pages
1 2 3 4 6 7 8 9 10 Merged
No ratings yet
1 2 3 4 6 7 8 9 10 Merged
21 pages
V
No ratings yet
V
8 pages
Unit2 ML Programs
No ratings yet
Unit2 ML Programs
7 pages
Linearregression SVM
No ratings yet
Linearregression SVM
3 pages
ML Lab
No ratings yet
ML Lab
10 pages
AIML Programs
No ratings yet
AIML Programs
22 pages
Shobit Sharma (2124399) ML Lab File PDF
No ratings yet
Shobit Sharma (2124399) ML Lab File PDF
19 pages
ML Functions
No ratings yet
ML Functions
12 pages
Big Data Practical
No ratings yet
Big Data Practical
20 pages
Aam Codes
No ratings yet
Aam Codes
8 pages
ML Regression & Classification Guide
100% (1)
ML Regression & Classification Guide
45 pages
Machine Learning Lab
No ratings yet
Machine Learning Lab
20 pages
ML NEW Final Format
No ratings yet
ML NEW Final Format
37 pages
EX - NO:3: Algorithm
No ratings yet
EX - NO:3: Algorithm
11 pages
Mnbnmnbnnmbbhhuyrgh
No ratings yet
Mnbnmnbnnmbbhhuyrgh
3 pages
Assignment #1: K Nearest Neighbor Classifier: Name: Srikanth Mujjiga (Roll No: 2015-50-831
No ratings yet
Assignment #1: K Nearest Neighbor Classifier: Name: Srikanth Mujjiga (Roll No: 2015-50-831
8 pages
ML RECORD EX 5,6,7,8,9 (Without Border)
No ratings yet
ML RECORD EX 5,6,7,8,9 (Without Border)
13 pages
Electrochemical Sensors For The Pharmaceuticals, Surfactants and
No ratings yet
Electrochemical Sensors For The Pharmaceuticals, Surfactants and
13 pages
Lungs As Purification System-1
No ratings yet
Lungs As Purification System-1
18 pages
Govt. S.K.S.J. Technological Institute Bangalore
No ratings yet
Govt. S.K.S.J. Technological Institute Bangalore
2 pages
RM&IPR
No ratings yet
RM&IPR
2 pages
E Waste Management
No ratings yet
E Waste Management
21 pages
Flange Design & Analysis (Final Project, Simulation Based Design)
No ratings yet
Flange Design & Analysis (Final Project, Simulation Based Design)
23 pages
Yield Lines 2
100% (1)
Yield Lines 2
24 pages
Numerical Error Analysis Guide
100% (1)
Numerical Error Analysis Guide
8 pages
Atprulebooktr PDF
0% (1)
Atprulebooktr PDF
1,170 pages
Formation Evaluation & Petrophysics Guide
100% (3)
Formation Evaluation & Petrophysics Guide
273 pages
Mathematical Studies Paper 2 TZ1 SL
No ratings yet
Mathematical Studies Paper 2 TZ1 SL
8 pages
Organizational Culture and Family Business
No ratings yet
Organizational Culture and Family Business
9 pages
Latin Squares Design Has Following Features
No ratings yet
Latin Squares Design Has Following Features
9 pages
Equilibrium of Force System: Source: Engineering Mechanics by Ferdinand L Singer
No ratings yet
Equilibrium of Force System: Source: Engineering Mechanics by Ferdinand L Singer
7 pages
CASIO FX-82ZA PLUS & FX-991ZA PLUS - LCM, HCF & Factorisation
No ratings yet
CASIO FX-82ZA PLUS & FX-991ZA PLUS - LCM, HCF & Factorisation
9 pages
Purcell 10.2: Solutions To Problem Set 12
No ratings yet
Purcell 10.2: Solutions To Problem Set 12
5 pages
2007 Diederichs
100% (1)
2007 Diederichs
35 pages
8.1: Drawings: Lesson 1: Introduction To Drawing Views
No ratings yet
8.1: Drawings: Lesson 1: Introduction To Drawing Views
31 pages
Units and Measurements
No ratings yet
Units and Measurements
14 pages
Problem 2.78: 50 4. Determine V
No ratings yet
Problem 2.78: 50 4. Determine V
1 page
Chapter 2: Boolean Algebra & Logic Gates Solutions of Problems: Problem: 2-1
100% (1)
Chapter 2: Boolean Algebra & Logic Gates Solutions of Problems: Problem: 2-1
7 pages
(2015) The Production Routing Problem A Review of Formulations and Solution Algorithms PDF
No ratings yet
(2015) The Production Routing Problem A Review of Formulations and Solution Algorithms PDF
12 pages
ECE Numerical Methods Test
No ratings yet
ECE Numerical Methods Test
4 pages
Decision Making Under Uncertainty
No ratings yet
Decision Making Under Uncertainty
12 pages
Triple Integrals: Evaluation & Applications
No ratings yet
Triple Integrals: Evaluation & Applications
2 pages
Inp013
No ratings yet
Inp013
12 pages
RSHS TOS Grade 7
No ratings yet
RSHS TOS Grade 7
1 page
Notes
No ratings yet
Notes
5 pages
Fourth Quarterly Math Test for Grade 5
No ratings yet
Fourth Quarterly Math Test for Grade 5
10 pages
DC Motor Control Trainer Manual
No ratings yet
DC Motor Control Trainer Manual
47 pages
Class 9th - Kinematics PDF
No ratings yet
Class 9th - Kinematics PDF
1 page
Likelihood-Ratio Test
No ratings yet
Likelihood-Ratio Test
5 pages
Aggregate Demand I: Building The - Model: IS LM
No ratings yet
Aggregate Demand I: Building The - Model: IS LM
30 pages
Googles Sketchup 8
100% (2)
Googles Sketchup 8
26 pages
Numbers The Time Colours Days Months Personal Information
No ratings yet
Numbers The Time Colours Days Months Personal Information
12 pages