0% found this document useful (0 votes)

62 views7 pages

Machine Learning Assignment: Regression & Clustering

The document contains assignments submitted by a student for their Machine Learning course. It includes: 1) A regression model to predict Boston housing prices using scikit-learn with linear regression, achieving an RMSE of $X and R2 score of $Y on test data. 2) A K-means clustering model to classify diabetes patients using patient data on glucose, insulin, and BMI, achieving $Z accuracy on test data, with clusters visualized on a 2D plot.

Uploaded by

Kishan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

62 views7 pages

Machine Learning Assignment: Regression & Clustering

Uploaded by

Kishan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

Department of Electronics and Telecommunication Engineering

Ramaiah Institute of Technology

M.S.R. Nagar, Bangalore-54

MACHINE LEARNING (ETE631)

ASSIGNMENT 3

Name: R Jeevan Kumar

USN: 1MS19ET042

Submitted to
Dr. Shobha K R
Associate
Professor Dept of
ETE

2021-2022
All code uploaded to [Link]

1. Develop a model using regression which can predict the housing price in Boston using
python/ scikit learn

Python code:

# Predict housing prices using Linear Regression

from [Link] import mean_squared_error, r2_score

from sklearn.model_selection import train_test_split

from [Link] import load_boston
from sklearn.linear_model import LinearRegression
import pandas as pd
import numpy as np
import [Link] as plt

print("\n----------- HOUSING PRICE PREDICTOR------------\n")

data = load_boston()

array = data.feature_names
print(array)
array = [Link](array,['medv'])

data, target = [Link], [Link]

Xtrain, Xtest, Ytrain, Ytest = train_test_split(data,target,test_size=0.3)

print([Link],[Link])
print([Link],[Link])

lin_model = LinearRegression()
lin_model.fit(Xtrain,Ytrain)
Ytrain_predict =
lin_model.predict(Xtrain)

rmse =
([Link](mean_squared_error(Ytrain,Ytrain_predict))) r2 =
r2_score(Ytrain,Ytrain_predict)

print("Model performance for training set is :\n ")

print("Root Mean Square Error: ",rmse,"\n")
print("R2 sore is: ",r2,"\n")

Ytest_predict = lin_model.predict(Xtest)

rmse =
([Link](mean_squared_error(Ytest,Ytest_predict))) r2 =
r2_score(Ytest,Ytest_predict)
print("Model performance for testing set is :\n ")
print("Root Mean Square Error: ",rmse,"\n")
print("R2 sore is: ",r2,"\n")

[Link](Ytest,Ytest_predict,c = 'green')
[Link]("Price in $1000's")
[Link]("Predicted value")
[Link]("True value vs predicted value: Linear Regression")
[Link]()

Output:
2. Implement data classification on diabetic data set using k means clustering

Python code:

# classify diabetes using K means clustering

import pandas as pd
import numpy as np
import [Link] as plt
from sklearn import datasets
from [Link] import MinMaxScaler
import sklearn
from [Link] import KMeans
from [Link] import confusion_matrix
import seaborn as sns
from [Link] import KMeans

from sklearn import preprocessing

from [Link] import StandardScaler
from [Link] import MinMaxScaler
from sklearn.model_selection import train_test_split
if name == " main ":

print ("\n ---------- K MEANS CLUSTERING ON DIABETES DATA----------------

\n")
data = pd.read_csv("./[Link]") #importing files using
pandas dataset_new = data
dataset_new[[
"Glucose",
"BloodPressure",
"SkinThickness",
"Insulin", "BMI"]] =
dataset_new[[
"Glucose",
"BloodPressure",
"SkinThickness",
"Insulin",
"BMI"]].replace(0, [Link])

# Replacing NaN with mean values

dataset_new["Glucose"].fillna(dataset_new["Glucose"].mean(), inplace
=
True)
dataset_new["BloodPressure"].fillna(dataset_new["BloodPressure"].mean(),
inplace = True)
dataset_new["SkinThickness"].fillna(dataset_new["SkinThickness"].mean(),
inplace = True)
dataset_new["Insulin"].fillna(dataset_new["Insulin"].mean(), inplace =
True)
dataset_new["BMI"].fillna(dataset_new["BMI"].mean(), inplace = True)

# Feature scaling using MinMaxScaler

sc = MinMaxScaler(feature_range = (0, 1))
dataset_scaled = sc.fit_transform(dataset_new)

data1 = [Link](dataset_scaled)
# Selecting features - [Glucose, Insulin, BMI]
X = [Link][:, [1, 4, 5]].values
Y = [Link][:, 8].values

X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size =

0.20, random_state = 42, stratify = dataset_new['Outcome'] )

# Checking dimensions
print("X_train shape:", X_train.shape)
print("X_test shape:", X_test.shape)
print("Y_train shape:", Y_train.shape)
print("Y_test shape:", Y_test.shape)

KMeans_Clustering = KMeans(n_clusters =2, random_state=0)

KMeans_Clustering.fit(X_train)

print(KMeans_Clustering.cluster_centers_)
#prediction using kmeans and accuracy
kpred = KMeans_Clustering.predict(X_test)
print('Classification report:\n\n',
[Link].classification_report(Y_test,kpred))

outcome_labels = sorted([Link]())
[Link](
confusion_matrix(Y_test, kpred),
annot=True,
xticklabels=outcome_labels,
yticklabels=outcome_labels
)

# Fit again and plot

KMeans_Clustering = KMeans(n_clusters =2, random_state=0)
KMeans_Clustering.fit(X)

[Link]([Link][:, [1]].values,[Link][:, [5]].values,

c=KMeans_Clustering.labels_, cmap='rainbow')

Output:

Wa0003
No ratings yet
Wa0003
16 pages
House Pricing
No ratings yet
House Pricing
15 pages
Lab (Work) Experiment File Priyanka Rajak 0901MC221056
No ratings yet
Lab (Work) Experiment File Priyanka Rajak 0901MC221056
19 pages
ML Full For Print New 1
No ratings yet
ML Full For Print New 1
38 pages
SOLUTION ONLY CODE DWDM - Lab - All
No ratings yet
SOLUTION ONLY CODE DWDM - Lab - All
8 pages
MlLabManualdocx 2024 09 04 22 02 58
No ratings yet
MlLabManualdocx 2024 09 04 22 02 58
19 pages
ML Lab
No ratings yet
ML Lab
10 pages
Aml Lab
No ratings yet
Aml Lab
6 pages
Deber
No ratings yet
Deber
23 pages
Machine Learning Algorithms Guide
No ratings yet
Machine Learning Algorithms Guide
34 pages
DWDM Lab Report
No ratings yet
DWDM Lab Report
26 pages
Machine Learning Practical File MRIEM
No ratings yet
Machine Learning Practical File MRIEM
49 pages
ML
No ratings yet
ML
17 pages
Python ML Algorithms Guide
No ratings yet
Python ML Algorithms Guide
7 pages
KNN - Jupyter Notebook
No ratings yet
KNN - Jupyter Notebook
5 pages
Diabetes Case Study - Jupyter Notebook
100% (1)
Diabetes Case Study - Jupyter Notebook
10 pages
Act
No ratings yet
Act
28 pages
DM Final
No ratings yet
DM Final
79 pages
ML Manual Final
No ratings yet
ML Manual Final
35 pages
1
No ratings yet
1
13 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
Shubham Pract 6 - Merged
No ratings yet
Shubham Pract 6 - Merged
12 pages
ML Manual
No ratings yet
ML Manual
30 pages
Machine Learning Lab Assignments
100% (2)
Machine Learning Lab Assignments
23 pages
Aiml Programs
No ratings yet
Aiml Programs
12 pages
Aiml Practicals
No ratings yet
Aiml Practicals
22 pages
End To End Project Multiple Disease Detection Using ML - Nomidl
No ratings yet
End To End Project Multiple Disease Detection Using ML - Nomidl
24 pages
DA Assignment
No ratings yet
DA Assignment
18 pages
FYMCA IDSLab A6 Submission
No ratings yet
FYMCA IDSLab A6 Submission
9 pages
ML Lab Codes
No ratings yet
ML Lab Codes
14 pages
20BCE7620 AP2021228000397 Experiment-6 Removed
No ratings yet
20BCE7620 AP2021228000397 Experiment-6 Removed
19 pages
CP4252 Machine Learning Laboratory
No ratings yet
CP4252 Machine Learning Laboratory
37 pages
ML Lab Experiment Shortened With Same Output
No ratings yet
ML Lab Experiment Shortened With Same Output
6 pages
Data Mining Lab: Regression & Clustering
No ratings yet
Data Mining Lab: Regression & Clustering
36 pages
Practical Machine Learning Code Examples
No ratings yet
Practical Machine Learning Code Examples
33 pages
ML PDF
No ratings yet
ML PDF
30 pages
House Price Prediction: Project Description
No ratings yet
House Price Prediction: Project Description
11 pages
Unit2 ML Programs
No ratings yet
Unit2 ML Programs
7 pages
MLLab Manual
No ratings yet
MLLab Manual
24 pages
DWDM Lab Report
No ratings yet
DWDM Lab Report
10 pages
2
No ratings yet
2
8 pages
Code and Outputs
No ratings yet
Code and Outputs
25 pages
ML Regression & Classification Guide
100% (1)
ML Regression & Classification Guide
45 pages
Tanu Raman ML Lab File
No ratings yet
Tanu Raman ML Lab File
21 pages
ML Minimized Programs
No ratings yet
ML Minimized Programs
9 pages
Mlalllabprgs
No ratings yet
Mlalllabprgs
17 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
26 pages
Python For Data Science IA 1 Programs
No ratings yet
Python For Data Science IA 1 Programs
14 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
22 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
9 pages
Slip
No ratings yet
Slip
5 pages
Machine Learning Programs
No ratings yet
Machine Learning Programs
10 pages
ML Lab Manual
No ratings yet
ML Lab Manual
12 pages
Lab Manual - MachineLearningLaboratory-DR - Vaishnavi
No ratings yet
Lab Manual - MachineLearningLaboratory-DR - Vaishnavi
71 pages
ML 7
No ratings yet
ML 7
6 pages
Apriori Algorithm
No ratings yet
Apriori Algorithm
12 pages
Assignment 5 - SourceCode - Ipynb - Colab
No ratings yet
Assignment 5 - SourceCode - Ipynb - Colab
4 pages
Vertopal Review: Pizza Brand Analysis
No ratings yet
Vertopal Review: Pizza Brand Analysis
4 pages
Field-Scale Estimation and Comparison of The Sugarcane Yield From Remote Sensing Data: A Machine Learning Approach
No ratings yet
Field-Scale Estimation and Comparison of The Sugarcane Yield From Remote Sensing Data: A Machine Learning Approach
14 pages
Machine Learning for Beginners
No ratings yet
Machine Learning for Beginners
253 pages
ASPRS Positional Accuracy Standards Edition1 Version100 November2014 PDF
No ratings yet
ASPRS Positional Accuracy Standards Edition1 Version100 November2014 PDF
26 pages
CISCON2024PAPAER522
No ratings yet
CISCON2024PAPAER522
8 pages
Fitting The Variogram Model of Nickel Laterite Usi
No ratings yet
Fitting The Variogram Model of Nickel Laterite Usi
11 pages
Artigo - Performance Assessment of A Simulation Model For PV Modules
No ratings yet
Artigo - Performance Assessment of A Simulation Model For PV Modules
7 pages
Graduate Admission Prediction - Data Analytics
No ratings yet
Graduate Admission Prediction - Data Analytics
32 pages
A New Statistical Correlation Between Shear Wave Velocity and Penetration Resistance of Soils Using Genetic Programming
No ratings yet
A New Statistical Correlation Between Shear Wave Velocity and Penetration Resistance of Soils Using Genetic Programming
8 pages
Linear Regression in Advertising Analysis
No ratings yet
Linear Regression in Advertising Analysis
42 pages
3.machine Learning Using Smart Weather Forecasting
No ratings yet
3.machine Learning Using Smart Weather Forecasting
6 pages
3-f RILIBAK
No ratings yet
3-f RILIBAK
13 pages
41 Submission
No ratings yet
41 Submission
14 pages
Prediction of Compressive Strength of Concrete From Early Age Test Result
No ratings yet
Prediction of Compressive Strength of Concrete From Early Age Test Result
8 pages
43-68 The Exchange Rate Disconnect Puzzle
No ratings yet
43-68 The Exchange Rate Disconnect Puzzle
26 pages
Research Paper
No ratings yet
Research Paper
7 pages
ML Unit 3
No ratings yet
ML Unit 3
2 pages
T6
No ratings yet
T6
1 page
Stock Forecasting Using Prophet vs. LSTM Model Applying Time-Series Prediction
No ratings yet
Stock Forecasting Using Prophet vs. LSTM Model Applying Time-Series Prediction
8 pages
Accepted Manuscript FUZZIEEE2021 Chia
No ratings yet
Accepted Manuscript FUZZIEEE2021 Chia
6 pages
Correlations Between Direct and Indirect Strength
No ratings yet
Correlations Between Direct and Indirect Strength
7 pages
Hawk-Eye Tracking System Test Report
No ratings yet
Hawk-Eye Tracking System Test Report
3 pages
The Diffusion of Online Shopping in Australia: Comparing The Bass, Logistic and Gompertz Growth Models
No ratings yet
The Diffusion of Online Shopping in Australia: Comparing The Bass, Logistic and Gompertz Growth Models
12 pages
openSAP Sac5 Week 4 Unit 7 PREDKEYINT Exercise
No ratings yet
openSAP Sac5 Week 4 Unit 7 PREDKEYINT Exercise
18 pages
UAV DEM Accuracy Without GCPs
No ratings yet
UAV DEM Accuracy Without GCPs
28 pages
Polynomial Regression for Fuel Prediction
No ratings yet
Polynomial Regression for Fuel Prediction
10 pages
ANN and ANFIS Performance Prediction Models For Hydraulic Impact Hammers
No ratings yet
ANN and ANFIS Performance Prediction Models For Hydraulic Impact Hammers
7 pages
A Simplified Pavement Condition Index Regression Model For Pavement Evaluation
No ratings yet
A Simplified Pavement Condition Index Regression Model For Pavement Evaluation
11 pages
Summer 2024 Industrial Training Overview
No ratings yet
Summer 2024 Industrial Training Overview
38 pages
pyEDM: Python Interface for EDM
No ratings yet
pyEDM: Python Interface for EDM
19 pages
Geotechnical AI for Clay Prediction
No ratings yet
Geotechnical AI for Clay Prediction
15 pages

Machine Learning Assignment: Regression & Clustering

Uploaded by

Machine Learning Assignment: Regression & Clustering

Uploaded by

Department of Electronics and Telecommunication Engineering

Ramaiah Institute of Technology

MACHINE LEARNING (ETE631)

Name: R Jeevan Kumar

# Predict housing prices using Linear Regression

from [Link] import mean_squared_error, r2_score

from sklearn.model_selection import train_test_split

print("\n----------- HOUSING PRICE PREDICTOR------------\n")

data, target = [Link], [Link]

Xtrain, Xtest, Ytrain, Ytest = train_test_split(data,target,test_size=0.3)

print("Model performance for training set is :\n ")

# classify diabetes using K means clustering

from sklearn import preprocessing

print ("\n ---------- K MEANS CLUSTERING ON DIABETES DATA----------------

# Replacing NaN with mean values

# Feature scaling using MinMaxScaler

X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size =

KMeans_Clustering = KMeans(n_clusters =2, random_state=0)

# Fit again and plot

[Link]([Link][:, [1]].values,[Link][:, [5]].values,

You might also like