0% found this document useful (0 votes)

20 views15 pages

Lab2

The document outlines a machine learning project using TensorFlow and Keras to predict financial balance based on income and housing data. It includes data preprocessing, model training with varying layers, and evaluation metrics such as R2 score and mean squared error. Visualizations of predictions and correlation heatmaps are also presented to analyze the relationships within the dataset.

Uploaded by

asodariyapriyank69

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

20 views15 pages

Lab2

Uploaded by

asodariyapriyank69

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 15

Priyank Asodariya - 202201470

import pandas as pd
import numptarget as np
import seaborn as sns
import matplotlib.ptargetplot as plt
import tensorflow as tf

from tensorflow.keras import Sequential

from tensorflow.keras.latargeters import Dense
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import r2_score,
mean_squared_error,mean_absolute_error,mean_absolute_percentage_error

scaler = StandardScaler()

train=pd.read_csv('train - train.csv')
test=pd.read_csv('test - test.csv')

x_train = train['Income'].to_numptarget().reshape(-1,1)
target_train = train['Balance'].to_numptarget().reshape(-1,1)
x_test = test['Income'].to_numptarget().reshape(-1,1)
target_test = test['Balance'].to_numptarget().reshape(-1,1)

for i in [16,32,64,128,256]:
ml_model = Sequential()
ml_model.add(Dense(i,activation='relu'))
ml_model.add(Dense(1))
ml_model.compile(loss='mean_squared_error', optimizer='adam',
metrics=['accuractarget'])
ml_model.fit(x_train, target_train, epochs=500,batch_size =
5,verbose=0)
target_pred = ml_model.predict(x_test)
target_train_pred=ml_model.predict(x_train)
print("Training Error ",r2_score(target_train_pred, target_train))
print("Testing Error ",r2_score(target_test, target_pred))
print(mean_squared_error(target_test, target_pred))
print(mean_absolute_error(target_test, target_pred))
print(mean_absolute_percentage_error(target_test, target_pred))
plt.scatter(x_test, target_test, color='red')
plt.scatter(x_test, target_pred, color='blue')
plt.plot(x_test,target_pred,color='green')
plt.show()
print("-"*50)

1/1 ━━━━━━━━━━━━━━━━━━━━ 0s 63ms/step

1/1 ━━━━━━━━━━━━━━━━━━━━ 0s 58ms/step
Training Error 0.8517386828721549
Testing Error 0.9508672520501443
0.23169167933915444
0.3807450989852905
0.061814227686856724

--------------------------------------------------
1/1 ━━━━━━━━━━━━━━━━━━━━ 0s 62ms/step
1/1 ━━━━━━━━━━━━━━━━━━━━ 0s 59ms/step
Training Error 0.7321397268315671
Testing Error 0.9300057000160803
0.330066963158541
0.4255550995338441
0.057038070632163165
--------------------------------------------------

WARNING:tensorflow:5 out of the last 5 calls to <function

TensorFlowTrainer.make_predict_function.<locals>.one_step_on_data_dist
ributed at 0x7e44a5f22700> triggered tf.function retracing. Tracing is
expensive and the excessive number of tracings could be due to (1)
creating @tf.function repeatedly in a loop, (2) passing tensors with
different shapes, (3) passing Python objects instead of tensors. For
(1), please define your @tf.function outside of the loop. For (2),
@tf.function has reduce_retracing=True option that can avoid
unnecessary retracing. For (3), please refer to
https://www.tensorflow.org/guide/function#controlling_retracing and
https://www.tensorflow.org/api_docs/python/tf/function for more
details.

1/1 ━━━━━━━━━━━━━━━━━━━━ 0s 63ms/step

WARNING:tensorflow:6 out of the last 6 calls to <function

1/1 ━━━━━━━━━━━━━━━━━━━━ 0s 67ms/step

Training Error 0.877537073738705
Testing Error 0.9516632260308955
0.22793816348657653
0.3808596513595581
0.06670906941190224

--------------------------------------------------
1/1 ━━━━━━━━━━━━━━━━━━━━ 0s 120ms/step
1/1 ━━━━━━━━━━━━━━━━━━━━ 0s 92ms/step
Training Error 0.8932075070711005
Testing Error 0.9481998374267331
0.24427020994002174
0.38469796398544315
0.07139332008352603
--------------------------------------------------
1/1 ━━━━━━━━━━━━━━━━━━━━ 0s 97ms/step
1/1 ━━━━━━━━━━━━━━━━━━━━ 0s 88ms/step
Training Error 0.9050547516834059
Testing Error 0.9425062575662583
0.27111900497732205
0.39125106791687014
0.07644055667867675
--------------------------------------------------

Q.2
house = pd.read_csv('housing - housing.csv')

house.head()

{"summary":"{\n \"name\": \"house\",\n \"rows\": 489,\n \"fields\":

[\n {\n \"column\": \"RM\",\n \"properties\": {\n
\"dtype\": \"number\",\n \"std\": 0.6436497627572431,\n
\"min\": 3.561,\n \"max\": 8.398,\n
\"num_unique_values\": 430,\n \"samples\": [\n 5.67,\n
6.232,\n 6.8\n ],\n \"semantic_type\": \"\",\n
\"description\": \"\"\n }\n },\n {\n \"column\":
\"LSTAT\",\n \"properties\": {\n \"dtype\": \"number\",\n
\"std\": 7.081989789065134,\n \"min\": 1.98,\n \"max\":
37.97,\n \"num_unique_values\": 442,\n \"samples\": [\n
12.73,\n 4.14,\n 5.52\n ],\n
\"semantic_type\": \"\",\n \"description\": \"\"\n }\
n },\n {\n \"column\": \"PTRATIO\",\n \"properties\":
{\n \"dtype\": \"number\",\n \"std\":
2.1112675026309873,\n \"min\": 12.6,\n \"max\": 22.0,\n
\"num_unique_values\": 44,\n \"samples\": [\n 19.6,\n
16.6,\n 15.6\n ],\n \"semantic_type\": \"\",\n
\"description\": \"\"\n }\n },\n {\n \"column\":
\"MEDV\",\n \"properties\": {\n \"dtype\": \"number\",\n
\"std\": 165340,\n \"min\": 105000,\n \"max\": 1024800,\
n \"num_unique_values\": 228,\n \"samples\": [\n
296100,\n 472500,\n 396900\n ],\n
\"semantic_type\": \"\",\n \"description\": \"\"\n }\
n }\n ]\n}","type":"dataframe","variable_name":"house"}

house.describe()

{"summary":"{\n \"name\": \"house\",\n \"rows\": 8,\n \"fields\":

[\n {\n \"column\": \"RM\",\n \"properties\": {\n
\"dtype\": \"number\",\n \"std\": 171.01026967657967,\n
\"min\": 0.6436497627572431,\n \"max\": 489.0,\n
\"num_unique_values\": 8,\n \"samples\": [\n
6.240288343558283,\n 6.185,\n 489.0\n ],\n
\"semantic_type\": \"\",\n \"description\": \"\"\n }\
n },\n {\n \"column\": \"LSTAT\",\n \"properties\": {\
n \"dtype\": \"number\",\n \"std\": 168.38221606435016,\
n \"min\": 1.98,\n \"max\": 489.0,\n
\"num_unique_values\": 8,\n \"samples\": [\n
12.93963190184049,\n 11.69,\n 489.0\n ],\n
\"semantic_type\": \"\",\n \"description\": \"\"\n }\
n },\n {\n \"column\": \"PTRATIO\",\n \"properties\":
{\n \"dtype\": \"number\",\n \"std\":
167.35224110126134,\n \"min\": 2.1112675026309873,\n
\"max\": 489.0,\n \"num_unique_values\": 8,\n
\"samples\": [\n 18.51656441717791,\n 19.1,\n
489.0\n ],\n \"semantic_type\": \"\",\n
\"description\": \"\"\n }\n },\n {\n \"column\":
\"MEDV\",\n \"properties\": {\n \"dtype\": \"number\",\n
\"std\": 318601.84841506614,\n \"min\": 489.0,\n
\"max\": 1024800.0,\n \"num_unique_values\": 8,\n
\"samples\": [\n 454342.9447852761,\n 438900.0,\n
489.0\n ],\n \"semantic_type\": \"\",\n
\"description\": \"\"\n }\n }\n ]\n}","type":"dataframe"}

Q1 = house.quantile(0.25)
Q3 = house.quantile(0.75)
IQR = Q3 - Q1
upper = Q3 + 1.5 * IQR
lower = Q1 - 1.5 * IQR

house=house[house['RM']>lower['RM']]
house=house[house['RM']<upper['RM']]
house = house[house['LSTAT']>lower['LSTAT']]
house = house[house['LSTAT']<upper['LSTAT']]
house=house[house['PTRATIO']>lower['PTRATIO']]
house=house[house['PTRATIO']<upper['PTRATIO']]

sns.heatmap(house.corr(),annot=True)
<Axes: >

sns.pairplot(house)

<seaborn.axisgrid.PairGrid at 0x7e44a5ada4d0>
x = house[['RM','LSTAT','PTRATIO']]
target=house['MEDV']

from sklearn.ml_model_selection import train_test_split

x_train,x_test,target_train,target_test =
train_test_split(x,target,test_size=0.2,random_state=42)

x_train=scaler.fit_transform(x_train)
x_test=scaler.transform(x_test)
x_train.shape

(360, 3)
latargeter = [1,2,3,5,8,16,32,64,128]
accuractarget=[]
mse=[]
mae=[]
for i in latargeter:
print("For ",i," Latargeters")
ml_model = Sequential()
ml_model.add(Dense(64,input_dim=x_train.shape[1],
activation='relu'))
for j in range(i-1):
ml_model.add(Dense(64,activation='relu'))
ml_model.add(Dense(1,activation='linear'))
ml_model.compile(loss='mse', optimizer='adam', metrics=['mse'])
ml_model.fit(x_train, target_train, epochs=50,batch_size =
4,verbose=0)
target_pred = ml_model.predict(x_test)
target_train_pred=ml_model.predict(x_train)
print("Training R2 ",r2_score(target_train, target_train_pred))
print("Testing R2 ",r2_score(target_test, target_pred))
accuractarget.append(r2_score(target_test, target_pred))
mse.append(mean_squared_error(target_test, target_pred))
mae.append(mean_absolute_error(target_test, target_pred))
print("*"*50)

For 1 Layers

/usr/local/lib/python3.11/dist-packages/keras/src/layers/core/
dense.py:87: UserWarning: Do not pass an ìnput_shape`/ìnput_dim`
argument to a layer. When using Sequential models, prefer using an
Ìnput(shape)` object as the first layer in the model instead.
super().__init__(activity_regularizer=activity_regularizer,
**kwargs)

3/3 ━━━━━━━━━━━━━━━━━━━━ 0s 25ms/step

12/12 ━━━━━━━━━━━━━━━━━━━━ 0s 3ms/step
Training R2 -9.73264217376709
Testing R2 -11.27657699584961
**************************************************
For 2 Layers

3/3 ━━━━━━━━━━━━━━━━━━━━ 0s 27ms/step

12/12 ━━━━━━━━━━━━━━━━━━━━ 0s 3ms/step
Training R2 0.48627030849456787
Testing R2 0.3928722143173218
**************************************************
For 3 Layers

3/3 ━━━━━━━━━━━━━━━━━━━━ 0s 59ms/step

12/12 ━━━━━━━━━━━━━━━━━━━━ 0s 6ms/step
Training R2 0.7502697706222534
Testing R2 0.7188435792922974
**************************************************
For 5 Layers

3/3 ━━━━━━━━━━━━━━━━━━━━ 0s 42ms/step

12/12 ━━━━━━━━━━━━━━━━━━━━ 0s 3ms/step
Training R2 0.7675473690032959
Testing R2 0.7164878845214844
**************************************************
For 8 Layers

3/3 ━━━━━━━━━━━━━━━━━━━━ 0s 53ms/step

12/12 ━━━━━━━━━━━━━━━━━━━━ 0s 3ms/step
Training R2 0.7801346778869629
Testing R2 0.7407781481742859
**************************************************
For 16 Layers

3/3 ━━━━━━━━━━━━━━━━━━━━ 1s 128ms/step

12/12 ━━━━━━━━━━━━━━━━━━━━ 0s 5ms/step
Training R2 0.6444627642631531
Testing R2 0.6057525873184204
**************************************************
For 32 Layers

3/3 ━━━━━━━━━━━━━━━━━━━━ 1s 155ms/step

12/12 ━━━━━━━━━━━━━━━━━━━━ 0s 4ms/step
Training R2 0.2487562894821167
Testing R2 0.18815523386001587
**************************************************
For 64 Layers

3/3 ━━━━━━━━━━━━━━━━━━━━ 1s 413ms/step

12/12 ━━━━━━━━━━━━━━━━━━━━ 0s 4ms/step
Training R2 0.7718943357467651
Testing R2 0.7003287672996521
**************************************************
For 128 Layers

3/3 ━━━━━━━━━━━━━━━━━━━━ 3s 956ms/step

12/12 ━━━━━━━━━━━━━━━━━━━━ 0s 6ms/step
Training R2 0.332729697227478
Testing R2 0.233387291431427
**************************************************
plt.plot(latargeter,accuractarget,color='red')
plt.title('Latargeter vs Accuractarget')
plt.xlabel('Latargeters')
plt.targetlabel('Accuractarget')
plt.show()
plt.plot(latargeter,mse,color='red')
plt.title('Latargeter vs MSE')
plt.xlabel('Latargeters')
plt.targetlabel('MSE')
plt.show()
plt.plot(latargeter,mae,color='red')
plt.title('Latargeter vs MAE')
plt.xlabel('Latargeters')
plt.targetlabel('MAE')
plt.show()
Increasing the number of layers in a Neural Network can cause overfitting. From the previous
output, accuracy increased up to 64 layers, but after that, overfitting occurred because no
regularization techniques were used.

Python 3
No ratings yet
Python 3
9 pages
ML Lab-1
No ratings yet
ML Lab-1
5 pages
VoThaiThaoNhi ECON209 F2024 Lab 2
No ratings yet
VoThaiThaoNhi ECON209 F2024 Lab 2
10 pages
Loan Default Prediction System
No ratings yet
Loan Default Prediction System
13 pages
Copy of Final Project
No ratings yet
Copy of Final Project
16 pages
Import As Import As Import As Import: Pandas PD Numpy NP Matplotlib - Pyplot PLT Sklearn DF PD - Read - CSV DF
No ratings yet
Import As Import As Import As Import: Pandas PD Numpy NP Matplotlib - Pyplot PLT Sklearn DF PD - Read - CSV DF
9 pages
DACLUSTER
No ratings yet
DACLUSTER
9 pages
Kakauikkla
No ratings yet
Kakauikkla
51 pages
Assignment 1 ML
No ratings yet
Assignment 1 ML
30 pages
CVD Web
No ratings yet
CVD Web
22 pages
Covid 19 Analysis and Visualization Using Plotly Express
No ratings yet
Covid 19 Analysis and Visualization Using Plotly Express
11 pages
MLT Ann Lab 2
No ratings yet
MLT Ann Lab 2
7 pages
RegresiÃ N Lineal Con Python - Ipynb
No ratings yet
RegresiÃ N Lineal Con Python - Ipynb
83 pages
Task 1
No ratings yet
Task 1
5 pages
BD WPS2
No ratings yet
BD WPS2
23 pages
# Importing Necessary Libraries: Import As Import As Import As Import As
No ratings yet
# Importing Necessary Libraries: Import As Import As Import As Import As
21 pages
Another Copy of Ensemble Models Original Paid
No ratings yet
Another Copy of Ensemble Models Original Paid
51 pages
A09Ass04 - Jupyter Notebook
No ratings yet
A09Ass04 - Jupyter Notebook
10 pages
Experiment No 11
No ratings yet
Experiment No 11
19 pages
Plot 3D: Import As
No ratings yet
Plot 3D: Import As
26 pages
DSBDA Prac4 2
No ratings yet
DSBDA Prac4 2
1 page
Week 4
No ratings yet
Week 4
13 pages
ML Manual
No ratings yet
ML Manual
9 pages
ML Merged
No ratings yet
ML Merged
28 pages
Data Scientists' Guide to Predicting House Prices
No ratings yet
Data Scientists' Guide to Predicting House Prices
9 pages
IS - Extended - Project - Guided - Template - Notebook
No ratings yet
IS - Extended - Project - Guided - Template - Notebook
26 pages
Prg7a - Jupyter Notebook
No ratings yet
Prg7a - Jupyter Notebook
12 pages
Copy of ML - Assignment
No ratings yet
Copy of ML - Assignment
7 pages
Project Linear Regression
No ratings yet
Project Linear Regression
7 pages
Data Science Record - 05
No ratings yet
Data Science Record - 05
20 pages
Ass 1 ML
No ratings yet
Ass 1 ML
21 pages
Assignment 4
No ratings yet
Assignment 4
7 pages
1 Linear Regression - Ipynb
No ratings yet
1 Linear Regression - Ipynb
16 pages
Data Analysis for Beginners
No ratings yet
Data Analysis for Beginners
1 page
DSBDA4
No ratings yet
DSBDA4
6 pages
Keeratsi HW8
No ratings yet
Keeratsi HW8
17 pages
Python File
No ratings yet
Python File
5 pages
Simple Linear Regression
No ratings yet
Simple Linear Regression
4 pages
Simple Linear Regression
No ratings yet
Simple Linear Regression
4 pages
A926534728 - 28953 - 8 - 2025 - Spark Mllib
No ratings yet
A926534728 - 28953 - 8 - 2025 - Spark Mllib
8 pages
KNN For Classification
No ratings yet
KNN For Classification
5 pages
Lab Extern L
No ratings yet
Lab Extern L
8 pages
Merged
No ratings yet
Merged
35 pages
Data Cleaning EDA
No ratings yet
Data Cleaning EDA
5 pages
Decision Tree
No ratings yet
Decision Tree
4 pages
ML Lab Assessment3.Ipynb - Colab
No ratings yet
ML Lab Assessment3.Ipynb - Colab
3 pages
Linear Regression Analysis - Polynomial Regression
No ratings yet
Linear Regression Analysis - Polynomial Regression
25 pages
1 4-EDA Ipynb
No ratings yet
1 4-EDA Ipynb
12 pages
03 Multiple Linear Regression
No ratings yet
03 Multiple Linear Regression
7 pages
Boston Housing Price Prediction Analysis
No ratings yet
Boston Housing Price Prediction Analysis
5 pages
1 Linear Regression - Ipynb
No ratings yet
1 Linear Regression - Ipynb
66 pages
DNN Tutorial for Data Scientists
No ratings yet
DNN Tutorial for Data Scientists
9 pages
Exercise 5
No ratings yet
Exercise 5
6 pages
Projet 2 Classification Des Crédits
No ratings yet
Projet 2 Classification Des Crédits
24 pages
EVS Project
No ratings yet
EVS Project
17 pages
The Pilgrim's Puzzle (5 Marks) (With Given Weights) You Are Solving An 8-Puzzle Where Block 1 10 KG Block 2 100 KG Block 8 10810 8108 KG (And So On Higher Number Heavier) New Heuristic
No ratings yet
The Pilgrim's Puzzle (5 Marks) (With Given Weights) You Are Solving An 8-Puzzle Where Block 1 10 KG Block 2 100 KG Block 8 10810 8108 KG (And So On Higher Number Heavier) New Heuristic
3 pages
Time Series Analysis of Indian Climate
No ratings yet
Time Series Analysis of Indian Climate
4 pages
Time Series Analysis On Perrin Freres Monthly Champagne Sales
No ratings yet
Time Series Analysis On Perrin Freres Monthly Champagne Sales
2 pages
Price and Return Data For Walmart (WMT) and Target (TGT) : Prices Returns Yahoo's Closing Price Adjusts For Dividends
No ratings yet
Price and Return Data For Walmart (WMT) and Target (TGT) : Prices Returns Yahoo's Closing Price Adjusts For Dividends
19 pages
Final Updated Stats and Prob Template
No ratings yet
Final Updated Stats and Prob Template
3 pages
Black Friday Sales Prediction Project
No ratings yet
Black Friday Sales Prediction Project
14 pages
FactorsRisk (UP)
No ratings yet
FactorsRisk (UP)
37 pages
Machine Learning Exam Questions and Topics
No ratings yet
Machine Learning Exam Questions and Topics
2 pages
Lind 19e Chap015 PPT Accessible
No ratings yet
Lind 19e Chap015 PPT Accessible
30 pages
Normal Curve Powerpoint
No ratings yet
Normal Curve Powerpoint
18 pages
Understanding Correlation and Its Types
No ratings yet
Understanding Correlation and Its Types
5 pages
Alan C. Acock - A Gentle Introduction To Stata-Stata Press (2005)
No ratings yet
Alan C. Acock - A Gentle Introduction To Stata-Stata Press (2005)
658 pages
Forecasting Sleep Disorders
No ratings yet
Forecasting Sleep Disorders
28 pages
2C PDF
No ratings yet
2C PDF
14 pages
Data Analytics With Python Curriculum (LOCTECH) PDF
No ratings yet
Data Analytics With Python Curriculum (LOCTECH) PDF
6 pages
Econometrics I: Course Overview
No ratings yet
Econometrics I: Course Overview
3 pages
Intrusion Detection System An Automatic Machine Learning Algorithms Using Auto - WEKA
No ratings yet
Intrusion Detection System An Automatic Machine Learning Algorithms Using Auto - WEKA
5 pages
Econometrics Assig 1
0% (1)
Econometrics Assig 1
13 pages
(Ebook) Discovering Knowledge in Data An Introduction To Data Mining by Daniel T. Larose, Chantel D. Larose Available Any Format
No ratings yet
(Ebook) Discovering Knowledge in Data An Introduction To Data Mining by Daniel T. Larose, Chantel D. Larose Available Any Format
307 pages
F2 - Attempt Review
No ratings yet
F2 - Attempt Review
51 pages
Mcqs Econometric
75% (20)
Mcqs Econometric
25 pages
Ch5 Big Data and Analytics Definitions
No ratings yet
Ch5 Big Data and Analytics Definitions
2 pages
Fly Rock Prediction by Multiple Regression Analysis in Esfordi Phosphate Mine of Iran
No ratings yet
Fly Rock Prediction by Multiple Regression Analysis in Esfordi Phosphate Mine of Iran
11 pages
Statistics On Sas
No ratings yet
Statistics On Sas
5 pages
ML Unit1 6
No ratings yet
ML Unit1 6
3 pages
Measures of Dispersion Homework 1
No ratings yet
Measures of Dispersion Homework 1
2 pages
Bes Project 2021
No ratings yet
Bes Project 2021
15 pages
Learning Activity Sheet
No ratings yet
Learning Activity Sheet
6 pages
Analysis of Longitudinal Data Second Edition Peter Diggle PDF Download
100% (3)
Analysis of Longitudinal Data Second Edition Peter Diggle PDF Download
49 pages
Small Sample Inference Guide
No ratings yet
Small Sample Inference Guide
44 pages
18MAB303T - Testing Hypothesis - Basics 2023
No ratings yet
18MAB303T - Testing Hypothesis - Basics 2023
25 pages
TYBSC (CS) - CS - 354 Foundations of Data Science
No ratings yet
TYBSC (CS) - CS - 354 Foundations of Data Science
2 pages
Tomato Weights and Probability Analysis
No ratings yet
Tomato Weights and Probability Analysis
20 pages