0% found this document useful (0 votes)

9 views5 pages

ML - Assignment 1ipynb - Colab

The document outlines a machine learning assignment using various regression techniques on the California housing dataset. It includes Linear Regression, Ridge Regression, Lasso Regression, and Polynomial Regression, with performance metrics such as MAE, MSE, and R2 reported for each model. Visualizations are provided to compare actual versus predicted median house values for each regression method.

Uploaded by

Kamini Patil

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

9 views5 pages

ML - Assignment 1ipynb - Colab

Uploaded by

Kamini Patil

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

5/31/25, 12:53 PM Copy of ML_assignment 1ipynb - Colab

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score

# Load data
housing = fetch_california_housing(as_frame=True)
df = housing.frame

X = df.drop('MedHouseVal', axis=1)
y = df['MedHouseVal']

# Scale features
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Split dataset
X_train, X_test, y_train, y_test = train_test_split(
X_scaled, y, test_size=0.2, random_state=42)

# Train Linear Regression

lr = LinearRegression()
lr.fit(X_train, y_train)

y_pred = lr.predict(X_test)

# Evaluate
print("Linear Regression Performance:")
print("MAE:", mean_absolute_error(y_test, y_pred))
print("MSE:", mean_squared_error(y_test, y_pred))
print("R2:", r2_score(y_test, y_pred))
print("-"*30)

# Sample points for plot

n_points = 50
if len(y_test) > n_points:
indices = np.random.choice(len(y_test), n_points, replace=False)
else:
indices = np.arange(len(y_test))

y_test_sample = y_test.iloc[indices] if hasattr(y_test, "iloc") else y_test[indices]

y_pred_sample = y_pred[indices]

# Plot
plt.figure(figsize=(6,6))
plt.scatter(y_test_sample, y_pred_sample, alpha=0.6)
plt.plot([min(y_test_sample), max(y_test_sample)],
[min(y_test_sample), max(y_test_sample)], 'r--')
plt.xlabel("Actual Median House Value")
plt.ylabel("Predicted Median House Value")
plt.title("Linear Regression: Actual vs Predicted")
plt.show()

https://colab.research.google.com/drive/1hvjOBqq5IVjp8wvjbFDadWB6tDWzGhxh#printMode=true 1/5
5/31/25, 12:53 PM Copy of ML_assignment 1ipynb - Colab

Linear Regression Performance:

MAE: 0.5332001304956565
MSE: 0.555891598695244
R2: 0.5757877060324511
------------------------------

 

from sklearn.linear_model import Ridge

# Use previous data preprocessing and train-test split steps

ridge = Ridge(alpha=1.0)
ridge.fit(X_train, y_train)

y_pred = ridge.predict(X_test)

print("Ridge Regression Performance:")

print("MAE:", mean_absolute_error(y_test, y_pred))
print("MSE:", mean_squared_error(y_test, y_pred))
print("R2:", r2_score(y_test, y_pred))
print("-"*30)

n_points = 100
if len(y_test) > n_points:
indices = np.random.choice(len(y_test), n_points, replace=False)
else:
indices = np.arange(len(y_test))

y_test_sample = y_test.iloc[indices] if hasattr(y_test, "iloc") else y_test[indices]

y_pred_sample = y_pred[indices]

plt.figure(figsize=(6,6))
plt.scatter(y_test_sample, y_pred_sample, alpha=0.6)
plt.plot([min(y_test_sample), max(y_test_sample)],
[min(y_test_sample), max(y_test_sample)], 'r--')
plt.xlabel("Actual Median House Value")
plt.ylabel("Predicted Median House Value")
plt.title("Ridge Regression: Actual vs Predicted")
plt.show()

https://colab.research.google.com/drive/1hvjOBqq5IVjp8wvjbFDadWB6tDWzGhxh#printMode=true 2/5
5/31/25, 12:53 PM Copy of ML_assignment 1ipynb - Colab

Ridge Regression Performance:

MAE: 0.5331933646313113
MSE: 0.5558512007367514
R2: 0.575818534544132
------------------------------

 

from sklearn.linear_model import Lasso

# Use previous data preprocessing and train-test split steps

lasso = Lasso(alpha=0.01)
lasso.fit(X_train, y_train)

y_pred = lasso.predict(X_test)

print("Lasso Regression Performance:")

print("MAE:", mean_absolute_error(y_test, y_pred))
print("MSE:", mean_squared_error(y_test, y_pred))
print("R2:", r2_score(y_test, y_pred))
print("-"*30)

n_points = 100
if len(y_test) > n_points:
indices = np.random.choice(len(y_test), n_points, replace=False)
else:
indices = np.arange(len(y_test))

y_test_sample = y_test.iloc[indices] if hasattr(y_test, "iloc") else y_test[indices]

y_pred_sample = y_pred[indices]

https://colab.research.google.com/drive/1hvjOBqq5IVjp8wvjbFDadWB6tDWzGhxh#printMode=true 3/5
5/31/25, 12:53 PM Copy of ML_assignment 1ipynb - Colab

Lasso Regression Performance:

MAE: 0.535523256745153
MSE: 0.5479327795506
R2: 0.581861244352776
------------------------------

 

from sklearn.preprocessing import PolynomialFeatures

# Use previous data preprocessing and train-test split steps

poly = PolynomialFeatures(degree=2)
X_train_poly = poly.fit_transform(X_train)
X_test_poly = poly.transform(X_test)

poly_reg = LinearRegression()
poly_reg.fit(X_train_poly, y_train)

y_pred = poly_reg.predict(X_test_poly)

print("Polynomial Regression (degree 2) Performance:")

print("MAE:", mean_absolute_error(y_test, y_pred))
print("MSE:", mean_squared_error(y_test, y_pred))
print("R2:", r2_score(y_test, y_pred))
print("-"*30)

n_points = 100
if len(y_test) > n_points:
indices = np.random.choice(len(y_test), n_points, replace=False)
else:
indices = np.arange(len(y_test))

y_test_sample = y_test.iloc[indices] if hasattr(y_test, "iloc") else y_test[indices]

y_pred_sample = y_pred[indices]

https://colab.research.google.com/drive/1hvjOBqq5IVjp8wvjbFDadWB6tDWzGhxh#printMode=true 4/5
5/31/25, 12:53 PM Copy of ML_assignment 1ipynb - Colab

Polynomial Regression (degree 2) Performance:

MAE: 0.46700093346965893
MSE: 0.4643015238301214
R2: 0.6456819729261911
------------------------------

https://colab.research.google.com/drive/1hvjOBqq5IVjp8wvjbFDadWB6tDWzGhxh#printMode=true 5/5

7 A
No ratings yet
7 A
2 pages
ML Assignment 1ipynb
No ratings yet
ML Assignment 1ipynb
10 pages
Ridge vs Lasso: A Python Guide
No ratings yet
Ridge vs Lasso: A Python Guide
3 pages
ML Practical 5
No ratings yet
ML Practical 5
10 pages
Pgrm1 Simple Linear Reg
No ratings yet
Pgrm1 Simple Linear Reg
3 pages
House Price Prediction
No ratings yet
House Price Prediction
2 pages
Experiment 4 ML
No ratings yet
Experiment 4 ML
9 pages
wvcg0mt7pkASSI 3 ML 16
No ratings yet
wvcg0mt7pkASSI 3 ML 16
4 pages
Import As From Import From Import From Import From Import Import As
No ratings yet
Import As From Import From Import From Import From Import Import As
3 pages
ML Practical 5
No ratings yet
ML Practical 5
10 pages
ML Lab 4,5,6,7,8,9,10
No ratings yet
ML Lab 4,5,6,7,8,9,10
7 pages
ML Assignment1
No ratings yet
ML Assignment1
4 pages
ML Minimized Programs
No ratings yet
ML Minimized Programs
9 pages
Dav 3rd
No ratings yet
Dav 3rd
2 pages
AD-22053227 Lab 401, 402
No ratings yet
AD-22053227 Lab 401, 402
4 pages
Machine Learning Lab Assignments
100% (2)
Machine Learning Lab Assignments
23 pages
Python File
No ratings yet
Python File
5 pages
ML Exp3
No ratings yet
ML Exp3
2 pages
EXPNO5
No ratings yet
EXPNO5
2 pages
Machine Learning
No ratings yet
Machine Learning
10 pages
Exp 2 (Multiple Linear Regression)
No ratings yet
Exp 2 (Multiple Linear Regression)
6 pages
Lasso Regression Aim: Roll Number: 160122733094 Date
No ratings yet
Lasso Regression Aim: Roll Number: 160122733094 Date
8 pages
Data Science Record - 05
No ratings yet
Data Science Record - 05
20 pages
Unit 3 5
No ratings yet
Unit 3 5
4 pages
DL Assignment 1ms24rai03
No ratings yet
DL Assignment 1ms24rai03
10 pages
ML Manual
No ratings yet
ML Manual
9 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
22 pages
Coding Question
No ratings yet
Coding Question
6 pages
ML Manual
No ratings yet
ML Manual
30 pages
ML Manual
No ratings yet
ML Manual
24 pages
Soft Sensor Code
No ratings yet
Soft Sensor Code
4 pages
Soft Sensor Code
No ratings yet
Soft Sensor Code
4 pages
Ds 4 Linears Boston
No ratings yet
Ds 4 Linears Boston
2 pages
DA Lab2
No ratings yet
DA Lab2
5 pages
ML Full For Print New 1
No ratings yet
ML Full For Print New 1
38 pages
ML Journal External
No ratings yet
ML Journal External
14 pages
CP4252 Lab Manual
No ratings yet
CP4252 Lab Manual
13 pages
Regression
No ratings yet
Regression
2 pages
House Pricing
No ratings yet
House Pricing
15 pages
Regression Analysis On The Boston House Price Dataset For House Price Prediction
No ratings yet
Regression Analysis On The Boston House Price Dataset For House Price Prediction
2 pages
Deber
No ratings yet
Deber
23 pages
Zerox Ready
No ratings yet
Zerox Ready
21 pages
IoT Task4 21BEC0384
No ratings yet
IoT Task4 21BEC0384
9 pages
Aiml Practicals
No ratings yet
Aiml Practicals
22 pages
Linear Regression
No ratings yet
Linear Regression
2 pages
MDS372 Lab4 2448001
No ratings yet
MDS372 Lab4 2448001
17 pages
Exp4 (Linear Regression)
No ratings yet
Exp4 (Linear Regression)
2 pages
Wa0009.
No ratings yet
Wa0009.
4 pages
ML
No ratings yet
ML
17 pages
Linear Regression Mca Lab - Jupyter Notebook
No ratings yet
Linear Regression Mca Lab - Jupyter Notebook
2 pages
ML Record
No ratings yet
ML Record
19 pages
SiddharthShah 1032221195 DivC 50 DL LabAssignment2
No ratings yet
SiddharthShah 1032221195 DivC 50 DL LabAssignment2
7 pages
Iii Aid - ML
No ratings yet
Iii Aid - ML
30 pages
CP4252 Machine Learning Lab Manual
No ratings yet
CP4252 Machine Learning Lab Manual
26 pages
Boston Housing Price Prediction
No ratings yet
Boston Housing Price Prediction
3 pages
Train
No ratings yet
Train
17 pages
MIS710A1 Surname studentID Python
No ratings yet
MIS710A1 Surname studentID Python
2 pages
4 LinearRegression
No ratings yet
4 LinearRegression
1 page
I Implementation of Regression
No ratings yet
I Implementation of Regression
6 pages
SEHH2031 Revision Session Ch5-6 Solution
No ratings yet
SEHH2031 Revision Session Ch5-6 Solution
2 pages
Mean, Median, Mode, Range Worksheet
No ratings yet
Mean, Median, Mode, Range Worksheet
10 pages
Tutorial 3 - Qs and Answers
No ratings yet
Tutorial 3 - Qs and Answers
16 pages
Osmosis - Osmosis Notes (2019) - Libgen - Li-1-44
No ratings yet
Osmosis - Osmosis Notes (2019) - Libgen - Li-1-44
44 pages
Weekly Expected Move 1-2 Sigma Ranges (10 Mar - 14 Mar 2025)
No ratings yet
Weekly Expected Move 1-2 Sigma Ranges (10 Mar - 14 Mar 2025)
5 pages
CS210 Statistics Notes PDF
No ratings yet
CS210 Statistics Notes PDF
8 pages
Section 6.1
No ratings yet
Section 6.1
32 pages
Mean and Variance of Random Variables
No ratings yet
Mean and Variance of Random Variables
10 pages
Data Analysis with Python Code
0% (1)
Data Analysis with Python Code
5 pages
Central Tendency: Ungrouped & Grouped Data
100% (1)
Central Tendency: Ungrouped & Grouped Data
26 pages
CH 7 - BKM 12e Ch07 Excel Application Two Security Model
No ratings yet
CH 7 - BKM 12e Ch07 Excel Application Two Security Model
1 page
Chpt. 4 (Measurement, Scaling) Nepali
No ratings yet
Chpt. 4 (Measurement, Scaling) Nepali
30 pages
Understanding Quartiles, Deciles, and Percentiles
No ratings yet
Understanding Quartiles, Deciles, and Percentiles
25 pages
Solution Ecom30004 Homework2 Questions-1
No ratings yet
Solution Ecom30004 Homework2 Questions-1
6 pages
Chapter 4 Fin534
No ratings yet
Chapter 4 Fin534
38 pages
P&S Mid 2 QB-2
No ratings yet
P&S Mid 2 QB-2
4 pages
51 Multiple Questions and Answers On Research Process in Physical Education
No ratings yet
51 Multiple Questions and Answers On Research Process in Physical Education
12 pages
Assignment 1 - 18MAB303T - 22-23 EVEN
No ratings yet
Assignment 1 - 18MAB303T - 22-23 EVEN
1 page
Statistics for Students
No ratings yet
Statistics for Students
6 pages
Excel-Statistics-Manual For Physics
No ratings yet
Excel-Statistics-Manual For Physics
24 pages
Probability, Statistics, and Data Analysis Notes # 3: UCL LCL M
No ratings yet
Probability, Statistics, and Data Analysis Notes # 3: UCL LCL M
5 pages
STA301 Assignment 1 Solutions 2020
0% (1)
STA301 Assignment 1 Solutions 2020
2 pages
Data Inflasi Di Kota Madiun Tahun 2008 - 2019
No ratings yet
Data Inflasi Di Kota Madiun Tahun 2008 - 2019
5 pages
0.4 Parametric Vs Non Parametric
No ratings yet
0.4 Parametric Vs Non Parametric
19 pages
Measure of Dispersion
No ratings yet
Measure of Dispersion
29 pages
2024 Facts Table A-16
No ratings yet
2024 Facts Table A-16
2 pages
Measures of Central Tendency & Variability
No ratings yet
Measures of Central Tendency & Variability
18 pages
MAN5015 - Take Home Assignment-1
No ratings yet
MAN5015 - Take Home Assignment-1
2 pages
Lesson 7 - Measures of Dispersion-Statistics and Data
No ratings yet
Lesson 7 - Measures of Dispersion-Statistics and Data
26 pages
River Pollution from Diaper Disposal
No ratings yet
River Pollution from Diaper Disposal
11 pages

ML - Assignment 1ipynb - Colab

Uploaded by

ML - Assignment 1ipynb - Colab

Uploaded by

5/31/25, 12:53 PM Copy of ML_assignment 1ipynb - Colab

# Train Linear Regression

# Sample points for plot

y_test_sample = y_test.iloc[indices] if hasattr(y_test, "iloc") else y_test[indices]

Linear Regression Performance:

from sklearn.linear_model import Ridge

# Use previous data preprocessing and train-test split steps

print("Ridge Regression Performance:")

y_test_sample = y_test.iloc[indices] if hasattr(y_test, "iloc") else y_test[indices]

Ridge Regression Performance:

from sklearn.linear_model import Lasso

# Use previous data preprocessing and train-test split steps

print("Lasso Regression Performance:")

y_test_sample = y_test.iloc[indices] if hasattr(y_test, "iloc") else y_test[indices]

Lasso Regression Performance:

from sklearn.preprocessing import PolynomialFeatures

# Use previous data preprocessing and train-test split steps

print("Polynomial Regression (degree 2) Performance:")

y_test_sample = y_test.iloc[indices] if hasattr(y_test, "iloc") else y_test[indices]

Polynomial Regression (degree 2) Performance:

You might also like