0% found this document useful (0 votes)

8 views40 pages

LinearRegression Tutorial

Uploaded by

Hieu Le

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

8 views40 pages

LinearRegression Tutorial

Uploaded by

Hieu Le

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Linear Regression

University of Information Technology

-
Vietnam National University Ho Chi Minh City

1 / 40
New Packages

numpy → very frequently used in ML (python)

Link: [Link]

> > import numpy as np

matplotlib → for visualization

Link: [Link]

> > import [Link] as plt

Generate A Regression Problem

> > from [Link] import make regression

> > X, y = make regression(n samples=500, n features=1,
n informative=1, noise=25, random state=42)

Q.M. Phan & N.H. Luong (VNU-HCM UIT) Machine Learning October 7, 2022 3 / 40
Data Visualization

> > [Link](X, y, facecolor=’tab:blue’, edgecolor=’white’, s=70)

[Link](’X’)
[Link](’y’)
[Link]()

4 / 40
5 / 40
Recall (Linear Regression)

Figure: The general concept of Linear Regression

7 / 40
Minimizing cost function with gradient descent

Cost function (Squared Error):

1Σ
J(w ) = (y (i ) − yˆ(i))2 (1)
2 i

Update the weights:

wt+1 := wt + ∆w (2)
∆w = −η∇J(w) (3)

(4)

(5)

8 / 40
Minimizing cost function with gradient descent (cont.)

9 / 40
Pseudocode of the Training Process

Algorithm 1 Gradient Descent

1: Initialize the weights, w
2: while Stopping Criteria is not satisfied do
3: Compute the output value, yˆ
4: Updates the weights
5: Compute the difference between y and yˆ
6: Update the intercept
7: Update the coefficients
8: end while

10 / 40
Components

Hyperparameters
eta (float): the initial learning rate
max iter (int): the maximum number of iterations
random state (int)

Parameters
w (list/array): the weight values
costs (list/array): the list containing the cost values over iterations

Methods
fit(X , y)
predict(X )

11 / 40
Implement (code from scratch)

class LinearRegression GD:

def init (self, eta = 0.001, max iter = 20, random state = 42):
[Link] = eta
[Link] iter = max iter
[Link] state = random state
self.w = None
[Link] = [ ]

def predict(self, X):

return [Link](X, self.w[1:]) + self.w[0]

12 / 40
’fit’ method

def fit(self, X, y):

rgen = [Link]([Link] state)
self.w = [Link](loc = 0.0, scale = 0.01, size = 1 + [Link][1])
[Link] = [ ]
for n iters in range([Link] iter):
y pred = [Link](X)
diff = y - y pred
self.w[0] += [Link] * [Link](diff)
for j in range([Link][1]): / / j ← [0, 1, ..., [Link][1]]
delta = 0.0
for i in range([Link][0]): / / i ← [0, 1, ..., [Link][0]]
delta += [Link] * diff[i] * X[i][j]
self.w[j + 1] += delta
cost = [Link](diff ** 2) / 2
[Link](cost)

13 / 40
’fit’ method (2)

def fit(self, X, y):

14 / 40
Train Model

Gradient Descent
> > reg GD = LinearRegression GD(eta=0.001, max iter=20,
random state=42)
reg [Link](X, y)

Q.M. Phan & N.H. Luong (VNU-HCM UIT) Machine Learning October 7, 2022 15 / 40
Visualize the trend in the cost values (Gradient Descent)

> > [Link](range(1, len(reg [Link]) + 1), reg [Link])

[Link](’Epochs’)
[Link](’Cost’)
[Link](’Gradient Descent’)
[Link]()

16 / 40
17 / 40
Visualize on Data

> > [Link](X, y, facecolor=’tab:blue’, edgecolor=’white’, s=70)

[Link](X, reg [Link](X), color=’green’, lw=6, label=’Gradient
Descent’)
[Link](’X’)
[Link](’y’)
[Link]()
[Link]()

18 / 40
19 / 40
Weight values

> > w GD = reg GD.w

w GD
> > [-0.9794002, 63.18592509]

20 / 40
Implement (package)

Stochastic Gradient Descent

from [Link] model import SGDRegressor

Hyperparameters Parameters Methods

eta0
intercept fit(X, y)
max iter
coef predict(X)
random state

21 / 40
Implement (package) (cont.)

Normal Equation
from sklearn.linear_model import LinearRegression

Parameters Methods
intercept_ fit(X, y)
coef_ predict(X)

22 / 40
Differences

Gradient Descent
w := w + ∆w
Σ
∆w = η i (y (i) − yˆ(i))xi

Stochastic Gradient Descent

w := w + ∆w
∆w = η(y (i ) − yˆ(i))xi

Normal Equation
w = (X T X ) −1 X T y

23 / 40
Practice (cont.)

Stochastic Gradient Descent

> > from [Link] model import SGDRegressor
> > reg_SGD = SGDRegressor(eta0=0.001, max iter=20,
random state=42, learning rate=’constant’)
reg_SGD.fit(X, y)

Normal Equation

> > from [Link] model import LinearRegression

> > reg_NE = LinearRegression()
reg_NE.fit(X, y)

24 / 40
Weight Values Comparisons

Gradient Descent (ours)

> > w GD = reg GD.w
w GD
> > [-0.9794002, 63.18592509]

Stochastic Gradient Descent

> > w SGD = [Link](reg [Link] , reg [Link] )
w SGD
> > [-1.02681553, 63.08630288]

Normal Equation
> > w NE = [Link](reg [Link] , reg [Link] )
w NE
> > [-0.97941333, 63.18605572]
25 / 40
Visualize on Data (all)

> > [Link](X, y, facecolor=’tab:blue’, edgecolor=’white’, s=70)

[Link](X, reg [Link](X), color=’green’, lw=6, label=’Gradient
Descent’)
[Link](X, reg [Link](X), color=’black’, lw=4,
label=’Stochastic Gradient Descent’)
[Link](X, reg [Link](X), color=’orange’, lw=2, label=’Normal
Equation’)
[Link](’X’)
[Link](’y’)
[Link]()
[Link]()

Machine Learning
27 / 40
Performance Evaluation

Mean Absolute Error (MAE)

1Σ
MAE (y, yˆ) = |y (i ) − yˆ(i)| (6)
n
i

Mean Squared Error (MSE)

1 Σ (y (i ) − yˆ(i))2
MSE(y, yˆ) = (7)
n
i

R-Squared (R2) Σ
(y (i ) − yˆ(i) )2
R2 (y, yˆ) = 1 − Σi (8)
i
(y (i ) − y)2

Q.M. Phan & N.H. Luong (VNU-HCM UIT) Machine Learning October 7, 2022 28 / 40
Performance Evaluation

> > from [Link] import mean absolute error as MAE

from [Link] import mean squared error as MSE
from [Link] import r2 score as R2

> > y pred GD = reg [Link](X)

> > y pred SGD = reg [Link](X)

> > y pred NE = reg [Link](X)

29 / 40
Performance Evaluation (cont.)

Mean Absolute Error

> > print(’MAE of GD:’, round(MAE(y, y_pred_GD), 6))
print(’MAE of SGD:’, round(MAE(y, y_pred_SGD), 6))
print(’MAE of NE:’, round(MAE(y, y_ pred_NE), 6))

Mean Squared Error

> > print(’MSE of GD:’, round(MSE(y, y_pred_GD), 6))
print(’MSE of SGD:’, round(MSE(y, y_pred_SGD),
6)) print(’MSE of NE:’, round(MSE(y, y_pred_NE),
6))
R2 score
> > print(’R2 of GD:’, round(R2(y, y_pred_GD), 6))
print(’R2 of SGD:’, round(R2(y, y_pred_SGD), 6))
print(’R2 of NE:’, round(R2(y, y_pred_NE), 6))

30 / 40
Run Gradient Descent with lr = 0.005

31 / 40
Polynominal Regression

Example
X = [258.0, 270.0, 294.0, 320.0, 342.0, 368.0, 396.0, 446.0, 480.0, 586.0]
y = [236.4, 234.4, 252.8, 298.6, 314.2, 342.2, 360.8, 368.0, 391.2, 390.8]

> > X = [Link]([258.0, 270.0, 294.0, 320.0, 342.0, 368.0, 396.0, 446.0,
480.0, 586.0])[:, [Link]]
y = [Link]([236.4, 234.4, 252.8, 298.6, 314.2, 342.2, 360.8, 368.0,
391.2, 390.8])

> > [Link](X, y, label=’Training points’)

[Link](’X’)
[Link](’y’)
[Link]()
[Link]()

32 / 40
Visualize data

33 / 40
Experiment with Linear Regression

> > from [Link] model import LinearRegression

lr = LinearRegression()
[Link](X, y)

Machine Learning October 7, 2022 34 / 40

Experiment with Linear Regression (cont.)

35 / 40
Experiment with Polynominal Regression

Syntax
from [Link] import PolynomialFeatures

> > from [Link] import PolynomialFeatures

quadratic = PolynomialFeatures(degree=2)
X quad = [Link] transform(X)
pr = LinearRegression()
[Link](X quad, y)

36 / 40
Experiment with Polynominal Regression (cont.)

37 / 40
> > X test = [Link](250, 600, 10)[:, [Link]]

> > y pred linear = [Link](X test)

y pred quad = [Link]([Link] transform(X test))

> > [Link](X, y, label=’Training points’)

[Link](’X’)
[Link](’y’)
[Link](X test, y pred linear, label=’Linear fit’, c=’black’)
[Link](X test, y pred quad, label=’Quadratic fit’, c=’orange’)
[Link]()
[Link]()

38 / 40
Q.M. Phan & N.H. Luong (VNU-HCM UIT) Machine Learning October 7, 2022 39 / 40
Practice

Dataset: ’Boston Housing’ ([Link]) (14 attributes: 13

independent variables + 1 target variable)

File: boston [Link]

40 / 40

Mean Squared Error in Regression
No ratings yet
Mean Squared Error in Regression
40 pages
Chapter04 Training Models
No ratings yet
Chapter04 Training Models
33 pages
Regression
No ratings yet
Regression
25 pages
C1 W2 Lab05 Sklearn GD Soln
No ratings yet
C1 W2 Lab05 Sklearn GD Soln
3 pages
Lecture04. Training Models (Regression in Chapter 4)
No ratings yet
Lecture04. Training Models (Regression in Chapter 4)
44 pages
Linear Regression Assignment Guide
No ratings yet
Linear Regression Assignment Guide
14 pages
MLDL I Linear Regression With Gradient Descent - Ipynb Colaboratory
No ratings yet
MLDL I Linear Regression With Gradient Descent - Ipynb Colaboratory
15 pages
Python Linear Regression Guide
No ratings yet
Python Linear Regression Guide
23 pages
Lecture3 Upload
No ratings yet
Lecture3 Upload
28 pages
DL Assignment
No ratings yet
DL Assignment
5 pages
ML Lab Manual
100% (1)
ML Lab Manual
37 pages
Regression
No ratings yet
Regression
16 pages
GradientDescent-Regression Slides
No ratings yet
GradientDescent-Regression Slides
26 pages
1710993830340
No ratings yet
1710993830340
9 pages
ML Lab File
No ratings yet
ML Lab File
48 pages
Linear Regression
No ratings yet
Linear Regression
91 pages
Linear Regression for Beginners
No ratings yet
Linear Regression for Beginners
36 pages
Implementation of Linear Regression: Sir Syed University of Engineering & Technology, Karachi
No ratings yet
Implementation of Linear Regression: Sir Syed University of Engineering & Technology, Karachi
11 pages
Linear Regression
No ratings yet
Linear Regression
18 pages
Linear Regression
No ratings yet
Linear Regression
8 pages
Machine Learning Assignment Guide
No ratings yet
Machine Learning Assignment Guide
2 pages
Stochastic Gradient Descent in Python
No ratings yet
Stochastic Gradient Descent in Python
8 pages
Machine Learning Lab (3) Report (21 CP 81)
No ratings yet
Machine Learning Lab (3) Report (21 CP 81)
7 pages
Python Regression Techniques Explained
No ratings yet
Python Regression Techniques Explained
35 pages
Lecture Notes 5 Linear Regression
No ratings yet
Lecture Notes 5 Linear Regression
11 pages
Linear Regression Lab: Methods & Examples
100% (1)
Linear Regression Lab: Methods & Examples
18 pages
Updating Weight
No ratings yet
Updating Weight
9 pages
Linear Regression Practice Lab Guide
No ratings yet
Linear Regression Practice Lab Guide
51 pages
Linear Regression with Scikit-Learn
No ratings yet
Linear Regression with Scikit-Learn
3 pages
Chapter 6 - Advanced Machine Learning PDF
No ratings yet
Chapter 6 - Advanced Machine Learning PDF
37 pages
Module3 Ch1
No ratings yet
Module3 Ch1
83 pages
CH - En.u4cse19101 Cheduri Linearregression
No ratings yet
CH - En.u4cse19101 Cheduri Linearregression
8 pages
PRCV Practical File
No ratings yet
PRCV Practical File
24 pages
C1 W2 Lab02 Multiple Variable Soln
No ratings yet
C1 W2 Lab02 Multiple Variable Soln
11 pages
Linear Regression Practice Lab Guide
No ratings yet
Linear Regression Practice Lab Guide
14 pages
Linear Regression - Numpy and Sklearn
No ratings yet
Linear Regression - Numpy and Sklearn
7 pages
Linear - Regression - SGD
No ratings yet
Linear - Regression - SGD
71 pages
1.1 ID5059 1.2 Tom Kelsey - Jan 2021: February 15, 2021
No ratings yet
1.1 ID5059 1.2 Tom Kelsey - Jan 2021: February 15, 2021
43 pages
ML TW-PW 02-2
No ratings yet
ML TW-PW 02-2
9 pages
Unit-III Advanced Machine Learning
No ratings yet
Unit-III Advanced Machine Learning
8 pages
Linear Regression for Data Science Students
No ratings yet
Linear Regression for Data Science Students
21 pages
Wk05 Machine Learning
No ratings yet
Wk05 Machine Learning
6 pages
Linear Regression
No ratings yet
Linear Regression
19 pages
Assignment 1
No ratings yet
Assignment 1
3 pages
Linear Regression Exercise Guide
100% (1)
Linear Regression Exercise Guide
3 pages
Lab Experiments Vi Sem-1
No ratings yet
Lab Experiments Vi Sem-1
10 pages
Col774 Ass1 v1
No ratings yet
Col774 Ass1 v1
5 pages
Lecture - 4 - Logistic Regression
No ratings yet
Lecture - 4 - Logistic Regression
62 pages
HCIA-AI Machine Learning Lab Guide
No ratings yet
HCIA-AI Machine Learning Lab Guide
82 pages
COL774 Machine Learning Practice Problems
No ratings yet
COL774 Machine Learning Practice Problems
22 pages
MD - Sajedul Islam - Assaignment - 01
No ratings yet
MD - Sajedul Islam - Assaignment - 01
10 pages
Approach and Code Explanation
No ratings yet
Approach and Code Explanation
3 pages
Linear Regression Techniques
No ratings yet
Linear Regression Techniques
25 pages
Lab5 Linear Regression
No ratings yet
Lab5 Linear Regression
1 page
Multiple Linear Regression Guide
No ratings yet
Multiple Linear Regression Guide
7 pages
Machine Learning Overview and Techniques
No ratings yet
Machine Learning Overview and Techniques
12 pages
ML Labs
No ratings yet
ML Labs
46 pages
Linear Regression with Python OLS
No ratings yet
Linear Regression with Python OLS
23 pages
737 MAX Phase 3A
100% (1)
737 MAX Phase 3A
5 pages
B737 MAX ATA - 00 Introduction
100% (3)
B737 MAX ATA - 00 Introduction
86 pages
B737 MAX Panel Diagrams
100% (4)
B737 MAX Panel Diagrams
5 pages
Free Acupuncture Ebooks Download
No ratings yet
Free Acupuncture Ebooks Download
324 pages
AN12282 Powerquad DSP
No ratings yet
AN12282 Powerquad DSP
22 pages
IB Math AIHL Matrices Exam
No ratings yet
IB Math AIHL Matrices Exam
20 pages
Unit 5 Post Assessment Study Guide
No ratings yet
Unit 5 Post Assessment Study Guide
6 pages
Strip and Circular Footings On A Mohr-Coulomb Material
No ratings yet
Strip and Circular Footings On A Mohr-Coulomb Material
12 pages
Statistics For The Behavioral Sciences Frederick J. Gravetter Full Access
No ratings yet
Statistics For The Behavioral Sciences Frederick J. Gravetter Full Access
66 pages
2013 PMWC - Individual
No ratings yet
2013 PMWC - Individual
3 pages
Decimal Worksheets
No ratings yet
Decimal Worksheets
70 pages
Pom Intro 12 Jan
No ratings yet
Pom Intro 12 Jan
14 pages
Algebra Class Exercises and Solutions
No ratings yet
Algebra Class Exercises and Solutions
3 pages
Bayesian Segnet: Model Uncertainty in Deep Convolutional Encoder-Decoder Architectures For Scene Understanding
No ratings yet
Bayesian Segnet: Model Uncertainty in Deep Convolutional Encoder-Decoder Architectures For Scene Understanding
11 pages
Solution Outlines For Chapter 7
No ratings yet
Solution Outlines For Chapter 7
5 pages
Uam - PPT Green
No ratings yet
Uam - PPT Green
15 pages
Introduction To FACTS Controllers: A Technological Literature Survey
No ratings yet
Introduction To FACTS Controllers: A Technological Literature Survey
42 pages
Derivatives in Math & Real Life
No ratings yet
Derivatives in Math & Real Life
10 pages
Exploratory, Descriptive, and Causal Research Designs
No ratings yet
Exploratory, Descriptive, and Causal Research Designs
26 pages
OM2E Chapter12
No ratings yet
OM2E Chapter12
41 pages
German Malaysian Institute Department of Industrial Electronic
No ratings yet
German Malaysian Institute Department of Industrial Electronic
11 pages
Technical Report Lecture Notes 17092023
No ratings yet
Technical Report Lecture Notes 17092023
20 pages
Physics-Based Learning Models For Ship Hydrodynamics
No ratings yet
Physics-Based Learning Models For Ship Hydrodynamics
22 pages
Aptitude Number System PDF
No ratings yet
Aptitude Number System PDF
5 pages
Scilab Plot2D Guide for Beginners
No ratings yet
Scilab Plot2D Guide for Beginners
8 pages
Optimal Control Textbook Download
No ratings yet
Optimal Control Textbook Download
63 pages
Solve
No ratings yet
Solve
5 pages
Adobe Scan 13 Jan 2025
No ratings yet
Adobe Scan 13 Jan 2025
5 pages
AP Biology Formula Sheets
No ratings yet
AP Biology Formula Sheets
2 pages
Complex Project Management Critique
No ratings yet
Complex Project Management Critique
7 pages
Maths A Level As Chapter 1
No ratings yet
Maths A Level As Chapter 1
37 pages
Distribusi Kerugian Agregat Asuransi Kendaraan
No ratings yet
Distribusi Kerugian Agregat Asuransi Kendaraan
8 pages
Shallow Foundation Design Guide
No ratings yet
Shallow Foundation Design Guide
107 pages
EE2001 Tutorial 5
No ratings yet
EE2001 Tutorial 5
9 pages

LinearRegression Tutorial

Uploaded by

LinearRegression Tutorial

Uploaded by

Linear Regression

University of Information Technology

numpy → very frequently used in ML (python)

> > import numpy as np

matplotlib → for visualization

> > import [Link] as plt

> > from [Link] import make regression

> > [Link](X, y, facecolor=’tab:blue’, edgecolor=’white’, s=70)

Figure: The general concept of Linear Regression

Cost function (Squared Error):

Update the weights:

Algorithm 1 Gradient Descent

class LinearRegression GD:

def predict(self, X):

def fit(self, X, y):

def fit(self, X, y):

> > [Link](range(1, len(reg [Link]) + 1), reg [Link])

> > [Link](X, y, facecolor=’tab:blue’, edgecolor=’white’, s=70)

> > w GD = reg GD.w

Stochastic Gradient Descent

Hyperparameters Parameters Methods

Stochastic Gradient Descent

Stochastic Gradient Descent

> > from [Link] model import LinearRegression

Gradient Descent (ours)

Stochastic Gradient Descent

> > [Link](X, y, facecolor=’tab:blue’, edgecolor=’white’, s=70)

Mean Absolute Error (MAE)

Mean Squared Error (MSE)

> > from [Link] import mean absolute error as MAE

> > y pred GD = reg [Link](X)

> > y pred SGD = reg [Link](X)

> > y pred NE = reg [Link](X)

Mean Absolute Error

Mean Squared Error

> > [Link](X, y, label=’Training points’)

> > from [Link] model import LinearRegression

Machine Learning October 7, 2022 34 / 40

> > from [Link] import PolynomialFeatures

> > y pred linear = [Link](X test)

> > [Link](X, y, label=’Training points’)

Dataset: ’Boston Housing’ ([Link]) (14 attributes: 13

File: boston [Link]

You might also like