0% found this document useful (0 votes)

158 views14 pages

Regularization

This chapter discusses various regularization techniques for deep learning models including L2 and L1 parameter regularization, dataset augmentation, noise injection, early stopping, and semi-supervised learning. It explains how regularization works to reduce overfitting by adding bias to increase generalization. Specific techniques covered include weight decay, dropout, adversarial training, and modifying optimization objectives.

Uploaded by

Sai Sumanth P

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

158 views14 pages

Regularization

Uploaded by

Sai Sumanth P

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 14

Chapter 7:

Regularization for
Deep Learning

Deep Learning Textbook Study Group, SF

Safak Ozkan
April 15, 2017

1 Safak Ozkan
Chapter 7: Regularization for Deep Learning

L2 Parameter Regularization
L1 Parameter Regularization
Norm Penalties and Constrained Optimization
Regularization and Under-Constrained Problems
Dataset Augmentation
Noise Robustness
Injecting Noise at Output Targets
Early Stopping
Semi Supervised Learning
Multi-Task Learning
Parameter Tying and Parameter Sharing
Bagging and Other Ensemble Methods
Dropout
Adversarial Training
Tangent Distance, Manifold Tangent Classifier
2 of 13 Safak Ozkan
Definition

Regularization is any modification we make to a

learning algorithm that is intended to reduce its
test error but NOT its training error.

Etrain : Training Error Etest : Test Error

(or Generalization Error)

3 of 13 Safak Ozkan
L2 Regularization
(a.k.a. Weight decay, Tikhonov regularization, Ridge regression)

Regularization increases bias and reduces variance.

Regularization
parameter

Regularized Regularization term

cost function Unregularized
Cost function

Gradient Descent update rule:

Additional term

4 of 13 Safak Ozkan
L2 Regularization

Lagrangian Constrained Optimization

Lagrangian
multiplier

is equivalent to optimizing
such that .

5 of 13 Safak Ozkan
L2 Regularization

Lagrangian Constrained Optimization

We typically dont set explicitly,
We set .

Unregularized
solution

Regularized Large small

solution constraint region

Large

6 of 13 Safak Ozkan
L2 Regularization

2nd degree Taylor Approximation of around :

unregularized
problem

At ,

Analysis through e-vector decomposition

Stretching in i th small eigen-directions will be affected

eigen direction: more than larger eigen-directions.

7 of 13 Safak Ozkan
L2 Regularization
Normal Equations for Linear Regression

Assume:

Then, would shrink

more than components.

covariance of input features

covariance of
with the target values.
input features

regularization causes the learning algorithm to

perceive the input with increased variance.

8 of 13 Safak Ozkan
L1 Regularization
(a.k.a. LASSO)

Regularization
Term

2nd degree Taylor Approximation

of around :

(Induces
Sparsity)

9 of 13 Safak Ozkan
Under-Constrained Problems
E.g. Logistic Regression

Linearly non seperable Linearly separable

Well behaved problem. Under-determined problem.

( will continue to increase
in a GD Algorithm)

10 of 13 Safak Ozkan
Data Augmentation
Best way to improve generalization of a model is
to train it on more data.
Data Augmentation works particularly well for
Object Recognition tasks.
Injecting noise to input works well for
Speech Recognition.
Affine Elastic
Distortion Noise Deformation
Original
Input Image

Horizontal Random Hue

Flip Translation Shift

11 of 13 Safak Ozkan
Noise Robustness
Addition of noise with a small variance is
equivalent to imposing norm penalty on weights.
Noise on weights: A stochastic implementation of
Bayesian Inference (uncertainty on weights are
represented by a probability distribution)

For each input data,

apply noise on weights

modified cost
function

regularization term

12 of 13 Safak Ozkan
Early Stopping

regularization
number of parameter
learning rate
steps
13 of 13 Safak Ozkan
Early Stopping
HAPTER 7. REGULARIZATION FOR DEEP LEARNING
Early stopping: Terminate while validation set
performance is better

0.20
Loss (negative log-likelihood)

Training set loss

0.15 Validation set loss

0.10

0.05

0.00
0 50 100 150 200 250
Time (epochs)

gure 7.3: Learning curves showing how the negative log-likelihood loss changes o
14 of 13 Safak Ozkan

Unit 2.3
No ratings yet
Unit 2.3
43 pages
Regularization
No ratings yet
Regularization
46 pages
07 Regularization
No ratings yet
07 Regularization
51 pages
Module - 2 Ver 1.4
No ratings yet
Module - 2 Ver 1.4
35 pages
Parameter Norm Penalties
No ratings yet
Parameter Norm Penalties
6 pages
NN&DL Unit-IV Regularization For Deep Learning
No ratings yet
NN&DL Unit-IV Regularization For Deep Learning
16 pages
U4 PDF
No ratings yet
U4 PDF
18 pages
S10 DNN Regularization Wip
No ratings yet
S10 DNN Regularization Wip
11 pages
5-Introduction To regularization-03-Aug-2020Material - I - 03-Aug-2020 - Module3 - Regularization
No ratings yet
5-Introduction To regularization-03-Aug-2020Material - I - 03-Aug-2020 - Module3 - Regularization
10 pages
Regularization in Machine Learning
No ratings yet
Regularization in Machine Learning
17 pages
Regularization For Deep Learning: Tsz-Chiu Au Chiu@unist - Ac.kr
No ratings yet
Regularization For Deep Learning: Tsz-Chiu Au Chiu@unist - Ac.kr
100 pages
Deep Learning Regularization Guide
No ratings yet
Deep Learning Regularization Guide
77 pages
4th Unit DL Final Class Notes
No ratings yet
4th Unit DL Final Class Notes
68 pages
Deep Learning Basics Lecture 4 Regularization II
No ratings yet
Deep Learning Basics Lecture 4 Regularization II
27 pages
Unit - 4 REGULARIZATION FOR DEEP LEARNING
No ratings yet
Unit - 4 REGULARIZATION FOR DEEP LEARNING
56 pages
Regularization
No ratings yet
Regularization
74 pages
Regularization in Cost Functions
No ratings yet
Regularization in Cost Functions
32 pages
The Problem of Overfitting: Overfitting With Linear Regression
No ratings yet
The Problem of Overfitting: Overfitting With Linear Regression
32 pages
What Is Regularization.
No ratings yet
What Is Regularization.
10 pages
12-Regularization For Deep Learning-17!08!2024
No ratings yet
12-Regularization For Deep Learning-17!08!2024
51 pages
Regularization: Swetha V, Research Scholar
No ratings yet
Regularization: Swetha V, Research Scholar
32 pages
Module 3 - 3
No ratings yet
Module 3 - 3
93 pages
Unit Ii
No ratings yet
Unit Ii
8 pages
Overfitting in Linear Regression
No ratings yet
Overfitting in Linear Regression
8 pages
DL Unit 4
No ratings yet
DL Unit 4
15 pages
CM20315 09 Regularization
No ratings yet
CM20315 09 Regularization
44 pages
Regularization Techniques in Deep Learning
No ratings yet
Regularization Techniques in Deep Learning
30 pages
UNIT LV
No ratings yet
UNIT LV
8 pages
Deep Learning Regularization Techniques
No ratings yet
Deep Learning Regularization Techniques
56 pages
07: Regularization: The Problem of Overfitting
No ratings yet
07: Regularization: The Problem of Overfitting
5 pages
Unit 4
No ratings yet
Unit 4
93 pages
Regularization
No ratings yet
Regularization
7 pages
Deep Learning Regularization Lecture
No ratings yet
Deep Learning Regularization Lecture
79 pages
Aa New
No ratings yet
Aa New
15 pages
L1, L2andBatchnormalization (1) T1754749408264
No ratings yet
L1, L2andBatchnormalization (1) T1754749408264
9 pages
Unit Iv NNHDL
No ratings yet
Unit Iv NNHDL
15 pages
DL Unit 3
No ratings yet
DL Unit 3
59 pages
Understanding Regularization in Machine Learning
No ratings yet
Understanding Regularization in Machine Learning
13 pages
UNIT-II Regularization in Deep Learning
No ratings yet
UNIT-II Regularization in Deep Learning
24 pages
L11+ Regularization
No ratings yet
L11+ Regularization
24 pages
LECTURE#9 EE258 F22 Part2 Draft v1
No ratings yet
LECTURE#9 EE258 F22 Part2 Draft v1
14 pages
Lecture 05 - Regularization - 4p
No ratings yet
Lecture 05 - Regularization - 4p
21 pages
Regularization: L1, L2 & Dropout
No ratings yet
Regularization: L1, L2 & Dropout
49 pages
Chap 7-1 Regularization For Deep Learning-Keonwoo Noh
No ratings yet
Chap 7-1 Regularization For Deep Learning-Keonwoo Noh
41 pages
03 Reg Slides
No ratings yet
03 Reg Slides
64 pages
Regularization
No ratings yet
Regularization
19 pages
DL 3 Regularization
No ratings yet
DL 3 Regularization
50 pages
DL UNIT 3 - Part1
No ratings yet
DL UNIT 3 - Part1
27 pages
Unit - 4-NNDL - Notes
No ratings yet
Unit - 4-NNDL - Notes
14 pages
Regularisation in Machine Learning Models
No ratings yet
Regularisation in Machine Learning Models
79 pages
Regularization for Overfitting Prevention
No ratings yet
Regularization for Overfitting Prevention
7 pages
465-Lecture 10-11
No ratings yet
465-Lecture 10-11
79 pages
DL Unit 1
No ratings yet
DL Unit 1
5 pages
Regularization in ML
No ratings yet
Regularization in ML
2 pages
Regularization
No ratings yet
Regularization
8 pages
Unit-2 L2
No ratings yet
Unit-2 L2
22 pages
MSR (Initialization Better Than Xavier)
No ratings yet
MSR (Initialization Better Than Xavier)
9 pages
Delving Deep Into Rectifiers: Surpassing Human-Level Performance On Imagenet Classification
No ratings yet
Delving Deep Into Rectifiers: Surpassing Human-Level Performance On Imagenet Classification
11 pages
Neural Network Based Energy Efficient Clustering and Routing in Wireless Sensor Networks
No ratings yet
Neural Network Based Energy Efficient Clustering and Routing in Wireless Sensor Networks
6 pages
Cloud Based Big Data Analytics Framework For Face Recognition in Social Networks Using Machine Learning 2015 Procedia Computer Science
No ratings yet
Cloud Based Big Data Analytics Framework For Face Recognition in Social Networks Using Machine Learning 2015 Procedia Computer Science
8 pages
10 SLS I Key
No ratings yet
10 SLS I Key
1 page
Sat 2004 Maths Questions
No ratings yet
Sat 2004 Maths Questions
3 pages
Sumagang Heirs' Reconveyance Claim Barred
No ratings yet
Sumagang Heirs' Reconveyance Claim Barred
2 pages
English 9 Quarter 3 Mastery Report
No ratings yet
English 9 Quarter 3 Mastery Report
32 pages
Daten No Inugami - SLASHDØG - 3 High School D×D Universe en
No ratings yet
Daten No Inugami - SLASHDØG - 3 High School D×D Universe en
177 pages
Tips - Byzantium An Introduction To East Roman Civilizati PDF
No ratings yet
Tips - Byzantium An Introduction To East Roman Civilizati PDF
514 pages
Wealth and Love in The Sign of Four
No ratings yet
Wealth and Love in The Sign of Four
1 page
Eng 402
No ratings yet
Eng 402
147 pages
Persistent Girl As National Propaganda Storytelling and The Emulation of Ethnic Model in Heroic Little Sisters of The Grassland
No ratings yet
Persistent Girl As National Propaganda Storytelling and The Emulation of Ethnic Model in Heroic Little Sisters of The Grassland
19 pages
Field Guide To Butterflies of The San Francisco Bay and Sacramento Valley Regions (Arthur M. Shapiro, Timothy D. Manolis) (Z-Library)
50% (2)
Field Guide To Butterflies of The San Francisco Bay and Sacramento Valley Regions (Arthur M. Shapiro, Timothy D. Manolis) (Z-Library)
425 pages
Updates On CRG Issuances: Republic of The Philippines Philippine Statistics Authority
No ratings yet
Updates On CRG Issuances: Republic of The Philippines Philippine Statistics Authority
38 pages
ABP3 Intoxmetalespesados
No ratings yet
ABP3 Intoxmetalespesados
18 pages
Storytelling - Manipulation of The Audience
No ratings yet
Storytelling - Manipulation of The Audience
71 pages
HDD Pulling Loads: Theory vs. Reality
100% (1)
HDD Pulling Loads: Theory vs. Reality
7 pages
Statics and Dynamics Lecture Notes
100% (1)
Statics and Dynamics Lecture Notes
213 pages
Blueberry Scones - Cookie and Kate
No ratings yet
Blueberry Scones - Cookie and Kate
3 pages
NB GD
No ratings yet
NB GD
11 pages
Vlasons Vs CA
No ratings yet
Vlasons Vs CA
3 pages
Midterm IMT
No ratings yet
Midterm IMT
3 pages
Court No. - 89 Case:-Revisionist: - Opposite Party: - Counsel For Revisionist: - Counsel For Opposite Party: - Hon'ble Sameer Jain, J
No ratings yet
Court No. - 89 Case:-Revisionist: - Opposite Party: - Counsel For Revisionist: - Counsel For Opposite Party: - Hon'ble Sameer Jain, J
2 pages
Scrum Roles and Practices Guide
No ratings yet
Scrum Roles and Practices Guide
2 pages
Robbery-Homicide Case Verdict 1964
67% (3)
Robbery-Homicide Case Verdict 1964
2 pages
Pressure Measurement Instrumentation Guide
No ratings yet
Pressure Measurement Instrumentation Guide
3 pages
Grade 1 MTB Daily Lesson Log
No ratings yet
Grade 1 MTB Daily Lesson Log
6 pages
Kavaratzis TM Pre-Proof Author
No ratings yet
Kavaratzis TM Pre-Proof Author
16 pages
XII A Physics Project 2023-24
No ratings yet
XII A Physics Project 2023-24
11 pages
Understanding Christian Morality
No ratings yet
Understanding Christian Morality
12 pages
Crafting a Definition Essay
100% (2)
Crafting a Definition Essay
6 pages
Maryama Sarauniya Book Complete by Ummi Aisha .PDF by Sufi - Com.ng
No ratings yet
Maryama Sarauniya Book Complete by Ummi Aisha .PDF by Sufi - Com.ng
214 pages
Robert I Binnick (1979) : Modern Mongolian: A Transformational Syntax
100% (2)
Robert I Binnick (1979) : Modern Mongolian: A Transformational Syntax
86 pages
1 F Are Neighbours Necessary 2
No ratings yet
1 F Are Neighbours Necessary 2
1 page
Nature The Gentlest Mother
100% (12)
Nature The Gentlest Mother
4 pages