0% found this document useful (0 votes)

135 views5 pages

Gradient Descent Deep Learning Lecture

The presentation covers Gradient Descent, an optimization algorithm crucial for training neural networks by minimizing the loss function. It discusses various types of Gradient Descent, including Batch, Stochastic, and Mini-Batch, along with advanced optimization techniques like Momentum and Adam Optimizer. Key challenges and practical tips for effective implementation are also highlighted.

Uploaded by

Ahsan Ullah

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

135 views5 pages

Gradient Descent Deep Learning Lecture

Uploaded by

Ahsan Ullah

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 5

PowerPoint Lecture: Gradient Descent in Deep Learning

Slide 1: Title Slide

Gradient Descent Gradient
Subtitle: The Engine Behind Model Training
Presenter: [Ahsan Ullah]
Institution: [Your Institution]
Date: [Presentation Date]

Slide 2: Objectives

 Understand what Gradient Descent is

 Learn how it works in neural networks

 Explore different types of Gradient Descent

 Analyze performance and optimization strategies

Slide 3: Introduction to Optimization

Optimization is the process of finding the best parameters (weights) for a model that minimizes
the loss function.

Slide 4: What is Gradient Descent?

Definition: Gradient Descent is an optimization algorithm used to minimize the loss function by
iteratively moving towards the minimum value.
Goal: Adjust weights to minimize the error (loss).

Slide 5: The Gradient

 The gradient is a vector of partial derivatives.

 It points in the direction of the greatest rate of increase of a function.

 To minimize the function, move in the opposite direction of the gradient.

Slide 6: Mathematical Formulation
Weight Update Rule:

Where:

 : weights

 : learning rate

 : gradient of the loss function with respect to weights

Slide 7: Learning Rate ()

 Controls how big a step is taken in the direction of the negative gradient

 Too large: may overshoot the minimum

 Too small: slow convergence or stuck in local minima

Slide 8: Visual Representation

Show a graph of a convex loss function with steps of gradient descent moving toward the
minimum

Slide 9: Types of Gradient Descent

1. Batch Gradient Descent

2. Stochastic Gradient Descent (SGD)

3. Mini-Batch Gradient Descent

Slide 10: Batch Gradient Descent

 Uses the entire training dataset to compute the gradient

 Pros: Stable convergence

 Cons: Slow and memory-intensive for large datasets

Slide 11: Stochastic Gradient Descent (SGD)

 Updates weights using one training example at a time

 Pros: Fast and can escape local minima

 Cons: Noisy updates, less stable convergence

Slide 12: Mini-Batch Gradient Descent

 Uses small batches of data (e.g., 32, 64) for each update

 Pros: Balance between speed and accuracy

 Common in deep learning

Slide 13: Gradient Descent in Neural Networks

 Used during backpropagation to update weights

 Repeats for each epoch to gradually reduce loss

 Works with different loss functions depending on task (e.g., MSE, Cross-Entropy)

Slide 14: Challenges of Gradient Descent

 Local Minima and Saddle Points

 Vanishing and Exploding Gradients

 Learning Rate Scheduling

Slide 15: Advanced Optimization Techniques

 Momentum

 RMSProp

 Adam Optimizer

 Nesterov Accelerated Gradient

Slide 16: Momentum

 Adds a fraction of the previous update to the current one

 Helps accelerate convergence and dampen oscillations

Slide 17: Adam Optimizer

 Combines Momentum and RMSProp

 Adaptive learning rates for each parameter

 Popular choice in deep learning tasks

Slide 18: Gradient Clipping

 Restricts the magnitude of gradients

 Helps prevent exploding gradients

Slide 19: Learning Rate Scheduling

 Adjusts learning rate during training

 Common strategies: Step Decay, Exponential Decay, Reduce on Plateau

Slide 20: Example Code (Keras - Adam)

from keras.optimizers import Adam

model.compile(optimizer=Adam(learning_rate=0.001), loss='categorical_crossentropy',
metrics=['accuracy'])

Slide 21: Practical Tips

 Always normalize data

 Monitor loss and accuracy plots

 Use validation set to tune hyperparameters

 Try multiple optimizers

Slide 22: Summary

 Gradient Descent is central to training neural networks

 Different variants offer trade-offs in speed and accuracy

 Proper tuning is essential for model performance

An Overview of Gradient Descent Optimization Algorithms PDF
No ratings yet
An Overview of Gradient Descent Optimization Algorithms PDF
12 pages
S09 DNN Gradients Wip
No ratings yet
S09 DNN Gradients Wip
28 pages
Gradient Descent - PR
No ratings yet
Gradient Descent - PR
31 pages
Technical Writing
No ratings yet
Technical Writing
8 pages
Technical Writing
No ratings yet
Technical Writing
9 pages
Gradient Descent Optimization Guide
No ratings yet
Gradient Descent Optimization Guide
9 pages
WINSEM2024-25 CSE4006 ETH AP2024254000693 2025-01-08 Reference-Material-I
No ratings yet
WINSEM2024-25 CSE4006 ETH AP2024254000693 2025-01-08 Reference-Material-I
40 pages
Lecture 5
No ratings yet
Lecture 5
34 pages
DL Test-2
No ratings yet
DL Test-2
28 pages
Gradient Descent for ML Experts
No ratings yet
Gradient Descent for ML Experts
5 pages
Gradient Descent for Deep Learning
No ratings yet
Gradient Descent for Deep Learning
21 pages
Gradient Descent Algorithm Is A First
No ratings yet
Gradient Descent Algorithm Is A First
5 pages
Gradient-Based Optimizers
No ratings yet
Gradient-Based Optimizers
54 pages
Lesson 4 Gradient Descent
No ratings yet
Lesson 4 Gradient Descent
13 pages
Unit 2.a Optimzer
No ratings yet
Unit 2.a Optimzer
10 pages
SGD 1
No ratings yet
SGD 1
86 pages
Gradient Descent Presentation
No ratings yet
Gradient Descent Presentation
26 pages
Gradient Descent for ML Practitioners
No ratings yet
Gradient Descent for ML Practitioners
2 pages
Gradient Descent for ML Practitioners
No ratings yet
Gradient Descent for ML Practitioners
27 pages
Gradient Descent
No ratings yet
Gradient Descent
2 pages
Lecture 4
No ratings yet
Lecture 4
46 pages
Neural Network Optimization Tactics
No ratings yet
Neural Network Optimization Tactics
20 pages
Lec 4
No ratings yet
Lec 4
32 pages
Module 2
No ratings yet
Module 2
67 pages
Gradient Descent
No ratings yet
Gradient Descent
13 pages
Maths
No ratings yet
Maths
13 pages
Gradient Descent
No ratings yet
Gradient Descent
8 pages
DNNTrain3 Printable
No ratings yet
DNNTrain3 Printable
251 pages
DL Module 2 1 (Sami)
No ratings yet
DL Module 2 1 (Sami)
17 pages
Gradient Descent A Fundamental Optimization Algorithm
No ratings yet
Gradient Descent A Fundamental Optimization Algorithm
30 pages
Gradient Descent Method
No ratings yet
Gradient Descent Method
12 pages
Types of Gradient Descent
No ratings yet
Types of Gradient Descent
9 pages
Linear Models-Gradient Descent, Regularization (Introduction)
No ratings yet
Linear Models-Gradient Descent, Regularization (Introduction)
26 pages
Ch2-Training, Optimization and Regularization of DNN-new
No ratings yet
Ch2-Training, Optimization and Regularization of DNN-new
114 pages
Deep Learning Optimizers Explained
No ratings yet
Deep Learning Optimizers Explained
20 pages
Lecture 4
No ratings yet
Lecture 4
45 pages
Deep Neural Networks
No ratings yet
Deep Neural Networks
48 pages
Optimization Gradient Descent
No ratings yet
Optimization Gradient Descent
13 pages
Chapter 8-Deep Learning Book
No ratings yet
Chapter 8-Deep Learning Book
27 pages
DL Exp2
No ratings yet
DL Exp2
6 pages
PCA and Convex Optimization and Bias, Variance-2
No ratings yet
PCA and Convex Optimization and Bias, Variance-2
29 pages
Deep Neural Network Optimization Techniques
No ratings yet
Deep Neural Network Optimization Techniques
23 pages
DL U-I Introduction Part-2
No ratings yet
DL U-I Introduction Part-2
48 pages
Asdfvvasdfr
No ratings yet
Asdfvvasdfr
1 page
Module 4 Lab 3
No ratings yet
Module 4 Lab 3
6 pages
Unit 2
No ratings yet
Unit 2
19 pages
Lesson 4 Training ANNs
No ratings yet
Lesson 4 Training ANNs
34 pages
L5 - UCLxDeepMind DL2020
No ratings yet
L5 - UCLxDeepMind DL2020
52 pages
Cours 5
No ratings yet
Cours 5
23 pages
Adam Optimizer
No ratings yet
Adam Optimizer
22 pages
Chapter 4
No ratings yet
Chapter 4
33 pages
Unit-Ii (Ml-I)
No ratings yet
Unit-Ii (Ml-I)
81 pages
Understanding Gradient Descent in ML
No ratings yet
Understanding Gradient Descent in ML
20 pages
04-NN Training GoodF
No ratings yet
04-NN Training GoodF
82 pages
Lect 6
No ratings yet
Lect 6
60 pages
Machine Learning Optimization Techniques
No ratings yet
Machine Learning Optimization Techniques
37 pages
Network Flow DAA
No ratings yet
Network Flow DAA
22 pages
QuickSort (With Code in Python-C++-Java-C)
No ratings yet
QuickSort (With Code in Python-C++-Java-C)
13 pages
Numerical Methods Complete Notes
No ratings yet
Numerical Methods Complete Notes
3 pages
III Sem Assignment 4 Cse PDF
No ratings yet
III Sem Assignment 4 Cse PDF
1 page
G8 MIMs # 5 - WEEK 1 - 1st QUARTER
No ratings yet
G8 MIMs # 5 - WEEK 1 - 1st QUARTER
3 pages
Business Analytic Shubham Jindal
No ratings yet
Business Analytic Shubham Jindal
11 pages
19 Newton Method
No ratings yet
19 Newton Method
10 pages
Graphical Method
No ratings yet
Graphical Method
23 pages
Math Worksheets+mock Test
No ratings yet
Math Worksheets+mock Test
9 pages
Linear Programming Review Questions
No ratings yet
Linear Programming Review Questions
3 pages
Informed Search
No ratings yet
Informed Search
106 pages
Gauss Elmination and Gauss Jordan Operations Count
No ratings yet
Gauss Elmination and Gauss Jordan Operations Count
33 pages
Adobe Scan Dec 17, 2023
No ratings yet
Adobe Scan Dec 17, 2023
1 page
Unit 3
No ratings yet
Unit 3
29 pages
Design and Analysis of Algorithms 2020
No ratings yet
Design and Analysis of Algorithms 2020
2 pages
Gold Resource Estimation via Surface Integral
No ratings yet
Gold Resource Estimation via Surface Integral
7 pages
DAA Approximation Algorithms
No ratings yet
DAA Approximation Algorithms
32 pages
Ch-2 Practice Worksheet of Mathematics
No ratings yet
Ch-2 Practice Worksheet of Mathematics
3 pages
CSEC-Add-Maths-2012-May Solutions - Watermark
No ratings yet
CSEC-Add-Maths-2012-May Solutions - Watermark
27 pages
10 Polynomials
No ratings yet
10 Polynomials
17 pages
BEC 2304 Operations Research 1 Year III Semester I-1
No ratings yet
BEC 2304 Operations Research 1 Year III Semester I-1
4 pages
St. Xavier'S School Nevta: Holiday Homework 2022-23
No ratings yet
St. Xavier'S School Nevta: Holiday Homework 2022-23
2 pages
LKPD 1 BK - Sorting
No ratings yet
LKPD 1 BK - Sorting
8 pages
Che 502 - Process Optimization Quiz 1 20232024
No ratings yet
Che 502 - Process Optimization Quiz 1 20232024
1 page
Applications of Backtracking
No ratings yet
Applications of Backtracking
2 pages
Worksheet - 01 Topic: Polynomials: Class: X Subject: Mathematics
No ratings yet
Worksheet - 01 Topic: Polynomials: Class: X Subject: Mathematics
2 pages
E1251 Aug 3:0 Linear and Nonlinear Optimization: Instructor
No ratings yet
E1251 Aug 3:0 Linear and Nonlinear Optimization: Instructor
2 pages
K-means Clustering Overview
No ratings yet
K-means Clustering Overview
49 pages
Analysis of Algorithm
100% (1)
Analysis of Algorithm
5 pages
Polynomials Chap 2
No ratings yet
Polynomials Chap 2
4 pages