Open navigation menu

Scribd

0% found this document useful (0 votes)

29 views17 pages

Lecture 22 - Value Function Approximation

The document outlines a lecture on Value Function Approximation in Reinforcement Learning, covering key topics such as Monte Carlo Learning, Temporal Difference Learning, and Q Learning. It emphasizes the importance of Gradient Descent and Stochastic Gradient Descent in the context of linear value function approximation. Additionally, it discusses the differences between tabular methods and approximation methods, and the use of neural networks as function approximators.

Uploaded by

Copyright

© © All Rights Reserved

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

29 views17 pages

Lecture 22 - Value Function Approximation

The document outlines a lecture on Value Function Approximation in Reinforcement Learning, covering key topics such as Monte Carlo Learning, Temporal Difference Learning, and Q Learning. It emphasizes the importance of Gradient Descent and Stochastic Gradient Descent in the context of linear value function approximation. Additionally, it discusses the differences between tabular methods and approximation methods, and the use of neural networks as function approximators.

Uploaded by

Copyright

© © All Rights Reserved

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

AI-832 Reinforcement Learning

Instructor: Dr. Zuhair Zafar

Lecture # 22: Value Function Approximation

Recap

• Monte Carlo Learning

• Prediction

• Control

• Temporal Difference Learning

• Prediction

• TD (0), n-step TD, lambda return, TD(lambda)

• Control (On-policy Learning)

• SARSA (0), n-step SARSA, SARSA (Lambda), Expected SARSA

• Q Learning (Off-policy Learning)

Today’s Agenda

• Value Function Approximation

• Gradient Descent

• Stochastic Gradient Descent

• Linear Value Function Approximation

Large-Scale Reinforcement Learning
Large-Scale Reinforcement Learning
Value Function Approximation
Types of Value Function Approximation
Tabular Methods vs. Approximation Methods

Monte Carlo / Temporal Difference Learning

Neural Network
Which Function Approximator?
Which Function Approximator?
Today’s Agenda

• Value Function Approximation

• Gradient Descent

• Stochastic Gradient Descent

• Linear Value Function Approximation

Gradient Descent
Value Function Approx. By Stochastic Gradient Descent
Today’s Agenda

• Value Function Approximation

• Gradient Descent

• Stochastic Gradient Descent

• Linear Value Function Approximation

Feature Vectors
Linear Value Function Approximation
Table Lookup Features

You might also like

Lnotes 05
No ratings yet
Lnotes 05
5 pages
Value Function Approximation SEO Guide
No ratings yet
Value Function Approximation SEO Guide
59 pages
COMP 4901Z: Reinforcement Learning: 2.3 Value Function Approximation
No ratings yet
COMP 4901Z: Reinforcement Learning: 2.3 Value Function Approximation
55 pages
Advanced Reinforcement Learning
No ratings yet
Advanced Reinforcement Learning
46 pages
20ai903 - RL - Unit 4
No ratings yet
20ai903 - RL - Unit 4
49 pages
402 Lec20
No ratings yet
402 Lec20
21 pages
Module 6
No ratings yet
Module 6
47 pages
2023 Week4 Funcapproximate Update
No ratings yet
2023 Week4 Funcapproximate Update
69 pages
Value Function Approximation Guide
No ratings yet
Value Function Approximation Guide
56 pages
Lecture 6 Value Function Approximation
No ratings yet
Lecture 6 Value Function Approximation
56 pages
Function Approximation in RL Methods
No ratings yet
Function Approximation in RL Methods
58 pages
Lecture 5 - ModelFreePrediction
No ratings yet
Lecture 5 - ModelFreePrediction
79 pages
What Is TD Learning
No ratings yet
What Is TD Learning
15 pages
Serge Levine Course Introduction To Reinforcement Learning 3: RL Introduction
No ratings yet
Serge Levine Course Introduction To Reinforcement Learning 3: RL Introduction
46 pages
Mod3 Slides
No ratings yet
Mod3 Slides
199 pages
5SC28 L7 Machine Learning
No ratings yet
5SC28 L7 Machine Learning
61 pages
19 - Monte Carlo and Temporal Difference For Markov Decision Processes
No ratings yet
19 - Monte Carlo and Temporal Difference For Markov Decision Processes
57 pages
RL With LCS
No ratings yet
RL With LCS
29 pages
12 ML Reinforcement Learning Value Based Control
No ratings yet
12 ML Reinforcement Learning Value Based Control
12 pages
Lecture 4 - ModelFreePrediction
No ratings yet
Lecture 4 - ModelFreePrediction
48 pages
Serge Levine Course Introduction To Reinforcement Learning 6 Value Function
No ratings yet
Serge Levine Course Introduction To Reinforcement Learning 6 Value Function
27 pages
Monte Carlo Methods in Reinforcement Learning
No ratings yet
Monte Carlo Methods in Reinforcement Learning
245 pages
Unit Iii Monte Carlo & Temporal Difference Methods
No ratings yet
Unit Iii Monte Carlo & Temporal Difference Methods
18 pages
Policy Gradient Methods Guide
No ratings yet
Policy Gradient Methods Guide
28 pages
TD Learning & Deep Q-Networks
No ratings yet
TD Learning & Deep Q-Networks
20 pages
Dis9 Sol
No ratings yet
Dis9 Sol
8 pages
RL Unit 4
No ratings yet
RL Unit 4
9 pages
RL Chap 4
No ratings yet
RL Chap 4
7 pages
Introduction To Reinforcement Learning: Instructor: Sergey Levine UC Berkeley
No ratings yet
Introduction To Reinforcement Learning: Instructor: Sergey Levine UC Berkeley
46 pages
11-DL-Deep Learning For Reinforcement Learning
No ratings yet
11-DL-Deep Learning For Reinforcement Learning
47 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
46 pages
5 - Policy Gradient Methods
No ratings yet
5 - Policy Gradient Methods
57 pages
RL Theory Tutorial
No ratings yet
RL Theory Tutorial
80 pages
Reinforcement Learning Concepts Explained
No ratings yet
Reinforcement Learning Concepts Explained
4 pages
Reinforcement Learning Guide
No ratings yet
Reinforcement Learning Guide
18 pages
8200 Non Delusional Q Learning and Value Iteration
No ratings yet
8200 Non Delusional Q Learning and Value Iteration
11 pages
07 Deep Reinforcement Learning (John)
No ratings yet
07 Deep Reinforcement Learning (John)
52 pages
Temporal Difference (TD) Learning: Slides Prepared by DR J Alamelu Mangai
No ratings yet
Temporal Difference (TD) Learning: Slides Prepared by DR J Alamelu Mangai
57 pages
Deep Reinforcement Learning: 1 Notation
No ratings yet
Deep Reinforcement Learning: 1 Notation
9 pages
EE675A Lecture 16
No ratings yet
EE675A Lecture 16
6 pages
Module 5-rl
No ratings yet
Module 5-rl
54 pages
ml4r 2025 05
No ratings yet
ml4r 2025 05
22 pages
Reinforcement Learning: B.Tech., Last Year, Semester-Viii
No ratings yet
Reinforcement Learning: B.Tech., Last Year, Semester-Viii
32 pages
Solutions - REINFORCE and Linear Function Approximation
No ratings yet
Solutions - REINFORCE and Linear Function Approximation
5 pages
MAS Lab7 QFA
No ratings yet
MAS Lab7 QFA
10 pages
CO431 RL 2023 End Nov
No ratings yet
CO431 RL 2023 End Nov
3 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
45 pages
Monte Carlo Methods in AI & Data Science
No ratings yet
Monte Carlo Methods in AI & Data Science
40 pages
Lecture Notes v1.0 687 F22
No ratings yet
Lecture Notes v1.0 687 F22
115 pages
CH3 - 2 Montecarlo Control
No ratings yet
CH3 - 2 Montecarlo Control
33 pages
RL Concepts and Methods
100% (1)
RL Concepts and Methods
8 pages
06 CS272 01 TD
No ratings yet
06 CS272 01 TD
32 pages
10 - Reinforcement Learning
No ratings yet
10 - Reinforcement Learning
24 pages
L8-Value Function Approximation
No ratings yet
L8-Value Function Approximation
72 pages
37 RL
No ratings yet
37 RL
18 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
52 pages
RL 10 QUESTIONS FOR MID II Scheme of Evaluvation
No ratings yet
RL 10 QUESTIONS FOR MID II Scheme of Evaluvation
15 pages
Lec 22
No ratings yet
Lec 22
22 pages
Universal Value Function Approximators.
No ratings yet
Universal Value Function Approximators.
9 pages
CS-878 Lecture-02 Logistic Regression
No ratings yet
CS-878 Lecture-02 Logistic Regression
55 pages
Lecture W7ab
No ratings yet
Lecture W7ab
21 pages
Self Reading - KNN - Notes
No ratings yet
Self Reading - KNN - Notes
7 pages
Lecture W3
No ratings yet
Lecture W3
28 pages
Lecture W5ab
No ratings yet
Lecture W5ab
56 pages
Lecture W6b
No ratings yet
Lecture W6b
33 pages
Lesson 8-Image Segmentation - Traditional Approaches
No ratings yet
Lesson 8-Image Segmentation - Traditional Approaches
35 pages
Lecture 14 15 - Temporal Difference Learning, Lambda-Return, Backward View of TD (Lambda)
No ratings yet
Lecture 14 15 - Temporal Difference Learning, Lambda-Return, Backward View of TD (Lambda)
26 pages
Eigen Values and Eigen Vectors
No ratings yet
Eigen Values and Eigen Vectors
53 pages
Lecture 11 12 - Model Free Prediction, Monte-Carlo Learning, Temporal Difference Learning
No ratings yet
Lecture 11 12 - Model Free Prediction, Monte-Carlo Learning, Temporal Difference Learning
24 pages
Lecture 19 - Model-Free Control, Off-Policy Learning
No ratings yet
Lecture 19 - Model-Free Control, Off-Policy Learning
9 pages
Lecture 34 - Model Based Reinforcement Learning
No ratings yet
Lecture 34 - Model Based Reinforcement Learning
26 pages
Lecture 35 36 - Exploration vs. Exploitation
No ratings yet
Lecture 35 36 - Exploration vs. Exploitation
18 pages