Lecture 02 - Markov Decision Process

Uploaded by

junaiddbz01

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

25 views33 pages

Lecture 02 - Markov Decision Process

Uploaded by

junaiddbz01

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Reinforcement Learning

Lecture 02: Markov Decision Process

Slides credit: David Silver

Agenda
• Markov Processes
• Markov Reward Processes
• Markov Decision Processes
Action taking in reinforcement learning
• Making a choice out of presented options Out of agent’s control!
• Discrete actions
• Move left or right in Atari Breakout game
• Recommend an item to a target
Reinforcement useris learning what to do — how
learning
to map situations to actions — so as to maximize a
numerical reward signal.
- Sutton & Barto, 2018

3
Reward in reinforcement learning
• A scalar feedback signal about the taken action
• Suggest good/bad immediate consequence of the action
• Score in Atari game
• User clicks/purchase in a recommender system
• Delayed feedback
• GO game
• Generate a sentence in chat-bot
• Goal of learning – maximize cumulative rewards
• Reward hypothesis: “All goals can be described by the maximization of expected
cumulative reward.”

4
How to take an action
• With respect to the current observation

Observation 𝑜𝑡 Action 𝑎𝑡

Reward 𝑟𝑡
5
Introduction to MDPs
• A Markov Decision Process (MDP) is a mathematical framework used
in Reinforcement Learning (RL) to model decision-making problems
where an agent interacts with an environment to maximize rewards.
• Almost all RL problems can be formalized as MDPs
Markov
Property
State
Transition
Probability
Markov
Process
Student
Markov
Chain
Student
Markov
Chain
Student
Markov State
Transition
Markov
Reward
Process
Student MRP
Return
Why
Discount?
Value
Function
Student MRP
Return
State Value
Function for
Student MRP
(1)
State Value
Function for
Student MRP
(2)
State Value
Function for
Student MRP
(3)
Bellman
Equation for
MRPs
Bellman
Equation for
MRPs (2)
Example:
Bellman
Equation for
Student MRP
Markov
Decision
Process
Example:
Student
MDP
Policy
Value
Function
State Value
Function for
Student
MPD
Bellman
Expectation
Equation
Bellman
Expectation
Equation for
𝑉𝜋
Bellman
Expectation
Equation for
𝑄𝜋
Example:
Bellman
Expectation
Equation in
Student MDP

Lecture - 03 - MDPs
No ratings yet
Lecture - 03 - MDPs
36 pages
Understanding The Markov Decision Process (MDP) - Built in
No ratings yet
Understanding The Markov Decision Process (MDP) - Built in
18 pages
DSA5102 Lecture11
No ratings yet
DSA5102 Lecture11
44 pages
Reinforcement Learning: Karan Kathpalia
No ratings yet
Reinforcement Learning: Karan Kathpalia
80 pages
Markov Decision Process
No ratings yet
Markov Decision Process
21 pages
Introduction To Reinforcement Learning
No ratings yet
Introduction To Reinforcement Learning
62 pages
Unit-6 Reinforcement Learning
No ratings yet
Unit-6 Reinforcement Learning
75 pages
Reinforcement Learning Note
No ratings yet
Reinforcement Learning Note
16 pages
Lecture 2: Markov Decision Processes: David Silver
No ratings yet
Lecture 2: Markov Decision Processes: David Silver
57 pages
Reinforcement Learning Basics
No ratings yet
Reinforcement Learning Basics
88 pages
Subtitle
No ratings yet
Subtitle
2 pages
Types of Reinforcement Learning Explained
No ratings yet
Types of Reinforcement Learning Explained
3 pages
IntroductiontoRL BR
No ratings yet
IntroductiontoRL BR
22 pages
ML - Unit-3 - Reinforcement Learning
No ratings yet
ML - Unit-3 - Reinforcement Learning
47 pages
Reinforcement MDP Final PDF
No ratings yet
Reinforcement MDP Final PDF
10 pages
16-412 S 16 Resource File
No ratings yet
16-412 S 16 Resource File
56 pages
Lec6 MDPIntro
No ratings yet
Lec6 MDPIntro
24 pages
Lecture 3 - MDPs and Dynamic Programming
No ratings yet
Lecture 3 - MDPs and Dynamic Programming
62 pages
Reinforcement
No ratings yet
Reinforcement
9 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
86 pages
Reinforcement Learning: Part I - Definitions
No ratings yet
Reinforcement Learning: Part I - Definitions
26 pages
Lecture#2 - Markov Decision Process MDP An Introduction 2023
No ratings yet
Lecture#2 - Markov Decision Process MDP An Introduction 2023
36 pages
Unit Vi
No ratings yet
Unit Vi
17 pages
Reinforcement Learning Basics
No ratings yet
Reinforcement Learning Basics
4 pages
Ai (It) Unit-4
100% (1)
Ai (It) Unit-4
37 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
31 pages
Lecture 9 Reiforcement Learning
No ratings yet
Lecture 9 Reiforcement Learning
29 pages
Markov Decision & RL Overview
No ratings yet
Markov Decision & RL Overview
39 pages
RL DQN PG
No ratings yet
RL DQN PG
65 pages
Markov Decision Processes & Reinforcement Learning: Megan Smith Lehigh University, Fall 2006
No ratings yet
Markov Decision Processes & Reinforcement Learning: Megan Smith Lehigh University, Fall 2006
40 pages
DLMAIRIL01 Q4-2024 Session2
No ratings yet
DLMAIRIL01 Q4-2024 Session2
68 pages
10 ML Introduction To Reinforcement Learning
No ratings yet
10 ML Introduction To Reinforcement Learning
8 pages
RL Unit-Ii
No ratings yet
RL Unit-Ii
14 pages
Lecture 3 - MDPs and Dynamic Programming
No ratings yet
Lecture 3 - MDPs and Dynamic Programming
66 pages
Markov Decision Process
No ratings yet
Markov Decision Process
8 pages
AS02
No ratings yet
AS02
16 pages
17 - Markov Decision Processes
No ratings yet
17 - Markov Decision Processes
59 pages
Reinforcement Learning Overview
No ratings yet
Reinforcement Learning Overview
2 pages
Lecture 1
No ratings yet
Lecture 1
38 pages
Unit 5 Deep Learning
No ratings yet
Unit 5 Deep Learning
24 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
6 pages
Unit 5 ML
No ratings yet
Unit 5 ML
15 pages
1.4 Introduction To Markov Decision Processes
No ratings yet
1.4 Introduction To Markov Decision Processes
15 pages
RL Ese
No ratings yet
RL Ese
7 pages
L12 Reinforcement Learning 2
No ratings yet
L12 Reinforcement Learning 2
26 pages
Reinforcement Learning: Nguyen Do Van, PHD
No ratings yet
Reinforcement Learning: Nguyen Do Van, PHD
40 pages
MLT Unit-5 Notes
No ratings yet
MLT Unit-5 Notes
17 pages
Chapter 18 - Reinforcement Learning
No ratings yet
Chapter 18 - Reinforcement Learning
29 pages
Add-On DRL CS06
No ratings yet
Add-On DRL CS06
23 pages
Finite Markov Decision Processes-BR
No ratings yet
Finite Markov Decision Processes-BR
31 pages
Reinforcement Learning Basics
No ratings yet
Reinforcement Learning Basics
19 pages
Reinforcement Learning Basics
No ratings yet
Reinforcement Learning Basics
32 pages
10 ReinforcementLearning
No ratings yet
10 ReinforcementLearning
59 pages
Unit-4 of Ai
100% (1)
Unit-4 of Ai
9 pages
Numerical Analysis Prelim Guide
No ratings yet
Numerical Analysis Prelim Guide
236 pages
3rd Sem Syllabus EM, ECA, SC
No ratings yet
3rd Sem Syllabus EM, ECA, SC
8 pages
Mechanical Properties of Metals Explained
No ratings yet
Mechanical Properties of Metals Explained
18 pages
Chapter 03 - Forecasting: Multiple Choice Questions
No ratings yet
Chapter 03 - Forecasting: Multiple Choice Questions
19 pages
Surface Areas and Volumes of Solids
No ratings yet
Surface Areas and Volumes of Solids
6 pages
Mathematics and The Real World
No ratings yet
Mathematics and The Real World
7 pages
Full Unit 4 Including Numericals
No ratings yet
Full Unit 4 Including Numericals
38 pages
Shaft Alignment Using Strain Gauges - Case Studies
No ratings yet
Shaft Alignment Using Strain Gauges - Case Studies
16 pages
482 LectureNotes Chapter 2
No ratings yet
482 LectureNotes Chapter 2
23 pages
Calculus Concepts and Applications Foerster
100% (9)
Calculus Concepts and Applications Foerster
731 pages
The Structure of Crystalline Solids
No ratings yet
The Structure of Crystalline Solids
77 pages
SASMO Grade 11.12 JC Paper
No ratings yet
SASMO Grade 11.12 JC Paper
15 pages
EMPro Microstrip Line Setup Guide
No ratings yet
EMPro Microstrip Line Setup Guide
32 pages
(David H. Barlow, Michel Hersen) Single Case Exper
100% (1)
(David H. Barlow, Michel Hersen) Single Case Exper
432 pages
An Open-Source Framework For FPGA Emulation of Analog Mixed-Signal Integrated Circuit Designs
No ratings yet
An Open-Source Framework For FPGA Emulation of Analog Mixed-Signal Integrated Circuit Designs
14 pages
Solved Exercises On Series and Parallel Circuits 2
No ratings yet
Solved Exercises On Series and Parallel Circuits 2
10 pages
Microsoft PowerPoint - L-RCM-Ooip
No ratings yet
Microsoft PowerPoint - L-RCM-Ooip
40 pages
Trigonometric Equations & Inequalities Guide
No ratings yet
Trigonometric Equations & Inequalities Guide
8 pages
Computational Fluid Dynamics in Ventilation Design
No ratings yet
Computational Fluid Dynamics in Ventilation Design
11 pages
SIMSEN Help File
No ratings yet
SIMSEN Help File
89 pages
DPP 2 18TH April 2020
No ratings yet
DPP 2 18TH April 2020
10 pages
CRP Xi Timetable 25-26-1
No ratings yet
CRP Xi Timetable 25-26-1
4 pages
Knowledge Check - Training - Microsoft Learn 5
100% (1)
Knowledge Check - Training - Microsoft Learn 5
2 pages
Online Quiz on Proof Methods
No ratings yet
Online Quiz on Proof Methods
8 pages
Management Science-Chapter 2
No ratings yet
Management Science-Chapter 2
42 pages
Linear Regression Lecture Notes
No ratings yet
Linear Regression Lecture Notes
28 pages
Artificial Intelligence Syllabus
No ratings yet
Artificial Intelligence Syllabus
52 pages
Interactive and Passive Graphics
No ratings yet
Interactive and Passive Graphics
41 pages
Roll Crusher 1 Single
100% (2)
Roll Crusher 1 Single
3 pages
Adaptive and Array Signal Processing
No ratings yet
Adaptive and Array Signal Processing
44 pages

Lecture 02 - Markov Decision Process

Uploaded by

Lecture 02 - Markov Decision Process

Uploaded by

Reinforcement Learning

Lecture 02: Markov Decision Process

Slides credit: David Silver

You might also like