MDP Ppaer Deepsk

The document outlines an exam on Markov Decision Processes (MDPs) consisting of multiple sections including basic concepts, value functions, policy evaluation, and optimal policies. It contains specific questions requiring mathematical definitions, calculations, and the application of Bellman equations. Each section is assigned a certain number of marks, totaling 100, and includes both theoretical and practical components.

Uploaded by

alijaskani35

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

30 views3 pages

MDP Ppaer Deepsk

Uploaded by

alijaskani35

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Markov Decision Processes Exam (100 Marks)

Time: 2 Hours

Section A: Basic Concepts (20 Marks)

1. (a) State the Markov property mathematically and explain its significance in MDPs.
(5 Marks)
(b) Compute the return Gt for Rt+1 = 5, Rt+2 = −3, Rt+3 = 2, with γ = 0.8. (5
Marks)

2. (a) Define the Bellman equation for a Markov Reward Process (MRP). (5 Marks)
(b) For the Student MRP (Page 11), calculate the immediate reward Rs for state
”Pub”. (5 Marks)

Section B: Value Functions & Bellman Equations (30

Marks)
3. Given the Student MRP (Page 11) with γ = 0.9:

(a) Write the Bellman equation for state ”C3”. (10 Marks)
(b) Solve for v(C3) using matrix inversion. (10 Marks)

3. For the Student Markov Chain (Page 9):

(a) Construct the transition matrix P . (5 Marks)

(b) Calculate the probability of transitioning from ”C1” to ”Sleep” in 3 steps. (5
Marks)

Section C: Policy & Value Iteration (25 Marks)

5. For the Student MDP (Page 25) with policy π(Study|s) = 0.6, π(Facebook|s) = 0.4:

(a) Calculate P π and Rπ for state ”C1”. (10 Marks)

(b) Perform one policy evaluation iteration starting with V (C1) = 0. (15 Marks)

Section D: Optimal Policies & Bellman Optimality (25

Marks)
6. For the Student MDP (Page 38):

1
(a) Write the Bellman optimality equation for state ”C1”. (10 Marks)
(b) Compute v∗ (C1) using value iteration (2 steps, V0 = 0). (15 Marks)

2
Solutions
Section A
1. (a) Markov property:
P[St+1 |St ] = P[St+1 |S1 , . . . , St ]
Significance: History independence simplifies computation.
(b)
Gt = 5 + 0.8(−3) + 0.82 (2) = 5 − 2.4 + 1.28 = 3.88
2. (a) Bellman equation for MRP:
X
v(s) = Rs + γ Pss′ v(s′ )
s′

(b) From Page 11: RPub = +1.

Section B
3. (a) Bellman equation for ”C3”:
v(C3) = −2 + 0.9 (0.6v(Pass) + 0.4v(Pub))
(b) Using v = (I − γP )−1 R:
−2 + 0.9 × 0.4 × 1
v(C3) = = −3.33
1 − 0.9 × 0.6
3. (a) Transition matrix (abbreviated):
 
0.5 0.5 0 · · ·
P = 0.8 0 0.2 · · ·
 
.. ..
. .
(3)
(b) 3-step probability: PC1, Sleep = 0.5 × 0.2 × 1 = 0.1.

Section C
5. (a)
π Study Facebook
PC1 = 0.6PC1, C2 + 0.4PC1, FB
RπC1 = 0.6(−2) + 0.4(−1) = −1.6
(b) Updated value:
V (C1) = −1.6 + 0.9 × 0 = −1.6

Section D
6. (a) Bellman optimality equation:
v∗ (C1) = max {−2 + 0.9v∗ (C2), −1 + 0.9v∗ (FB)}
(b) Value iteration:
V1 (C1) = max{−2, −1} = −1
V2 (C1) = max{−2 + 0.9(−1), −1 + 0.9(0)} = −1.9

MDP RL Paper Grock
No ratings yet
MDP RL Paper Grock
5 pages
MDP RL Paper GPT
No ratings yet
MDP RL Paper GPT
6 pages
AI 3000 / CS5500: Reinforcement Learning Exam 1: Instructions
0% (1)
AI 3000 / CS5500: Reinforcement Learning Exam 1: Instructions
4 pages
MDP and Bellman Equation Overview
No ratings yet
MDP and Bellman Equation Overview
29 pages
EE675 Lecture 10
No ratings yet
EE675 Lecture 10
4 pages
RL Paper Deepsk
No ratings yet
RL Paper Deepsk
4 pages
Reinforcement Learning for Experts
No ratings yet
Reinforcement Learning for Experts
36 pages
Intro RL Paper Grock
No ratings yet
Intro RL Paper Grock
6 pages
Deriving Bellman's Equation in MDPs
No ratings yet
Deriving Bellman's Equation in MDPs
4 pages
BNs MDPs Final 2022 Fall Solutions
No ratings yet
BNs MDPs Final 2022 Fall Solutions
5 pages
Reinforcement Learning Basics
No ratings yet
Reinforcement Learning Basics
51 pages
Lec 09
No ratings yet
Lec 09
51 pages
Intro RL Paper GPT
No ratings yet
Intro RL Paper GPT
5 pages
Fa19 Lecture 15 MDPs II
No ratings yet
Fa19 Lecture 15 MDPs II
76 pages
Problem 1: Markov Reward Process
No ratings yet
Problem 1: Markov Reward Process
3 pages
Homework 1: ELEN E6885: Introduction To Reinforcement Learning September 21, 2021
No ratings yet
Homework 1: ELEN E6885: Introduction To Reinforcement Learning September 21, 2021
8 pages
Class Notes 2
No ratings yet
Class Notes 2
6 pages
2 Dynamic
No ratings yet
2 Dynamic
50 pages
Lecture 2: Markov Decision Processes: David Silver
No ratings yet
Lecture 2: Markov Decision Processes: David Silver
57 pages
Lecture26 Ri
No ratings yet
Lecture26 Ri
55 pages
Reinforcement Learning 3 Recap
No ratings yet
Reinforcement Learning 3 Recap
3 pages
EE675A Lec12
No ratings yet
EE675A Lec12
5 pages
Lecture 3 - MDPs and Dynamic Programming
No ratings yet
Lecture 3 - MDPs and Dynamic Programming
66 pages
DRL Homework 1
No ratings yet
DRL Homework 1
4 pages
Reinforcement Learning: Amulya Viswambaran (202090007) Kehkashan Fatima (202090202) Sruthi Krishnan (202090333)
No ratings yet
Reinforcement Learning: Amulya Viswambaran (202090007) Kehkashan Fatima (202090202) Sruthi Krishnan (202090333)
40 pages
Lecture 3 - MDPs and Dynamic Programming
No ratings yet
Lecture 3 - MDPs and Dynamic Programming
62 pages
Understanding Markov Decision Processes
No ratings yet
Understanding Markov Decision Processes
3 pages
AI 3000 / CS 5500: Reinforcement Learning Assignment 1: Problem 1: Markov Reward Process
No ratings yet
AI 3000 / CS 5500: Reinforcement Learning Assignment 1: Problem 1: Markov Reward Process
5 pages
DLMAIRIL01 Q4-2024 Session2
No ratings yet
DLMAIRIL01 Q4-2024 Session2
68 pages
Markov Decision Process
No ratings yet
Markov Decision Process
36 pages
Tri-Tue-Nhan-Tao - Nathan-Lambert - Lec12 - 6up-Markov-Decision-Processes-Iii-+-Rl - (Cuuduongthancong - Com)
No ratings yet
Tri-Tue-Nhan-Tao - Nathan-Lambert - Lec12 - 6up-Markov-Decision-Processes-Iii-+-Rl - (Cuuduongthancong - Com)
7 pages
Ta Lecture2
No ratings yet
Ta Lecture2
26 pages
18 - Dynamic Programming For Markov Decision Processes
No ratings yet
18 - Dynamic Programming For Markov Decision Processes
50 pages
AIS462 - Reinforcement Learning - Spring2025 - Lec4
No ratings yet
AIS462 - Reinforcement Learning - Spring2025 - Lec4
13 pages
Lec 02
No ratings yet
Lec 02
89 pages
Markov Decision Processes for Traffic Control
No ratings yet
Markov Decision Processes for Traffic Control
31 pages
MDP Solution Methods: Iteration & LP
No ratings yet
MDP Solution Methods: Iteration & LP
34 pages
Assignment
No ratings yet
Assignment
2 pages
Cs5811 Ch17 Complex Dec
No ratings yet
Cs5811 Ch17 Complex Dec
29 pages
Unit-5 Ai
No ratings yet
Unit-5 Ai
19 pages
Lecture4 Model Free Prediction
No ratings yet
Lecture4 Model Free Prediction
34 pages
Sp14 Cs188 Lecture 9 - Mdps II
No ratings yet
Sp14 Cs188 Lecture 9 - Mdps II
48 pages
Markov Decision Processes Ii: Ppts by Dan Klein and Pieter Abbeel For Cs188 Intro To Ai at Uc Berkeley
No ratings yet
Markov Decision Processes Ii: Ppts by Dan Klein and Pieter Abbeel For Cs188 Intro To Ai at Uc Berkeley
50 pages
Unit 5 Reinforcement Learning Notes
No ratings yet
Unit 5 Reinforcement Learning Notes
20 pages
Lecture - 03 - MDPs
No ratings yet
Lecture - 03 - MDPs
36 pages
RL Problem Sheet: E0 270: Machine Learning (Spring 2025)
No ratings yet
RL Problem Sheet: E0 270: Machine Learning (Spring 2025)
10 pages
4, 56, 78 MCQ RL
No ratings yet
4, 56, 78 MCQ RL
16 pages
Practice Problem Set
No ratings yet
Practice Problem Set
3 pages
Markov Decision Processes Overview
No ratings yet
Markov Decision Processes Overview
19 pages
17 - Markov Decision Processes
No ratings yet
17 - Markov Decision Processes
59 pages
Textbook Solutions Expert Q&A Practice: Find Solutions For Your Homework
No ratings yet
Textbook Solutions Expert Q&A Practice: Find Solutions For Your Homework
6 pages
Exam Prep Exercises034534123124
No ratings yet
Exam Prep Exercises034534123124
20 pages
Bellman Equation in Markov Decision Processes
No ratings yet
Bellman Equation in Markov Decision Processes
5 pages
Lec 12
No ratings yet
Lec 12
60 pages
ACMS-2026 Brochure
No ratings yet
ACMS-2026 Brochure
2 pages
06 Gingerbread House Big Windows
No ratings yet
06 Gingerbread House Big Windows
3 pages
Unit Test 1A
No ratings yet
Unit Test 1A
3 pages
Wavelength Division Multiplexing
No ratings yet
Wavelength Division Multiplexing
25 pages
3 D Practice Booklet
No ratings yet
3 D Practice Booklet
19 pages
Overview of Renewable Energy Sources
No ratings yet
Overview of Renewable Energy Sources
11 pages
6 Ways To Score Above 700 (SAT - Reading)
No ratings yet
6 Ways To Score Above 700 (SAT - Reading)
2 pages
Chapter 3 - Legal Basis of Gender and Society
100% (2)
Chapter 3 - Legal Basis of Gender and Society
12 pages
Cryptobazaar
No ratings yet
Cryptobazaar
22 pages
Debit Card and Credit Card
0% (2)
Debit Card and Credit Card
51 pages
Manufacturing Processes II Week 01 - 2025 2026 Fall
No ratings yet
Manufacturing Processes II Week 01 - 2025 2026 Fall
48 pages
Learning Disabilities in Children
60% (5)
Learning Disabilities in Children
9 pages
Andean Condor: Conservation Challenges
No ratings yet
Andean Condor: Conservation Challenges
2 pages
AVR Microcontroller Programming Guide
100% (3)
AVR Microcontroller Programming Guide
63 pages
Maths Chapter 1 and 2 Test
No ratings yet
Maths Chapter 1 and 2 Test
1 page
Thesis Writing Challenges Explained
100% (2)
Thesis Writing Challenges Explained
7 pages
Road Safety Workshop Report 2017
No ratings yet
Road Safety Workshop Report 2017
18 pages
Smart Contracts and Intellectual Property
No ratings yet
Smart Contracts and Intellectual Property
6 pages
Hindu Rin
No ratings yet
Hindu Rin
4 pages
APABAHUKAM
No ratings yet
APABAHUKAM
37 pages
Gordon's Functional Health Pattern
100% (3)
Gordon's Functional Health Pattern
5 pages
Challenges Faced by STEM Students at MNHS
No ratings yet
Challenges Faced by STEM Students at MNHS
3 pages
Sadia Resume
No ratings yet
Sadia Resume
2 pages
Pressure Gauge Poster
No ratings yet
Pressure Gauge Poster
1 page
APPL115 Concept
No ratings yet
APPL115 Concept
52 pages
Intenseye Executive Summary
No ratings yet
Intenseye Executive Summary
25 pages
"I Will Walk Among You": 00i-291 Harper 3p.indb 1 10/1/18 8:09 AM
No ratings yet
"I Will Walk Among You": 00i-291 Harper 3p.indb 1 10/1/18 8:09 AM
303 pages
Anthem Classic PPO 250-20-20
No ratings yet
Anthem Classic PPO 250-20-20
4 pages
Suggestions Als
No ratings yet
Suggestions Als
4 pages
Essay On Nature - Nature Essay For Students and Children in English
No ratings yet
Essay On Nature - Nature Essay For Students and Children in English
8 pages

MDP Ppaer Deepsk

Uploaded by

MDP Ppaer Deepsk

Uploaded by

Markov Decision Processes Exam (100 Marks)

Section A: Basic Concepts (20 Marks)

Section B: Value Functions & Bellman Equations (30

3. For the Student Markov Chain (Page 9):

(a) Construct the transition matrix P . (5 Marks)

Section C: Policy & Value Iteration (25 Marks)

(a) Calculate P π and Rπ for state ”C1”. (10 Marks)

Section D: Optimal Policies & Bellman Optimality (25

(b) From Page 11: RPub = +1.

You might also like