Reinforcement Learning - Introduction

Uploaded by

rajputdhruvi12

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

12 views12 pages

Reinforcement Learning - Introduction

Uploaded by

rajputdhruvi12

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Reinforcement Learning

Definition

• Software agent learns to perform certain actions in an environment

which lead it to maximum reward.
• Exploration and Exploitation
• Multiple Trials
Type of ML

Machine Learning
Reinforcement:
Supervised • Cause and Effect
• Agent learns to interact
with environment for
reward.
Unsupervised

Reinforcement
Intuitive example

• Imagine you are supposed to cross an unknown field in the middle of

a pitch-black night without a torch.
• There can be pits and stones in the field, the position of those are
unfamiliar to you.
• There's a simple rule - if you fall into a hole or hit a rock, you must
start again from your initial point.
Block Diagram
Definitions

• Agent: Entity performing action in environment to gain reward.

• Action (a): All possible moves by agent.
• Environment (e): Scenario faced by agent.
• State (s): Current situation returned by the agent.
Definitions
• Reward(R): An immediate return sent from Environment to evaluate
last action by agent.
• Policy (𝜋): Strategy that an agent employs to determine next action
based on state s.
• Value (V): The expected long-term return with discount 𝑉𝜋 𝑠 .
Opposed to R.
• Q value or action value (Q): 𝑄𝜋 𝑠, 𝑎 : Long term return of current
state s, taking action a under policy 𝜋
Types of Reinforcement Learning

Reinforcement
Value Based

Policy based

Model Based
Value Based
• Try to maximize a value function 𝑉(𝑠)
max 𝑉𝜋(𝑠)

• The value of reward which the agent expects to gain in the future
upon starting at that state s.
• 𝐸- 𝑅/01 + 𝛾𝑅/04 + 𝛾 4 𝑅/05 + ⋯ |𝑆/ = 𝑠
Policy Based
• Try to produce a policy such that the action performed at each state is
optimal to gain maximum reward in the future.
• 𝜋 𝑠, 𝑎

• Deterministic
• At any state s, same action a is produced by policy 𝜋

• Stochastic: 𝜋 𝑎 𝑠 = 𝑃(𝐴/ = 𝑎|𝑆/ = 𝑠)

• Each action has a certain probability.
Model Based

• In this type of reinforcement learning, create a virtual model for each

environment,
• The agent learns to perform in that specific environment.
• Since the model differs for each environment, there is no singular
solution or algorithm for this type.
Multi-arm Bandit Problem
• Consider Casino section with 10 slot machine. It has written “Play for
Free ! Max. payout is $10.
• Each slot machine has different average payout.

• Goal: Find which one gives most average reward so as to maximize

reward in shortest time.

Unit-5 Mla
No ratings yet
Unit-5 Mla
22 pages
Unit 3
No ratings yet
Unit 3
29 pages
DLMAIRIL01 Q4-2024 Session1
No ratings yet
DLMAIRIL01 Q4-2024 Session1
84 pages
Reinforced Learning
No ratings yet
Reinforced Learning
25 pages
Lecture 5
No ratings yet
Lecture 5
28 pages
Reinforcement Learning
100% (1)
Reinforcement Learning
25 pages
Reinforcement
No ratings yet
Reinforcement
9 pages
L-14 - Reinforcement-L-d-07062024-111949am
No ratings yet
L-14 - Reinforcement-L-d-07062024-111949am
22 pages
What Is Reinforcement Learning
No ratings yet
What Is Reinforcement Learning
15 pages
IntroductiontoRL BR
No ratings yet
IntroductiontoRL BR
22 pages
What Is Reinforcement Learning
No ratings yet
What Is Reinforcement Learning
5 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
5 pages
Reinforcement Learning Basics
No ratings yet
Reinforcement Learning Basics
51 pages
Understanding Reinforcement Learning Basics
No ratings yet
Understanding Reinforcement Learning Basics
26 pages
UNIT V 5.3 ML Reinforcement Learning
No ratings yet
UNIT V 5.3 ML Reinforcement Learning
41 pages
Reinforcement Learning: Karan Kathpalia
No ratings yet
Reinforcement Learning: Karan Kathpalia
80 pages
Unit-5 (AI)
No ratings yet
Unit-5 (AI)
21 pages
Basics of Reinforcement Learning
No ratings yet
Basics of Reinforcement Learning
15 pages
Unit 5 Part1 RL Notes
No ratings yet
Unit 5 Part1 RL Notes
22 pages
L11 Reinforcement Learning 1
No ratings yet
L11 Reinforcement Learning 1
18 pages
RL Presentation2
No ratings yet
RL Presentation2
19 pages
Unit 5
No ratings yet
Unit 5
45 pages
Lecture 9 Reiforcement Learning
No ratings yet
Lecture 9 Reiforcement Learning
29 pages
Unit 4
No ratings yet
Unit 4
56 pages
Reinforcement Learning Basics
No ratings yet
Reinforcement Learning Basics
32 pages
Artificial Intelligence: Lecture 10 - Reinforcement Learning Prof. Shivanjali Khare
No ratings yet
Artificial Intelligence: Lecture 10 - Reinforcement Learning Prof. Shivanjali Khare
45 pages
ML 10
No ratings yet
ML 10
9 pages
MLT Unit-5 Notes
No ratings yet
MLT Unit-5 Notes
17 pages
Module 1
No ratings yet
Module 1
72 pages
Lecture Week12
No ratings yet
Lecture Week12
37 pages
7.reinforcement Learning-Introduction-The Learning Task Q-Learning
No ratings yet
7.reinforcement Learning-Introduction-The Learning Task Q-Learning
34 pages
CMPE257 - W10C13 - Reinforcement Learning
No ratings yet
CMPE257 - W10C13 - Reinforcement Learning
161 pages
Unit V Reinforcement Learning and Genetic Algorithm
No ratings yet
Unit V Reinforcement Learning and Genetic Algorithm
40 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
30 pages
RL & DL Notes
No ratings yet
RL & DL Notes
43 pages
Reinforcement Learning Basics
No ratings yet
Reinforcement Learning Basics
19 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
38 pages
Intro to Reinforcement Learning
No ratings yet
Intro to Reinforcement Learning
9 pages
Reinforcement Learning Overview
No ratings yet
Reinforcement Learning Overview
73 pages
Fundamentals of Reinforcement Learning
No ratings yet
Fundamentals of Reinforcement Learning
33 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
29 pages
Unit Vi
No ratings yet
Unit Vi
17 pages
L13 Reinforcement Learning
No ratings yet
L13 Reinforcement Learning
57 pages
AI Week 15
No ratings yet
AI Week 15
3 pages
Reinforcement Learning-1
No ratings yet
Reinforcement Learning-1
13 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
6 pages
Ai Unit 3
No ratings yet
Ai Unit 3
23 pages
Unit 5 ML
No ratings yet
Unit 5 ML
15 pages
ML Unit 5
No ratings yet
ML Unit 5
13 pages
Unit 5 - Reinforcement Learning
No ratings yet
Unit 5 - Reinforcement Learning
15 pages
Artificial Intelligence: Computer Science & Engineering, Khulna University
No ratings yet
Artificial Intelligence: Computer Science & Engineering, Khulna University
30 pages
Types of Data:: Reference Website
No ratings yet
Types of Data:: Reference Website
15 pages
Reinforcement Learning Overview
No ratings yet
Reinforcement Learning Overview
32 pages
Unit 5
No ratings yet
Unit 5
58 pages
Unit-8 - Reinforcement Learning
No ratings yet
Unit-8 - Reinforcement Learning
52 pages
Unit 5 ML 3year
No ratings yet
Unit 5 ML 3year
17 pages
Unit 5
No ratings yet
Unit 5
10 pages
Understanding Reinforcement Learning
No ratings yet
Understanding Reinforcement Learning
31 pages
Reinforcement Learning Overview
No ratings yet
Reinforcement Learning Overview
2 pages
Sneha R
No ratings yet
Sneha R
11 pages
2 Phase
No ratings yet
2 Phase
31 pages
Introduction to Problem-Solving Algorithms
No ratings yet
Introduction to Problem-Solving Algorithms
2 pages
Integer Linear Programming Overview
100% (1)
Integer Linear Programming Overview
41 pages
Gaussian States in Quantum Information
No ratings yet
Gaussian States in Quantum Information
47 pages
Exact Differential Equations Overview
No ratings yet
Exact Differential Equations Overview
20 pages
326 Set 6
No ratings yet
326 Set 6
1 page
Cryptography for Curious Minds
No ratings yet
Cryptography for Curious Minds
8 pages
Introduction To Jackson Structured Programming (JSP) : Lesson
No ratings yet
Introduction To Jackson Structured Programming (JSP) : Lesson
12 pages
Dbatu em 3 Question Paper
No ratings yet
Dbatu em 3 Question Paper
2 pages
Siddhartha Academy of Higher Education Deemed To Be University
No ratings yet
Siddhartha Academy of Higher Education Deemed To Be University
2 pages
Helping Material For Artificial Intelligence & Machine Learning
No ratings yet
Helping Material For Artificial Intelligence & Machine Learning
2 pages
3HAN A Deep Neural Network For Fake News Detection
No ratings yet
3HAN A Deep Neural Network For Fake News Detection
10 pages
Algorithm Design in MapReduce
No ratings yet
Algorithm Design in MapReduce
62 pages
LSTM vs GRU: Forex Prediction Study
No ratings yet
LSTM vs GRU: Forex Prediction Study
10 pages
LAB 1 (Signal Analysis Using MATLAB)
No ratings yet
LAB 1 (Signal Analysis Using MATLAB)
8 pages
Analyzing The Random-Walk Algorithm For SAT: Helsinki University of Technology
No ratings yet
Analyzing The Random-Walk Algorithm For SAT: Helsinki University of Technology
54 pages
Screenshot 2024-10-15 at 5.27.50 PM
No ratings yet
Screenshot 2024-10-15 at 5.27.50 PM
2 pages
COA GTU Study Material Presentations Unit-7 10052021051444AM
No ratings yet
COA GTU Study Material Presentations Unit-7 10052021051444AM
16 pages
AI CH-Natural Language Processing Class 10th A BY HITESH YADAV
No ratings yet
AI CH-Natural Language Processing Class 10th A BY HITESH YADAV
5 pages
Prepared by GROUP 6 Landicho, Patricia Llegue, Jana (8.27 X 11.69 In)
No ratings yet
Prepared by GROUP 6 Landicho, Patricia Llegue, Jana (8.27 X 11.69 In)
3 pages
Lab 1 2 Aes Rsa Encryption Vf17
No ratings yet
Lab 1 2 Aes Rsa Encryption Vf17
20 pages
Cryptography and Data Security
No ratings yet
Cryptography and Data Security
206 pages
Attention-Based CNN for Machine Comprehension
No ratings yet
Attention-Based CNN for Machine Comprehension
7 pages
Modified GIFT Cipher for IoT Security
No ratings yet
Modified GIFT Cipher for IoT Security
13 pages
Mini Project On Diabetes Prediction: Information Technology
No ratings yet
Mini Project On Diabetes Prediction: Information Technology
19 pages
Speech Emotion Analysis Using Convolutional Neural
No ratings yet
Speech Emotion Analysis Using Convolutional Neural
19 pages
Ijgi 11 00400
No ratings yet
Ijgi 11 00400
18 pages
Laplace Transform-Devendra Poonia
No ratings yet
Laplace Transform-Devendra Poonia
82 pages
Data Assimilation For The Geosciences: From Theory To Application 2nd Edition Steven J. Fletcher - Get The Ebook Instantly With Just One Click
100% (3)
Data Assimilation For The Geosciences: From Theory To Application 2nd Edition Steven J. Fletcher - Get The Ebook Instantly With Just One Click
50 pages