Q Learning

The document discusses Q learning, a type of reinforcement learning that enables agents to learn optimal actions through interaction with their environment to maximize long-term rewards. It outlines the components of Q learning, including states, actions, rewards, and the Q matrix, and provides examples of its application, such as navigating rooms. The Q learning algorithm is explained step-by-step, illustrating how agents update their knowledge to achieve specific goals.

Uploaded by

anh.nguyenvantuan54

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

38 views18 pages

Q Learning

Uploaded by

anh.nguyenvantuan54

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 18

Artificial Intelligence

Q learning

Pham Viet Cuong

Dept. Control Engineering & Automation, FEEE
Ho Chi Minh City University of Technology
Q learning
ü Supervised learning: Classification, regression
ü Unsupervised learning: Clustering
ü Reinforcement learning:
v More general than supervised/unsupervised learning
v Learn from interactive with environment (perform actions and
observe rewards) to achieve a goal
v Goal: Learn a policy to maximize some measure of long-term reward

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 2
Q learning
ü Examples:

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 3
Q learning
ü Examples:

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 4
Q learning
ü Examples: video games

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 5
Q learning
ü Examples:

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 6
Q learning
ü Example:
v Put an agent in any
room
v Goal: go to Room 5
with fastest route 0 1

4 3 2

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 7
Q learning
ü State: Room 0, Room 1, . . ., Room 5
ü Action: Go to Room 0, Go to Room 1, . . ., Go to Room 5
ü Reward: matrix R

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 8
Q learning
ü Matrix Q: memory of what agent has learned through experience
v Agent starts out knowing nothing
v Q is initialized to zero

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 9
Q learning
ü Defined:
v States
v Actions
v Rewards matrix R
v Matrix Q
ü Training in progress
v Updating matrix Q

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 10
Q learning
ü Utilize the Q matrix:
v Step 1: Set current state = initial state.
v Step 2: From current state, find the action with the highest Q value.
v Step 3: Perform action chosen in Step 2
v Step 4: Set current state = next state.
v Step 5: Repeat Steps 2, 3 and 4 until current state = goal state.

0 1

4 3 2

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 11
Q learning
ü Q learning algorithm:

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 12
Q learning
ü Q learning algorithm: gamma = 0.8, episode 1, initial state: 1
state = 1 action: go to 5 next_state = 5

100 0
0.8

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 13
Q learning
ü Q learning algorithm: episode 2, initial state = 3
state = 3 action: go to 1 next_state = 1

0 100
0.8

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 14
Q learning
ü Q learning algorithm: episode 2, initial state = 3
state = 1 action: go to 5 next_state = 5

100 0
0.8

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 15
Q learning
ü Q learning algorithm:

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 16
Q learning
ü Q learning algorithm:

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 17
Artificial Neural Networks
ü References
v http://cs231n.stanford.edu/slides/2017/cs231n_2017_lecture14.pdf
v http://mnemstudio.org/path-finding-q-learning-tutorial.htm

Pham Viet Cuong - Dept. Control Eng. & Automation, FEEE, HCMUT 18

A Painless Q-Learning Tutorial
No ratings yet
A Painless Q-Learning Tutorial
6 pages
Unit 5
No ratings yet
Unit 5
65 pages
Understanding Q Learning in AI
No ratings yet
Understanding Q Learning in AI
8 pages
Unit 5
No ratings yet
Unit 5
54 pages
RL Class Mtech
No ratings yet
RL Class Mtech
67 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
38 pages
Q-Learning Algorithm
No ratings yet
Q-Learning Algorithm
13 pages
Unit 5
No ratings yet
Unit 5
70 pages
Understanding Reinforcement Learning Basics
No ratings yet
Understanding Reinforcement Learning Basics
11 pages
ML Unit 5
No ratings yet
ML Unit 5
17 pages
Reinforcement Learning - Ipynb - Colaboratory
No ratings yet
Reinforcement Learning - Ipynb - Colaboratory
7 pages
Deep Learning Binoy-19-3-RL Q Learning
No ratings yet
Deep Learning Binoy-19-3-RL Q Learning
26 pages
CS480 Lecture November 21st
No ratings yet
CS480 Lecture November 21st
193 pages
Unit5 MLT
No ratings yet
Unit5 MLT
26 pages
Q Learning
No ratings yet
Q Learning
12 pages
7 - Reinforcement Learning
No ratings yet
7 - Reinforcement Learning
23 pages
Unit-5 MLT
No ratings yet
Unit-5 MLT
13 pages
Simulation of The Navigation of A Mobile Robot by The Q-Learning Using Artificial Neuron Networks
No ratings yet
Simulation of The Navigation of A Mobile Robot by The Q-Learning Using Artificial Neuron Networks
12 pages
Artificial Intelligence: Lecture 11 - Reinforcement Learning II Dr. Shivanjali Khare
No ratings yet
Artificial Intelligence: Lecture 11 - Reinforcement Learning II Dr. Shivanjali Khare
52 pages
Reinforedu
No ratings yet
Reinforedu
46 pages
AI Learning for Advanced Users
No ratings yet
AI Learning for Advanced Users
12 pages
Q Learning
No ratings yet
Q Learning
187 pages
Intro To Reinforcement Learning - DQ Q AC A3C
No ratings yet
Intro To Reinforcement Learning - DQ Q AC A3C
36 pages
Reinforcement Learning
No ratings yet
Reinforcement Learning
34 pages
Q Learning Ejemplo
100% (1)
Q Learning Ejemplo
11 pages
Lec 09
No ratings yet
Lec 09
26 pages
Exp1 D16AD 60
No ratings yet
Exp1 D16AD 60
11 pages
Reinforcement Learning II
No ratings yet
Reinforcement Learning II
28 pages
Unit - 5
No ratings yet
Unit - 5
43 pages
Lecture Notes On Reinforcement Learning Basics
No ratings yet
Lecture Notes On Reinforcement Learning Basics
6 pages
Unit-5 Part C 1) Explain The Q Function and Q Learning Algorithm Assuming Deterministic Rewards and Actions With Example. Ans)
No ratings yet
Unit-5 Part C 1) Explain The Q Function and Q Learning Algorithm Assuming Deterministic Rewards and Actions With Example. Ans)
11 pages
Q Learning
No ratings yet
Q Learning
38 pages
Q-Learning for Room Navigation Simulation
100% (1)
Q-Learning for Room Navigation Simulation
15 pages
Reinforcement Learning II
No ratings yet
Reinforcement Learning II
28 pages
Learning
No ratings yet
Learning
25 pages
Ai (It) Unit-5
No ratings yet
Ai (It) Unit-5
43 pages
Q Learning
No ratings yet
Q Learning
9 pages
Learning Task
No ratings yet
Learning Task
14 pages
Unit 5
No ratings yet
Unit 5
107 pages
5 Le
100% (1)
5 Le
36 pages
Lec 11
No ratings yet
Lec 11
45 pages
CSD411-Week 3 - Learning Paradigms and Mathematical Foundations
No ratings yet
CSD411-Week 3 - Learning Paradigms and Mathematical Foundations
132 pages
ML - Unit 3 - Part II
No ratings yet
ML - Unit 3 - Part II
51 pages
21 - Reinforcement Learning
No ratings yet
21 - Reinforcement Learning
25 pages
Neural Networks Reinforcement Learning
No ratings yet
Neural Networks Reinforcement Learning
22 pages
Fai Mid2 4ans
No ratings yet
Fai Mid2 4ans
4 pages
Hota ML ReinforcementLearning
No ratings yet
Hota ML ReinforcementLearning
12 pages
Q Learing
No ratings yet
Q Learing
30 pages
Lecture 3.1 AML
No ratings yet
Lecture 3.1 AML
65 pages
Q Learning SARSA Deep Q Learning
No ratings yet
Q Learning SARSA Deep Q Learning
4 pages
Using Q-Learning To Automatically Tune Quadcopter PID Controller Online For Fast Altitude Stabilization
No ratings yet
Using Q-Learning To Automatically Tune Quadcopter PID Controller Online For Fast Altitude Stabilization
6 pages
AI 11 Reinforcement Learning II
No ratings yet
AI 11 Reinforcement Learning II
35 pages
Machine Learning Course Guide
No ratings yet
Machine Learning Course Guide
151 pages
AI Seminar RL
No ratings yet
AI Seminar RL
27 pages
Q Learning
No ratings yet
Q Learning
6 pages
Introduction to Machine Learning Concepts
100% (2)
Introduction to Machine Learning Concepts
102 pages
Introduction to Reinforcement Learning
No ratings yet
Introduction to Reinforcement Learning
56 pages
Unit 1
No ratings yet
Unit 1
18 pages
IEEE Conference Template
No ratings yet
IEEE Conference Template
4 pages
25 4 2025 Kdcs
No ratings yet
25 4 2025 Kdcs
12 pages
4 4 2025 Pre - Tsthap
No ratings yet
4 4 2025 Pre - Tsthap
7 pages
Ôn Thi GK
No ratings yet
Ôn Thi GK
6 pages
Review Chap 1
No ratings yet
Review Chap 1
5 pages
So Do Nguyen Ly
No ratings yet
So Do Nguyen Ly
1 page
So Do Nguyen Ly
No ratings yet
So Do Nguyen Ly
1 page
Family Consumption & Marketing
100% (1)
Family Consumption & Marketing
11 pages
Ørsted Graduate Programme FAQs
No ratings yet
Ørsted Graduate Programme FAQs
3 pages
Early Childhood Cirriculum 0-3
100% (2)
Early Childhood Cirriculum 0-3
213 pages
Sales Management: An Overview
No ratings yet
Sales Management: An Overview
5 pages
NCOI Annotations Form For Teacher IV Applicant
81% (16)
NCOI Annotations Form For Teacher IV Applicant
5 pages
Group 2 Crime Mapping
No ratings yet
Group 2 Crime Mapping
15 pages
Final Themes-Essence
No ratings yet
Final Themes-Essence
4 pages
Encrypted Document Content
No ratings yet
Encrypted Document Content
41 pages
5e Lesson Plan Template 1
No ratings yet
5e Lesson Plan Template 1
7 pages
Young Adults' War and Hope Analysis
No ratings yet
Young Adults' War and Hope Analysis
2 pages
14 - Friend Objection - UMP University
No ratings yet
14 - Friend Objection - UMP University
11 pages
hrmc002 Assignment Solutions
No ratings yet
hrmc002 Assignment Solutions
9 pages
Clairvision Visual Art
100% (2)
Clairvision Visual Art
43 pages
Recognizing A Firm's Intellectual Assets: Moving Beyond A Firm's Tangible Resources
0% (1)
Recognizing A Firm's Intellectual Assets: Moving Beyond A Firm's Tangible Resources
15 pages
WRITTEN WORKS 1: Changes in The Physical and Sexual Self: Female Male
No ratings yet
WRITTEN WORKS 1: Changes in The Physical and Sexual Self: Female Male
1 page
English 10 Test Specification
No ratings yet
English 10 Test Specification
2 pages
Understanding Depression in Schools
100% (2)
Understanding Depression in Schools
32 pages
Individual Audit Process Flowchart
No ratings yet
Individual Audit Process Flowchart
2 pages
Unit 5 Lesson 1 2025
No ratings yet
Unit 5 Lesson 1 2025
3 pages
The Bermuda Triangle: Quiz
No ratings yet
The Bermuda Triangle: Quiz
2 pages
Neurologic Assessment Quiz Guide
No ratings yet
Neurologic Assessment Quiz Guide
3 pages
Leadership
No ratings yet
Leadership
8 pages
St. Xavier's Student Drug Testing FAQ
No ratings yet
St. Xavier's Student Drug Testing FAQ
4 pages
Competency Assessor'S Script: National Assessment
No ratings yet
Competency Assessor'S Script: National Assessment
5 pages
Grant Lewi - Heaven Knows What
90% (10)
Grant Lewi - Heaven Knows What
212 pages
NR320 Chapter 8 Therapeutic Communication
No ratings yet
NR320 Chapter 8 Therapeutic Communication
1 page
Social Experiment
No ratings yet
Social Experiment
8 pages
Ethical Reflection Assignment
No ratings yet
Ethical Reflection Assignment
5 pages
UPSC, TT
No ratings yet
UPSC, TT
2 pages
Science Recycling Inquiry Lesson Plan
No ratings yet
Science Recycling Inquiry Lesson Plan
9 pages

Q Learning

Uploaded by

Q Learning

Uploaded by

Artificial Intelligence

Pham Viet Cuong

You might also like