広告
| 募集内容 |
一般枠 無料
先着順
|
|---|---|
| 申込者 | 申込者一覧を見る |
| 開催日時 |
2024/10/22(火) 19:00 ~ 20:00
|
| 募集期間 |
2024/10/15(火) 20:07
〜 |
| 会場 |
オンライン オンライン |
| 参加者への情報 |
(参加者と発表者のみに公開されます)
|
| 出席登録 |
(イベント開始時間の2時間前から終了時間まで、参加者のみに公開されます)
|
イベントの説明
Math & Codingとは
数学とプログラミングのスキルを向上させたい方が集い学び合う場です。
難しい概念や技術も、シンプルな例で確認したりメンバーが対話することで本質的な理解を得られると考えます。
本グループは、そのようなことができるようなコミュニティとなることを目指します。
◆groupページ
◆過去のイベント スクラムサインのコミュニティーページ
https://scrumsign.com/community/
強化学習とは
強化学習(Reinforcement Learning, RL)とは、逐次的意思決定を取り扱うための、数理的な枠組みである。
意思決定をする主体である「エージェント」と、意思決定の場を与える「環境」との相互作用によって逐次的意思決定の過程をモデル化した上で、環境からエージェントに与えられる報酬を最大化するように意思決定ルール(方策)を学習させていくことで、最適な意思決定ルールを獲得でき、それにより状況に応じてどのように行動すべきかの指針を得ることができる。(強化学習から信頼できる意思決定へ まえがきより)
本イベントで使用する教科書
強化学習から信頼できる意思決定へ (サイエンス社) https://amzn.asia/d/6ucjmXE
強化学習を勉強したことがない人は、以下の書籍をまず読むことをおすすめします
Reinforcement Learning: An Introduction
https://web.stanford.edu/class/psych209/Readings/SuttonBartoIPRLBook2ndEd.pdf
この教科書を学ぶ意義
この教科書は、強化学習を実際にビジネスで応用することを目的として書かれた教科書である。
強化学習をビジネスで使用する際、試行錯誤の段階で、大きな損失を出すことや、重大なミスを犯してしまうリスクが、懸念点とされてきた。
この教科書では、それらの問題に対してうまく強化学習を適用する方法について書かれている。 具体的には以下の三つである。
2章 環境をシミュレーター内に構築するオフライン学習
3章 リスクを考慮し、安定性に重点を置いた、リスク考慮型強化学習
4章 最適化問題の制約条件として、エージェントの行動に制約をつける安全性制約考慮型強化学習
これらの課題を解決し、強化学習をビジネスなどの現実問題に適用できるようにすることが、本イベントの目的、この教科書を学ぶ意義である。
進め方
基本的に強化学習から信頼できる意思決定へ(サイエンス社 梶野洸 他)を読み進めながら、事前に進行者が用意した資料を授業ノートがわりに進めていきます。
教科書の記述をよみ、定理やその証明の数式を丁寧に追って、ホワイトボードに書いて確認したりします。 数式を言葉で言い換えたり、図を書いたりして、その数式が考えられた気持ちを理解していくことを大切にしています。
事前に進行者が用意した資料に、書き込みながら進めていきます。
主催者は議論の整理、進行をし、主催者がわからないところ、疑問を抱いているところは参加者の皆さんに質問したりもします。
集まったメンバー同士で重要となる定義、定理、命題について議論しています。
聴いているいるだけの参加の仕方もOKです。
準備
Zoomで勉強会を行います。時間までにURLをお送りいたします。
対象者
実践的な強化学習を学び、実際に業務に応用する基盤を学びたい方。
教科書をある程度読んできていただくことをおすすめします。
進行
尾崎 勇介(株式会社スクラムサイン インターン)
資料 資料をもっと見る/編集する
資料が投稿されると、最新の3件が表示されます。
広告

エンジニアをつなぐ
connpass は株式会社ビープラウドが開発・運営しています