meta-learning

モデル

自動進化する強化学習でDDQNを凌駕する(1/2)

1.自動進化する強化学習でDDQNを凌駕する(1/2)まとめ・強化学習の長期的で包括的な目標は様々な問題を解決できる単一の汎用学習アルゴリズムの設計・強化学習は多岐にわたるため、学習方法を学習して新しいRLを設計するメタ学習手法が有望・グラ...
モデル

ロボット工学における進化的メタラーニングの探索(3/3)

1.ロボット工学における進化的メタラーニングの探索(3/3)まとめ・ES-MAMLは優れたパフォーマンスを持つが現実世界に展開する事は依然として困難・現実世界のデータをできるだけ少なくするために、新規にバッチ山登り法を導入・その結果、現実世...
モデル

ロボット工学における進化的メタラーニングの探索(1/3)

1.ロボット工学における進化的メタラーニングの探索(1/3)まとめ・シミュレーションによりロボットのトレーニングは実現しやすくなったがギャップが存在・シミュレーション環境と現実世界の間に存在する微妙なギャップで意図した通りに動かない・進化的...
モデル

MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(3/3)

1.MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(3/3)まとめ・報酬が疎になる作業を学習させるためにカルバック・ライブラー情報量(KL)を利用している・カルバック・ライブラー情報量は、2つの異なる確率分布がどの程度異なるかを示す尺度...