/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2017ホーム /

4C2-3 ロバスト方策を用いた探索木によるベイジアン強化学習アプローチ

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2017 このエントリーをはてなブックマークに追加

05月26日(Fri) 14:10〜15:50 C会場(ウインクあいち-9F 902会議室)
4C2 機械学習「機械学習-強化学習(2)」

演題番号4C2-3
題目ロバスト方策を用いた探索木によるベイジアン強化学習アプローチ
著者菱沼 徹(京都大学大学院 工学研究科 航空宇宙工学専攻)
泉田 啓(京都大学大学院 工学研究科 航空宇宙工学専攻)
時間05月26日(Fri) 14:50〜15:10
概要本研究では,「ロバスト方策を用いた前進探索木」というベイジアン強化学習の近似問題の枠組みを提案する.この枠組みは,物理システム等の,不確定性が存在する実環境下でエージェントが安全に探索しつつタスクを達成する状況に対して設計されている.この枠組みは,安全でかつロバスト制御より優れた探索性能,実装可能な計算量,という利点を持つ.この枠組みを数値例題に適用し,実現される挙動の性質と有効性を議論する.
論文PDFファイル