4C2-3 ロバスト方策を用いた探索木によるベイジアン強化学習アプローチ

*セッションの無断動画配信はご遠慮下さい。

05月26日(Fri) 14:10〜15:50 C会場(ウインクあいち-9F 902会議室)
4C2 機械学習「機械学習-強化学習（２）」

演題番号	4C2-3
題目	ロバスト方策を用いた探索木によるベイジアン強化学習アプローチ
著者	菱沼徹(京都大学大学院　工学研究科　航空宇宙工学専攻) 泉田啓(京都大学大学院　工学研究科　航空宇宙工学専攻)
時間	05月26日(Fri) 14:50〜15:10
概要	本研究では，「ロバスト方策を用いた前進探索木」というベイジアン強化学習の近似問題の枠組みを提案する．この枠組みは，物理システム等の，不確定性が存在する実環境下でエージェントが安全に探索しつつタスクを達成する状況に対して設計されている．この枠組みは，安全でかつロバスト制御より優れた探索性能，実装可能な計算量，という利点を持つ．この枠組みを数値例題に適用し，実現される挙動の性質と有効性を議論する．
論文	PDFファイル