/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2014ホーム /

2H1-2 e射影に基づく方策探索法

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2014 このエントリーをはてなブックマークに追加

05月13日(Tue) 09:00〜10:20 H会場(102人-ひめぎんホール 第8会議室)
2H1 「強化学習の基礎」

演題番号2H1-2
題目e射影に基づく方策探索法
著者植野 剛(科学技術振興機構 湊離散構造処理系プロジェクト)
時間05月13日(Tue) 09:20〜09:40
概要方策探索法は,方策をパラメトリック関数で記述し, そのパラメータを学習する強化学習法である.本研究では確率推論の立場から方策探索法を考察し,KL距離最小化に基づく新しい方策探索法を提案する.この提案法は大域的収束性を持つなど望ましい性質を持つが,周辺化が困難な確率分布を計算する必要がある.この問題を解決するため,確率分布の近似推論の1種であるe射影を用いた近似法も併せて提案する.
論文PDFファイル