/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2017ホーム /

2B1-4 モデルベース学習を活用したDDPGのサンプル効率分析

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2017 このエントリーをはてなブックマークに追加

05月24日(Wed) 09:30〜11:10 B会場(ウインクあいち-9F 901会議室)
2B1 機械学習「機械学習-深層学習(2)」

演題番号2B1-4
題目モデルベース学習を活用したDDPGのサンプル効率分析
著者塩谷 碩彬(東京大学)
那須野 薫(東京大学)
松尾 豊(東京大学)
時間05月24日(Wed) 10:30〜10:50
概要深層強化学習は学習に多くの試行回数を必要とする。この問題を緩和する方法としてモデルベース強化学習があり、さらにモデルフリーの強化学習を組み合わせることで環境のモデルによる方策への制約を緩和しようという試みがある。本研究ではモデルベース学習を活用してモデルフリーの深層強化学習の手法であるDeep Deterministic Policy Gradientのサンプル効率が改善されるか否かを分析する。
論文PDFファイル