/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2017ホーム /

1A2-OS-05b-1 深層強化学習におけるオフライン事前学習法

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2017 このエントリーをはてなブックマークに追加

05月23日(Tue) 15:50〜17:30 A会場(ウインクあいち-2F 大ホール)
1A2-OS-05b オーガナイズドセッション「OS-5 Deep Learning(2)」

演題番号1A2-OS-05b-1
題目深層強化学習におけるオフライン事前学習法
著者那須野 薫(東京大学,東京大学)
松尾 豊(東京大学)
時間05月23日(Tue) 15:50〜16:10
概要近年,深層強化学習研究の進展は目覚ましい.しかし,多くの研究はオンラインでの学習に焦点を当てている.実際の応用では,人間のオペレータによる最適に近い操作データをオフラインの事前学習に活用できる可能性がある.本研究では,オフラインで事前学習した深層強化学習の方策を分析する.実験では,方策関数を教師あり学習した後にオフライン強化学習する事前学習法が収束速度や安定性の向上に有効であった.
論文PDFファイル