1A2-OS-05b-1 深層強化学習におけるオフライン事前学習法

*セッションの無断動画配信はご遠慮下さい。

05月23日(Tue) 15:50〜17:30 A会場(ウインクあいち-2F 大ホール)
1A2-OS-05b オーガナイズドセッション「OS-5 Deep Learning（２）」

演題番号	1A2-OS-05b-1
題目	深層強化学習におけるオフライン事前学習法
著者	那須野薫(東京大学,東京大学) 松尾豊(東京大学)
時間	05月23日(Tue) 15:50〜16:10
概要	近年，深層強化学習研究の進展は目覚ましい．しかし，多くの研究はオンラインでの学習に焦点を当てている．実際の応用では，人間のオペレータによる最適に近い操作データをオフラインの事前学習に活用できる可能性がある．本研究では，オフラインで事前学習した深層強化学習の方策を分析する．実験では，方策関数を教師あり学習した後にオフライン強化学習する事前学習法が収束速度や安定性の向上に有効であった．
論文	PDFファイル