/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2015ホーム /

1F3-1 エネルギベースドモデルを用いた強化学習のための多層パーセプトロン構造

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2015 このエントリーをはてなブックマークに追加

05月30日(Sat) 13:20〜15:00 F会場(5F北-中講義室 (594))
1F3 「強化学習(1)」

演題番号1F3-1
題目エネルギベースドモデルを用いた強化学習のための多層パーセプトロン構造
著者吉田 尚人(東北大学医工学研究科医工学専攻)
時間05月30日(Sat) 13:20〜13:40
概要近年,エージェントの方策の表現にエネルギ関数を導入しBoltzmann分布を用いるエネルギベースドモデルが提案されている.本研究はActor-Critic手法のActorにエネルギベースドモデルを用いる新たな学習手法を提案する.またActorの学習において誤差逆伝播法を用いる際の問題点が,2つのニューラルネットワークを用いて定義したエネルギ関数を用いることで解消される事を実験的に示す.
論文PDFファイル