05月30日(Sat) 13:20〜15:00 F会場(5F北-中講義室 (594))
演題番号 | 1F3-1 |
---|---|
題目 | エネルギベースドモデルを用いた強化学習のための多層パーセプトロン構造 |
著者 | 吉田 尚人(東北大学医工学研究科医工学専攻) |
時間 | 05月30日(Sat) 13:20〜13:40 |
概要 | 近年,エージェントの方策の表現にエネルギ関数を導入しBoltzmann分布を用いるエネルギベースドモデルが提案されている.本研究はActor-Critic手法のActorにエネルギベースドモデルを用いる新たな学習手法を提案する.またActorの学習において誤差逆伝播法を用いる際の問題点が,2つのニューラルネットワークを用いて定義したエネルギ関数を用いることで解消される事を実験的に示す. |
論文 | PDFファイル |