/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2015ホーム /

1F3 「強化学習(1)」

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2015 このエントリーをはてなブックマークに追加

05月30日(Sat) 13:20~15:00 F会場(5F北-中講義室 (594))
座長 谷口 忠大(立命館大学)

発表一覧

時間 13:20~13:40
題目 1F3-1 エネルギベースドモデルを用いた強化学習のための多層パーセプトロン構造
著者 吉田 尚人(東北大学医工学研究科医工学専攻)
論文 PDFファイル

時間 13:40~14:00
題目 1F3-2 Actor-criticアルゴリズムにおけるactorの効率的学習のためのcriticの学習
著者 横山 裕樹(大阪大学大学院工学研究科知能・機能創成工学専攻)
浅田 稔(大阪大学大学院工学研究科知能機能創成工学専攻)
論文 PDFファイル

時間 14:00~14:20
題目 1F3-3 予算制限バンディットアルゴリズムLAKUBEの探索率設定方法の提案
著者 新美 真(情報工学科)
伊藤 孝行(名古屋工業大学大学院産業戦略工学専攻)
論文 PDFファイル

時間 14:20~14:40
題目 1F3-4 Exploration 率の進化計算的改善の可能性について
著者 野田 五十樹((独)産業技術総合研究所 サービス工学研究センター,東京工業大学大学院総合理工学研究科知能システム科学専攻 ,JST)
論文 PDFファイル

時間 14:40~15:00
題目 1F3-5in 因果強度を用いた強化学習における価値配分手法
著者 小川 絢加(東京電機大学 理工学部)
澤山 熱気(東京電機大学 理工学部)
甲野 佑(東京電機大学大学院 先端科学技術研究科 情報学専攻)
高橋 達二(東京電機大学 理工学部)
論文 PDFファイル