/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2016ホーム /

1M2 機械学習「強化学習」

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai30th

06月06日(Mon) 10:20～12:00 M会場(81名-AIM3F 315会議室)
座長小宮山純平（東京大学生産技術研究所）

発表一覧

時間	10:20～10:40
題目	1M2-1 線条体の動作に触発された習慣形成の強化学習モデル
著者	甲野佑(東京電機大学大学院先端科学技術研究科情報学専攻) 水戸亜友美(東京電機大学理工学部) 太田宏之(防衛医科大学校生理学講座) 高橋達二(東京電機大学理工学部) 笹川隆史(東京電気大学　理工学部)
論文	PDFファイル

時間	10:40～11:00
題目	1M2-2 報酬関数と状態表現の相互改善による徒弟学習の効率化
著者	吉永和史(千葉大学大学院工学研究科都市環境システムコース) 荒井幸代(千葉大学大学院工学研究科都市環境システムコース)
論文	PDFファイル

時間	11:00～11:20
題目	1M2-3 探索割合を自律調節する強化学習手法－満足化基準の動的獲得－
著者	牛田有哉(東京電機大学理工学部) 甲野佑(東京電機大学大学院先端科学技術研究科情報学専攻) 浦上大輔(日本大学生産工学部数理情報工学科) 高橋達二(東京電機大学理工学部)
論文	PDFファイル

時間	11:20～11:40
題目	1M2-4 成功確率と収益を組み合わせた行動価値に基づく強化学習
著者	堀江直人(名古屋工業大学工学部情報工学科) 松井藤五郎(中部大学工学部情報工学科,中部大学生命健康科学部臨床工学科) 森山甲一(名古屋工業大学　大学院工学研究科) 武藤敦子(名古屋工業大学) 犬塚信博(名古屋工業大学工学研究科情報工学専攻)
論文	PDFファイル

時間	11:40～12:00
題目	1M2-5 逐次的な自然方策勾配推定法の解析と勾配推定分散の最小化による効率的な強化学習法の提案
著者	岩城諒(大阪大学大学院工学研究科知能機能創成工学専攻) 横山裕樹(玉川大学工学部機械情報システム学科) 浅田稔(大阪大学大学院工学研究科知能機能創成工学専攻)
論文	PDFファイル