06月06日(Mon) 10:20~12:00 M会場(81名-AIM3F 315会議室)
時間 | 10:20~10:40 |
---|---|
題目 | 1M2-1 線条体の動作に触発された習慣形成の強化学習モデル |
著者 |
甲野 佑(東京電機大学大学院 先端科学技術研究科 情報学専攻) 水戸 亜友美(東京電機大学 理工学部) 太田 宏之(防衛医科大学校生理学講座) 高橋 達二(東京電機大学 理工学部) 笹川 隆史(東京電気大学 理工学部) |
論文 | PDFファイル |
時間 | 10:40~11:00 |
---|---|
題目 | 1M2-2 報酬関数と状態表現の相互改善による徒弟学習の効率化 |
著者 |
吉永 和史(千葉大学大学院工学研究科都市環境システムコース) 荒井 幸代(千葉大学大学院工学研究科都市環境システムコース) |
論文 | PDFファイル |
時間 | 11:00~11:20 |
---|---|
題目 | 1M2-3 探索割合を自律調節する強化学習手法-満足化基準の動的獲得- |
著者 |
牛田 有哉(東京電機大学 理工学部) 甲野 佑(東京電機大学大学院 先端科学技術研究科 情報学専攻) 浦上 大輔(日本大学生産工学部数理情報工学科) 高橋 達二(東京電機大学 理工学部) |
論文 | PDFファイル |
時間 | 11:20~11:40 |
---|---|
題目 | 1M2-4 成功確率と収益を組み合わせた行動価値に基づく強化学習 |
著者 |
堀江 直人(名古屋工業大学工学部情報工学科) 松井 藤五郎(中部大学工学部情報工学科,中部大学生命健康科学部臨床工学科) 森山 甲一(名古屋工業大学 大学院工学研究科) 武藤 敦子(名古屋工業大学) 犬塚 信博(名古屋工業大学 工学研究科情報工学専攻) |
論文 | PDFファイル |