2L1-4in 限定合理性に触発された強化学習法によるロボット運動学習

*セッションの無断動画配信はご遠慮下さい。

05月31日(Sun) 09:00〜10:20 L会場(研究棟2F-中講義室 (R791))
2L1 「強化学習（２）」
06月01日(Mon) 09:00〜11:00 L会場(研究棟2F-中講義室 (R791))
3O1 「インタラクティブセッション」

演題番号	2L1-4in
題目	限定合理性に触発された強化学習法によるロボット運動学習
著者	水戸亜友美(東京電機大学理工学部) 牛田有哉(東京電機大学理工学部) 朝倉勇護(東京電機大学理工学部) 甲野佑(東京電機大学大学院先端科学技術研究科情報学専攻) 横須賀聡(東京電機大学理工学部) 浦上大輔(日本大学生産工学部数理情報工学科) 高橋達二(東京電機大学理工学部)
時間	05月31日(Sun) 10:00〜10:20【一般口頭発表】 06月01日(Mon) 09:00〜11:00【インタラクティブ発表】
概要	状態観測の不完全性、計算・記憶資源の有限性から、エージェントが完全な合理性を持つことは一般に不可能であり、より弱い限定合理性を考える必要がある。限定合理性下の意志決定では、最適化ではなく、ある価値基準を超える選択肢でよしとし、別の行動に移る満足化が中心的な方策となる。本研究では満足化の新しいモデリングに基づき、強化学習による粗視化された力学系の制御（ロボットの運動学習）に適用する。
論文	PDFファイル