05月31日(Sun) 09:00〜10:20 L会場(研究棟2F-中講義室 (R791))
演題番号 | 2L1-4in |
---|---|
題目 | 限定合理性に触発された強化学習法によるロボット運動学習 |
著者 | 水戸 亜友美(東京電機大学 理工学部) 牛田 有哉(東京電機大学 理工学部) 朝倉 勇護(東京電機大学 理工学部) 甲野 佑(東京電機大学大学院 先端科学技術研究科 情報学専攻) 横須賀 聡(東京電機大学 理工学部) 浦上 大輔(日本大学生産工学部数理情報工学科) 高橋 達二(東京電機大学 理工学部) |
時間 | 05月31日(Sun) 10:00〜10:20【一般口頭発表】06月01日(Mon) 09:00〜11:00【インタラクティブ発表】 |
概要 | 状態観測の不完全性、計算・記憶資源の有限性から、エージェントが完全な合理性を持つことは一般に不可能であり、より弱い限定合理性を考える必要がある。限定合理性下の意志決定では、最適化ではなく、ある価値基準を超える選択肢でよしとし、別の行動に移る満足化が中心的な方策となる。本研究では満足化の新しいモデリングに基づき、強化学習による粗視化された力学系の制御(ロボットの運動学習)に適用する。 |
論文 | PDFファイル |