1L3-OS-24a-4in 認知的な強化学習モデルに対する基準学習の応用と考察

*セッションの無断動画配信はご遠慮下さい。

演題番号	1L3-OS-24a-4in
題目	認知的な強化学習モデルに対する基準学習の応用と考察
著者	高橋優太(東京電機大学理工学部理工学科情報システムデザイン学系) 甲野佑(東京電機大学大学院先端科学技術研究科情報学専攻) 高橋達二(東京電機大学理工学部情報システムデザイン学系)
時間	06月04日(Tue) 15:30〜15:50【一般口頭発表】 06月05日(Wed) 13:10〜14:50【インタラクティブ発表】
概要	単純な強化学習課題であるN本腕バンディット問題において，価値関数でありながら方策としても機能する緩対称性推論モデル(LS)が存在する．LSは人間認知由来の主観確率モデルでもあり，環境の曖昧さからの推論に長けている．浦上はその性質を活かしたLS強化学習手法を考案し，複雑な運動制御課題で優れた成績を示した．本研究では，前述の手法に甲野のLS改良モデル(LS-VR)を実装し，更なる成績の向上を行なった．
論文	PDFファイル