06月04日(Tue) 14:10〜16:10 L会場(-商工会議所9F 95-97号室)
演題番号 | 1L3-OS-24a-4in |
---|---|
題目 | 認知的な強化学習モデルに対する基準学習の応用と考察 |
著者 | 高橋 優太(東京電機大学理工学部理工学科情報システムデザイン学系) 甲野 佑(東京電機大学大学院 先端科学技術研究科 情報学専攻) 高橋 達二(東京電機大学 理工学部 情報システムデザイン学系) |
時間 | 06月04日(Tue) 15:30〜15:50【一般口頭発表】06月05日(Wed) 13:10〜14:50【インタラクティブ発表】 |
概要 | 単純な強化学習課題であるN本腕バンディット問題において,価値関数でありながら方策としても機能する緩対称性推論モデル(LS)が存在する.LSは人間認知由来の主観確率モデルでもあり,環境の曖昧さからの推論に長けている.浦上はその性質を活かしたLS強化学習手法を考案し,複雑な運動制御課題で優れた成績を示した.本研究では,前述の手法に甲野のLS改良モデル(LS-VR)を実装し,更なる成績の向上を行なった. |
論文 | PDFファイル |