/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2013ホーム /

1L3-OS-24a-4in 認知的な強化学習モデルに対する基準学習の応用と考察

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2013 このエントリーをはてなブックマークに追加

06月04日(Tue) 14:10〜16:10 L会場(-商工会議所9F 95-97号室)
1L3-OS-24a オーガナイズドセッション「OS-24 内部観測と推論-1」
06月05日(Wed) 13:10〜14:50 L会場(-商工会議所9F 95-97号室)
203 インタラクティブセッション「インタラクティブセッション」

演題番号1L3-OS-24a-4in
題目認知的な強化学習モデルに対する基準学習の応用と考察
著者高橋 優太(東京電機大学理工学部理工学科情報システムデザイン学系)
甲野 佑(東京電機大学大学院 先端科学技術研究科 情報学専攻)
高橋 達二(東京電機大学 理工学部 情報システムデザイン学系)
時間06月04日(Tue) 15:30〜15:50【一般口頭発表】
06月05日(Wed) 13:10〜14:50【インタラクティブ発表】
概要単純な強化学習課題であるN本腕バンディット問題において,価値関数でありながら方策としても機能する緩対称性推論モデル(LS)が存在する.LSは人間認知由来の主観確率モデルでもあり,環境の曖昧さからの推論に長けている.浦上はその性質を活かしたLS強化学習手法を考案し,複雑な運動制御課題で優れた成績を示した.本研究では,前述の手法に甲野のLS改良モデル(LS-VR)を実装し,更なる成績の向上を行なった.
論文PDFファイル