/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2013ホーム /

1L4-OS-24b-5in ヒトの適応的認知特性によるモンテカルロ木探索の効率化

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2013 このエントリーをはてなブックマークに追加

06月04日(Tue) 16:20〜18:20 L会場(-商工会議所9F 95-97号室)
1L4-OS-24b オーガナイズドセッション「OS-24 内部観測と推論-2」
06月05日(Wed) 13:10〜14:50 L会場(-商工会議所9F 95-97号室)
203 インタラクティブセッション「インタラクティブセッション」

演題番号1L4-OS-24b-5in
題目ヒトの適応的認知特性によるモンテカルロ木探索の効率化
著者西村 友伸(東京電機大学大学院理工学研究科情報学専攻)
大用 庫智(東京電機大学大学院 先端科学技術研究科 情報学専攻)
高橋 達二(東京電機大学 理工学部 情報システムデザイン学系)
時間06月04日(Tue) 17:40〜18:00【一般口頭発表】
06月05日(Wed) 13:10〜14:50【インタラクティブ発表】
概要状態・行動価値を人間の因果的直感に従って相対評価するLSVRが近年研究され、n本腕バンディット問題を始めとした不確実性の下での学習と意思決定における有効性が示されている。本研究では囲碁とリバーシ上のMCTSの評価値としてこれを適用し、UCTよりも優れた結果を得た。さらに、LSVRとUCB1の組み合わせや、AMAF等のボードゲーム向け手法との組み合わせについても論じる。
論文PDFファイル