06月04日(Tue) 16:20〜18:20 L会場(-商工会議所9F 95-97号室)
演題番号 | 1L4-OS-24b-5in |
---|---|
題目 | ヒトの適応的認知特性によるモンテカルロ木探索の効率化 |
著者 | 西村 友伸(東京電機大学大学院理工学研究科情報学専攻) 大用 庫智(東京電機大学大学院 先端科学技術研究科 情報学専攻) 高橋 達二(東京電機大学 理工学部 情報システムデザイン学系) |
時間 | 06月04日(Tue) 17:40〜18:00【一般口頭発表】06月05日(Wed) 13:10〜14:50【インタラクティブ発表】 |
概要 | 状態・行動価値を人間の因果的直感に従って相対評価するLSVRが近年研究され、n本腕バンディット問題を始めとした不確実性の下での学習と意思決定における有効性が示されている。本研究では囲碁とリバーシ上のMCTSの評価値としてこれを適用し、UCTよりも優れた結果を得た。さらに、LSVRとUCB1の組み合わせや、AMAF等のボードゲーム向け手法との組み合わせについても論じる。 |
論文 | PDFファイル |