演題番号 | 1G1-2in |
---|---|
題目 | 非定常N本腕バンディット問題に対する人間の認知バイアスの適用 |
著者 | 大用 庫智(東京電機大学大学院 理工学研究科 情報学専攻) 甲野 佑(東京電機大学大学院 理工学研究科 情報学専攻) 高橋 達二(東京電機大学 理工学部 情報システムデザイン学系) |
時間 | 06月01日(Wed) 09:20〜09:40【一般口頭発表】06月01日(Wed) 18:10〜20:10【インタラクティブ発表】 |
概要 | 強化学習や経済学、統計学などで基本的な問題として研究されているn本腕バンディット問題で、人間の認知バイアスを実装した価値関数(篠原のLSモデル)を用いると、相対的な評価をもたらすヒューリスティクスとして非常に良く働くが、その一般的な適用法はまだ与えられていない。そこで本発表では、LSを分析し一般化することで、3つ以上の選択肢や非定常な確率分布への対応を可能とし、より現実的な問題群へと応用する。 |
論文 | PDFファイル |