/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2011ホーム /

1G1-2in 非定常N本腕バンディット問題に対する人間の認知バイアスの適用

06月01日(Wed) 09:00〜10:40 G会場(48名-会議室703)
1G1 機械学習「知識獲得と強化学習」
06月01日(Wed) 18:10〜20:10 G会場(48名-会議室703)
1P2 「インタラクティブ発表」

演題番号1G1-2in
題目非定常N本腕バンディット問題に対する人間の認知バイアスの適用
著者大用 庫智(東京電機大学大学院 理工学研究科 情報学専攻)
甲野 佑(東京電機大学大学院 理工学研究科 情報学専攻)
高橋 達二(東京電機大学 理工学部 情報システムデザイン学系)
時間06月01日(Wed) 09:20〜09:40【一般口頭発表】
06月01日(Wed) 18:10〜20:10【インタラクティブ発表】
概要強化学習や経済学、統計学などで基本的な問題として研究されているn本腕バンディット問題で、人間の認知バイアスを実装した価値関数(篠原のLSモデル)を用いると、相対的な評価をもたらすヒューリスティクスとして非常に良く働くが、その一般的な適用法はまだ与えられていない。そこで本発表では、LSを分析し一般化することで、3つ以上の選択肢や非定常な確率分布への対応を可能とし、より現実的な問題群へと応用する。
論文PDFファイル