05月31日(Sun) 09:00〜10:20 L会場(研究棟2F-中講義室 (R791))
演題番号 | 2L1-3 |
---|---|
題目 | N本腕バンディット問題における素朴満足化と満足化基準の更新法 |
著者 | 後藤田 大地(東京電機大学 理工学部) 大用 庫智(関西学院大学 総合政策学部) 高橋 達二(東京電機大学 理工学部) |
時間 | 05月31日(Sun) 09:40〜10:00 |
概要 | 不確実性下の行動選択(バンディット問題)の解法として「不確実な時には楽観的に」という考え方を持つアルゴリズムが代表的であったが、近年、その代替案として「受容可能な基準を満たす選択肢を見つけるまで探索をする」という満足化の有効性が示され初めている。しかし、バンディット問題において高成績を示すためには適切な基準の設定が必要であるため、本研究では基準の動的な自動調節による効率的な満足化の実現を目指す。 |
論文 | PDFファイル |