/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2015ホーム /

1F3-3 予算制限バンディットアルゴリズムLAKUBEの探索率設定方法の提案

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2015 このエントリーをはてなブックマークに追加

05月30日(Sat) 13:20〜15:00 F会場(5F北-中講義室 (594))
1F3 「強化学習(1)」

演題番号1F3-3
題目予算制限バンディットアルゴリズムLAKUBEの探索率設定方法の提案
著者新美 真(情報工学科)
伊藤 孝行(名古屋工業大学大学院産業戦略工学専攻)
時間05月30日(Sat) 14:00〜14:20
概要本研究では多腕バンディット(MAB)問題を拡張した予算制限多腕バンディット(BL-MAB)問題を扱う.MAB問題とは複数のマシンをプレイするギャンブラーを模した問題である,BL—MAB問題には,コスト及び予算による制約がある.LAKUBEは,予算制約の厳しい状況を想定したバンディットアルゴリズムであり,探索時にプレイするアームの数を探索率により設定する.本研究では,探索率の設定方法の提案を行う.
論文PDFファイル