演題番号 | 1D4-03 |
---|---|
題目 | 事例に基づく関係的な強化学習のエレベータ制御問題への適用 |
著者 | 大久保 隆晴 (東京工業大学 大学院情報理工学研究科 計算工学専攻) 亀谷 由隆 (東京工業大学 大学院情報理工学研究科 計算工学専攻) 佐藤 泰介 (東京工業大学 大学院情報理工学研究科 計算工学専攻) |
時間 | 6月15日(水) 17:40〜18:00 |
概要 | Q学習のような強化学習手法には、保持するテーブルが非常に大きくなるという問題がある。事例に基づく関係的な強化学習はこれを解決する手法の一つとして知られている。本論文ではこの手法をエレベータ制御問題に適用し、その動作を考察した。 |
論文 | PDFファイル |