/ プログラム / 発表一覧 / 著者一覧 / JSAI2005 ホーム

1D4-03 事例に基づく関係的な強化学習のエレベータ制御問題への適用

6月15日(水) 17:00〜18:40 D会場
強化学習・応用

演題番号1D4-03
題目事例に基づく関係的な強化学習のエレベータ制御問題への適用
著者大久保 隆晴 (東京工業大学 大学院情報理工学研究科 計算工学専攻)
亀谷 由隆 (東京工業大学 大学院情報理工学研究科 計算工学専攻)
佐藤 泰介 (東京工業大学 大学院情報理工学研究科 計算工学専攻)
時間6月15日(水) 17:40〜18:00
概要Q学習のような強化学習手法には、保持するテーブルが非常に大きくなるという問題がある。事例に基づく関係的な強化学習はこれを解決する手法の一つとして知られている。本論文ではこの手法をエレベータ制御問題に適用し、その動作を考察した。
論文PDFファイル

/ プログラム / 発表一覧 / 著者一覧 / JSAI2005 ホーム