/ 戻る / プログラム / 発表一覧 / 著者一覧 / JSAI2003 ホーム /

3F4-02 罰を考慮したProfit Sharing強化学習法

6月27日(金) 15:00〜15:20 F 小会議室1+2

演題番号3F4-02
題目罰を考慮したProfit Sharing強化学習法
著者鈴木 淳司 (名古屋工業大学)
時間6月27日(金) 15:00〜15:20
セッション強化学習 (14:40〜17:20 F 小会議室1+2)
概要本研究では、Profit Sharing(PS)を扱う。従来のPSは、罰を禁止している。
本論文では、行動の優先度を常に正に補正するための項を加えることで、罰を扱う手法を提案する。
また、実験により提案手法の有効性を確認する。


論文PDFファイル, PDFファイル(会場ローカル)




/ 戻る / プログラム / 発表一覧 / 著者一覧 / JSAI2003 ホーム /

システム管理者 (jsai2003-admin@nii.ac.jp)