/ 戻る / プログラム / 発表一覧 / 著者一覧 / JSAI2003 ホーム /
演題番号 | 3F4-02 |
---|---|
題目 | 罰を考慮したProfit Sharing強化学習法 |
著者 | 鈴木 淳司 (名古屋工業大学) |
時間 | 6月27日(金) 15:00〜15:20 |
セッション | 強化学習 (14:40〜17:20 F 小会議室1+2) |
概要 | 本研究では、Profit Sharing(PS)を扱う。従来のPSは、罰を禁止している。 本論文では、行動の優先度を常に正に補正するための項を加えることで、罰を扱う手法を提案する。 また、実験により提案手法の有効性を確認する。 |
論文 | PDFファイル, |
/ 戻る / プログラム / 発表一覧 / 著者一覧 / JSAI2003 ホーム /