/ 戻る / プログラム / 発表一覧 / 著者一覧 / JSAI2003 ホーム /
| 演題番号 | 3F4-03 |
|---|---|
| 題目 | POMDPsへの行動優先度学習型強化学習アルゴリズムの適用 |
| 著者 | 松井 藤五郎 (名古屋工業大学) 犬塚 信博 (名古屋工業大学電気情報工学科) 世木 博久 (名古屋工業大学) |
| 時間 | 6月27日(金) 15:20〜15:40 |
| セッション | 強化学習 (14:40〜17:20 F 小会議室1+2) |
| 概要 | 本論文では,不完全知覚環境(POMDPs)にprofit sharingの類であるOnPS,FVPS,LVPSを適用する.これまでに良い結果が報告されているSarsa(0.9)とも比較し,OnPSが最も優れていることを確認した. |
| 論文 | PDFファイル, |
/ 戻る / プログラム / 発表一覧 / 著者一覧 / JSAI2003 ホーム /