/ 戻る / プログラム / 発表一覧 / 著者一覧 / JSAI2003 ホーム /

3F4-03 POMDPsへの行動優先度学習型強化学習アルゴリズムの適用

6月27日(金) 15:20〜15:40 F 小会議室1+2

演題番号3F4-03
題目POMDPsへの行動優先度学習型強化学習アルゴリズムの適用
著者松井 藤五郎 (名古屋工業大学)
犬塚 信博 (名古屋工業大学電気情報工学科)
世木 博久 (名古屋工業大学)
時間6月27日(金) 15:20〜15:40
セッション強化学習 (14:40〜17:20 F 小会議室1+2)
概要本論文では,不完全知覚環境(POMDPs)にprofit sharingの類であるOnPS,FVPS,LVPSを適用する.これまでに良い結果が報告されているSarsa(0.9)とも比較し,OnPSが最も優れていることを確認した.
論文PDFファイル, PDFファイル(会場ローカル)




/ 戻る / プログラム / 発表一覧 / 著者一覧 / JSAI2003 ホーム /

システム管理者 (jsai2003-admin@nii.ac.jp)