/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2013ホーム /

203-4in 近似モジュールの分割/統合による強化学習の実状態空間表現

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2013 このエントリーをはてなブックマークに追加

06月05日(Wed) 13:10〜14:50 O会場(-国際会議場2F-3F ホワイエ)
203 インタラクティブセッション「インタラクティブセッション」

演題番号203-4in
題目近似モジュールの分割/統合による強化学習の実状態空間表現
著者濱口 大樹(龍谷大学大学院理工学研究科数理情報学専攻)
佐野 彰(龍谷大学理工学部数理情報学科)
時間06月05日(Wed) 13:10〜14:50
概要実状態空間での強化学習では、状態価値関数が高次元かつ連続な入出力を持つ場合がある。一般的に複雑な目的関数を近似する為には多くの基底関数を必要とする。基底関数の線形和を用いる手法では、基底の増加に伴い計算コストが増加する。本研究では、線形和を用いず、状態空間の部分領域を独立に近似・学習するモジュールを自己組織的に配置し、各モジュールを分割/統合することで実状態空間を近似する手法を提案する。
論文PDFファイル