06月05日(Wed) 13:10〜14:50 O会場(-国際会議場2F-3F ホワイエ)
演題番号 | 203-4in |
---|---|
題目 | 近似モジュールの分割/統合による強化学習の実状態空間表現 |
著者 | 濱口 大樹(龍谷大学大学院理工学研究科数理情報学専攻) 佐野 彰(龍谷大学理工学部数理情報学科) |
時間 | 06月05日(Wed) 13:10〜14:50 |
概要 | 実状態空間での強化学習では、状態価値関数が高次元かつ連続な入出力を持つ場合がある。一般的に複雑な目的関数を近似する為には多くの基底関数を必要とする。基底関数の線形和を用いる手法では、基底の増加に伴い計算コストが増加する。本研究では、線形和を用いず、状態空間の部分領域を独立に近似・学習するモジュールを自己組織的に配置し、各モジュールを分割/統合することで実状態空間を近似する手法を提案する。 |
論文 | PDFファイル |