05月12日(Mon) 13:20〜15:00 D会場(48人-ひめぎんホール 第3会議室)
演題番号 | 1D3-4 |
---|---|
題目 | POMDP環境下での強化学習におけるGAによるサブゴールの動的生成 |
著者 | 野村 拓己(名古屋工業大学情報工学科) 加藤 昇平(名古屋工業大学大学院 工学研究科 情報工学専攻) |
時間 | 05月12日(Mon) 14:20〜14:40 |
概要 | 強化学習において常に完全な観測情報を獲得するとは限らず,異なる状態を同一の状態と知覚する問題がある.従来手法ではサブゴールを生成することでこの問題を解決したが,サブゴール数を予め与える必要があり,また得られる解は1つであり,環境変化に脆弱である.本研究では,GAにより可変数のサブゴールを動的に生成した.実験により適切なサブゴール数,複数の解を生成し,本研究の有効性を示した. |
論文 | PDFファイル |