05月24日(Wed) 17:50〜19:30 P会場(ウインクあいち-10F 1008会議室)
演題番号 | 2P4-2 |
---|---|
題目 | 逆強化学習における制約条件の緩和法 |
著者 | 北里 勇樹(千葉大学大学院工学研究科都市環境システムコース) 荒井 幸代(千葉大学大学院工学研究科都市環境システムコース) |
時間 | 05月24日(Wed) 18:10〜18:30 |
概要 | 代表的な逆強化学習の一つであるNgの逆強化学習は制約付き最適化問題として定式化される。最適方策の獲得を保証するための制約条件は価値関数に基づいて計算されるが,大規模な環境においては,状態数に比例した制約条件数の増加により,問題の解決が困難となる。そこで本研究ではスケーラブルな逆強化学習を提案する。既存手法における制約条件を緩和し,計算機実験により,既存手法と比較する。 |
論文 | PDFファイル |