/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2017ホーム /

2P4-2 逆強化学習における制約条件の緩和法

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2017 このエントリーをはてなブックマークに追加

05月24日(Wed) 17:50〜19:30 P会場(ウインクあいち-10F 1008会議室)
2P4 機械学習「機械学習-強化学習(1)」

演題番号2P4-2
題目逆強化学習における制約条件の緩和法
著者北里 勇樹(千葉大学大学院工学研究科都市環境システムコース)
荒井 幸代(千葉大学大学院工学研究科都市環境システムコース)
時間05月24日(Wed) 18:10〜18:30
概要代表的な逆強化学習の一つであるNgの逆強化学習は制約付き最適化問題として定式化される。最適方策の獲得を保証するための制約条件は価値関数に基づいて計算されるが,大規模な環境においては,状態数に比例した制約条件数の増加により,問題の解決が困難となる。そこで本研究ではスケーラブルな逆強化学習を提案する。既存手法における制約条件を緩和し,計算機実験により,既存手法と比較する。
論文PDFファイル