/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2015ホーム /

1L5-4 マルチエージェント逆強化学習による報酬設計問題の考察

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2015 このエントリーをはてなブックマークに追加

05月30日(Sat) 17:20〜19:00 L会場(研究棟2F-中講義室 (R791))
1L5 「強化学習とエージェント」

演題番号1L5-4
題目マルチエージェント逆強化学習による報酬設計問題の考察
著者荒井 幸代(千葉大学大学院工学研究科都市環境システムコース)
堀澤 雄介(ソフトバンク(株))
北里 勇樹(千葉大学大学院工学研究科建築・都市科学専攻)
時間05月30日(Sat) 18:20〜18:40
概要複数の倉庫番問題を取り上げて,複数主体が複数タスクを最適に処理するための行動計画問題を対象とする.同問題に対して経験的知識に基づいた報酬配分機構を導入によってタスク配分が改善されることを示した既存研究があるが,その最適性は保証されていない.本研究では,最適な行動系列を所与とする逆強化学習を用いて報酬関数を推定し,最適なタスク配分が実現できることを示す.また,この方法の応用場面について考察する.
論文PDFファイル