05月30日(Sat) 17:20〜19:00 L会場(研究棟2F-中講義室 (R791))
演題番号 | 1L5-4 |
---|---|
題目 | マルチエージェント逆強化学習による報酬設計問題の考察 |
著者 | 荒井 幸代(千葉大学大学院工学研究科都市環境システムコース) 堀澤 雄介(ソフトバンク(株)) 北里 勇樹(千葉大学大学院工学研究科建築・都市科学専攻) |
時間 | 05月30日(Sat) 18:20〜18:40 |
概要 | 複数の倉庫番問題を取り上げて,複数主体が複数タスクを最適に処理するための行動計画問題を対象とする.同問題に対して経験的知識に基づいた報酬配分機構を導入によってタスク配分が改善されることを示した既存研究があるが,その最適性は保証されていない.本研究では,最適な行動系列を所与とする逆強化学習を用いて報酬関数を推定し,最適なタスク配分が実現できることを示す.また,この方法の応用場面について考察する. |
論文 | PDFファイル |