05月26日(Fri) 14:10〜15:50 C会場(ウインクあいち-9F 902会議室)
演題番号 | 4C2-1 |
---|---|
題目 | 協調行動の獲得に向けた逆強化学習の導入 |
著者 | 本木 雄斗(千葉大学大学院融合理工学府 地球環境科学専攻 都市環境システムコース) 荒井 幸代(千葉大学 大学院工学研究科都市環境システムコース) |
時間 | 05月26日(Fri) 14:10〜14:30 |
概要 | マルチエージェント系のうち,各々のタスク達成の過程で行動の競合が生じる問題を対象とする.譲歩含む協調行動を強化学習によって獲得させるには,他者の行動や状態の共有が必要となるが状態空間が膨大となる.そこで本論文では,協調行動を報酬関数の設計によって獲得させることを考える.具体的には,Abbeelの逆強化学習をマルチエージェント系に導入する際に生じる問題を指摘し,これらの問題を回避する方法を提案する. |
論文 | PDFファイル |