4C2-1 協調行動の獲得に向けた逆強化学習の導入

*セッションの無断動画配信はご遠慮下さい。

05月26日(Fri) 14:10〜15:50 C会場(ウインクあいち-9F 902会議室)
4C2 機械学習「機械学習-強化学習（２）」

演題番号	4C2-1
題目	協調行動の獲得に向けた逆強化学習の導入
著者	本木雄斗(千葉大学大学院融合理工学府　地球環境科学専攻　都市環境システムコース) 荒井幸代(千葉大学大学院工学研究科都市環境システムコース)
時間	05月26日(Fri) 14:10〜14:30
概要	マルチエージェント系のうち，各々のタスク達成の過程で行動の競合が生じる問題を対象とする．譲歩含む協調行動を強化学習によって獲得させるには，他者の行動や状態の共有が必要となるが状態空間が膨大となる．そこで本論文では，協調行動を報酬関数の設計によって獲得させることを考える．具体的には，Abbeelの逆強化学習をマルチエージェント系に導入する際に生じる問題を指摘し，これらの問題を回避する方法を提案する．
論文	PDFファイル