/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2017ホーム /

4C2-1 協調行動の獲得に向けた逆強化学習の導入

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2017 このエントリーをはてなブックマークに追加

05月26日(Fri) 14:10〜15:50 C会場(ウインクあいち-9F 902会議室)
4C2 機械学習「機械学習-強化学習(2)」

演題番号4C2-1
題目協調行動の獲得に向けた逆強化学習の導入
著者本木 雄斗(千葉大学大学院融合理工学府 地球環境科学専攻 都市環境システムコース)
荒井 幸代(千葉大学 大学院工学研究科都市環境システムコース)
時間05月26日(Fri) 14:10〜14:30
概要マルチエージェント系のうち,各々のタスク達成の過程で行動の競合が生じる問題を対象とする.譲歩含む協調行動を強化学習によって獲得させるには,他者の行動や状態の共有が必要となるが状態空間が膨大となる.そこで本論文では,協調行動を報酬関数の設計によって獲得させることを考える.具体的には,Abbeelの逆強化学習をマルチエージェント系に導入する際に生じる問題を指摘し,これらの問題を回避する方法を提案する.
論文PDFファイル