1L5-2 exploration率の共有範囲によるマルチエージェント強化学習の考察

*セッションの無断動画配信はご遠慮下さい。

05月30日(Sat) 17:20〜19:00 L会場(研究棟2F-中講義室 (R791))
1L5 「強化学習とエージェント」

演題番号	1L5-2
題目	exploration率の共有範囲によるマルチエージェント強化学習の考察
著者	岡野拓哉(東京工業大学/総合理工学研究科/知能システム科学専攻,(独)産業技術総合研究所/サービス工学研究センター) 野田五十樹(東京工業大学大学院総合理工学研究科知能システム科学専攻 ,(独)産業技術総合研究所サービス工学研究センター,JST)
時間	05月30日(Sat) 17:40〜18:00
概要	マルチエージェント強化学習(以下 MARL)の情報共有の研究は数多く行われている。多くの研究では経験や報酬テーブルを共有している。しかし、人間社会では行動に対しての考え方（慎重や大胆など）と言えるexploration率の共有についてはあまり研究されていない。そこで、本研究では、exploration率を共有することによるMARLの系の変化を考察する。
論文	PDFファイル