05月30日(Sat) 17:20〜19:00 L会場(研究棟2F-中講義室 (R791))
演題番号 | 1L5-2 |
---|---|
題目 | exploration率の共有範囲によるマルチエージェント強化学習の考察 |
著者 | 岡野 拓哉(東京工業大学/総合理工学研究科/知能システム科学専攻,(独)産業技術総合研究所/サービス工学研究センター) 野田 五十樹(東京工業大学大学院総合理工学研究科知能システム科学専攻 ,(独)産業技術総合研究所 サービス工学研究センター,JST) |
時間 | 05月30日(Sat) 17:40〜18:00 |
概要 | マルチエージェント強化学習(以下 MARL)の情報共有の研究は数多く行われている。 多くの研究では経験や報酬テーブルを共有している。しかし、人間社会では行動に対しての考え方(慎重や大胆など)と言えるexploration率の共有についてはあまり研究されていない。 そこで、本研究では、exploration率を共有することによるMARLの系の変化を考察する。 |
論文 | PDFファイル |