05月30日(Sat) 17:20~19:00 L会場(研究棟2F-中講義室 (R791))
時間 | 17:20~17:40 |
---|---|
題目 | 1L5-1 強化学習を用いた繰り返しゲームにおける戦略の学習の高速化 |
著者 |
藤田 渉(大阪大学大学院情報科学研究科情報数理学専攻) 森山 甲一(大阪大学 産業科学研究所) 福井 健一(大阪大学 産業科学研究所) 沼尾 正行(大阪大学 産業科学研究所) |
論文 | PDFファイル |
時間 | 18:00~18:20 |
---|---|
題目 | 1L5-3 利己的な相互協調:強化学習主体による不確実な囚人のジレンマ |
著者 |
鳥居 拓馬(東京大学大学院 工学系研究科 システム創成学専攻) 日高 昇平(北陸先端科学技術大学院大学知識科学研究科) |
論文 | PDFファイル |
時間 | 18:20~18:40 |
---|---|
題目 | 1L5-4 マルチエージェント逆強化学習による報酬設計問題の考察 |
著者 |
荒井 幸代(千葉大学大学院工学研究科都市環境システムコース) 堀澤 雄介(ソフトバンク(株)) 北里 勇樹(千葉大学大学院工学研究科建築・都市科学専攻) |
論文 | PDFファイル |