05月24日(Wed) 17:50~19:30 P会場(ウインクあいち-10F 1008会議室)
時間 | 17:50~18:10 |
---|---|
題目 | 2P4-1 マルチエージェント強化学習における主観的効用の進化過程に関する分析 |
著者 |
宮脇 昌哉(名古屋工業大学大学院工学研究科情報工学専攻) 森山 甲一(名古屋工業大学 大学院工学研究科) 武藤 敦子(名古屋工業大学) 松井 藤五郎(中部大学生命健康科学部臨床工学科) 犬塚 信博(名古屋工業大学 工学研究科情報工学専攻) |
論文 | PDFファイル |
時間 | 18:10~18:30 |
---|---|
題目 | 2P4-2 逆強化学習における制約条件の緩和法 |
著者 |
北里 勇樹(千葉大学大学院工学研究科都市環境システムコース) 荒井 幸代(千葉大学大学院工学研究科都市環境システムコース) |
論文 | PDFファイル |
時間 | 18:30~18:50 |
---|---|
題目 | 2P4-3 ドメイン非依存強化学習エージェントのための冗長なアクションの検出手法 |
著者 |
陣内 佑(東京大学大学院総合文化研究科) 福永 アレックス(東京大学大学院総合文化研究科) |
論文 | PDFファイル |
時間 | 18:50~19:10 |
---|---|
題目 | 2P4-4in1 逐次的自然方策勾配推定のための適応的学習率 |
著者 |
岩城 諒(大阪大学大学院工学研究科知能機能創成工学専攻) 横山 裕樹(玉川大学脳科学研究所) 浅田 稔(大阪大学大学院工学研究科知能機能創成工学専攻) |
論文 | PDFファイル |