05月24日(Wed) 17:50〜19:30 P会場(ウインクあいち-10F 1008会議室)
演題番号 | 2P4-1 |
---|---|
題目 | マルチエージェント強化学習における主観的効用の進化過程に関する分析 |
著者 | 宮脇 昌哉(名古屋工業大学大学院工学研究科情報工学専攻) 森山 甲一(名古屋工業大学 大学院工学研究科) 武藤 敦子(名古屋工業大学) 松井 藤五郎(中部大学生命健康科学部臨床工学科) 犬塚 信博(名古屋工業大学 工学研究科情報工学専攻) |
時間 | 05月24日(Wed) 17:50〜18:10 |
概要 | 報酬に各個体固有の効用導出関数を適用して得られる主観的効用を用いた強化学習において、協調行動を導く主観的効用を報酬に基づいて進化させる試みが行われている。しかし、その進化の過程は未だ解明されていない。 本研究では、マルチエージェント環境として繰り返し囚人のジレンマを対象にし、主観的効用の行動選択への影響や主観的効用とその進化の方向との関係に着目して主観的効用の進化過程を分析した。 |
論文 | PDFファイル |