2P4-1 マルチエージェント強化学習における主観的効用の進化過程に関する分析

*セッションの無断動画配信はご遠慮下さい。

05月24日(Wed) 17:50〜19:30 P会場(ウインクあいち-10F 1008会議室)
2P4 機械学習「機械学習-強化学習（１）」

演題番号	2P4-1
題目	マルチエージェント強化学習における主観的効用の進化過程に関する分析
著者	宮脇昌哉(名古屋工業大学大学院工学研究科情報工学専攻) 森山甲一(名古屋工業大学　大学院工学研究科) 武藤敦子(名古屋工業大学) 松井藤五郎(中部大学生命健康科学部臨床工学科) 犬塚信博(名古屋工業大学工学研究科情報工学専攻)
時間	05月24日(Wed) 17:50〜18:10
概要	報酬に各個体固有の効用導出関数を適用して得られる主観的効用を用いた強化学習において、協調行動を導く主観的効用を報酬に基づいて進化させる試みが行われている。しかし、その進化の過程は未だ解明されていない。本研究では、マルチエージェント環境として繰り返し囚人のジレンマを対象にし、主観的効用の行動選択への影響や主観的効用とその進化の方向との関係に着目して主観的効用の進化過程を分析した。
論文	PDFファイル