/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2017ホーム /

2P4-1 マルチエージェント強化学習における主観的効用の進化過程に関する分析

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2017 このエントリーをはてなブックマークに追加

05月24日(Wed) 17:50〜19:30 P会場(ウインクあいち-10F 1008会議室)
2P4 機械学習「機械学習-強化学習(1)」

演題番号2P4-1
題目マルチエージェント強化学習における主観的効用の進化過程に関する分析
著者宮脇 昌哉(名古屋工業大学大学院工学研究科情報工学専攻)
森山 甲一(名古屋工業大学 大学院工学研究科)
武藤 敦子(名古屋工業大学)
松井 藤五郎(中部大学生命健康科学部臨床工学科)
犬塚 信博(名古屋工業大学 工学研究科情報工学専攻)
時間05月24日(Wed) 17:50〜18:10
概要報酬に各個体固有の効用導出関数を適用して得られる主観的効用を用いた強化学習において、協調行動を導く主観的効用を報酬に基づいて進化させる試みが行われている。しかし、その進化の過程は未だ解明されていない。
本研究では、マルチエージェント環境として繰り返し囚人のジレンマを対象にし、主観的効用の行動選択への影響や主観的効用とその進化の方向との関係に着目して主観的効用の進化過程を分析した。
論文PDFファイル