/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2015ホーム /

1L5-3 利己的な相互協調:強化学習主体による不確実な囚人のジレンマ

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2015 このエントリーをはてなブックマークに追加

05月30日(Sat) 17:20〜19:00 L会場(研究棟2F-中講義室 (R791))
1L5 「強化学習とエージェント」

演題番号1L5-3
題目利己的な相互協調:強化学習主体による不確実な囚人のジレンマ
著者鳥居 拓馬(東京大学大学院 工学系研究科 システム創成学専攻)
日高 昇平(北陸先端科学技術大学院大学知識科学研究科)
時間05月30日(Sat) 18:00〜18:20
概要集団における意思決定のひとつの主題は,囚人のジレンマとして知られる,個人の利益の最大化が集団の最適解と一致しないという問題である.このジレンマの解消可能性を模索するため,本研究では,プレイヤが未知なるゲームの利得を過去の経験から学習すると仮定し分析した.この分析から,各プレイヤが自己利得を最大化した結果として,社会的ジレンマが解消され,集団最適解である相互協調が実現されうることを示された.
論文PDFファイル