4H1-4 繰り返しゲームでの強化学習アルゴリズムの組み合わせによる協調行動の学習

*セッションの無断動画配信はご遠慮下さい。

05月15日(Thu) 09:00〜10:40 H会場(102人-ひめぎんホール第8会議室)
4H1 「強化学習とエージェント」

演題番号	4H1-4
題目	繰り返しゲームでの強化学習アルゴリズムの組み合わせによる協調行動の学習
著者	藤田渉(大阪大学工学部応用自然科学科) 森山甲一(大阪大学産業科学研究所) 福井健一(大阪大学産業科学研究所) 沼尾正行(大阪大学産業科学研究所)
時間	05月15日(Thu) 10:00〜10:20
概要	マルチエージェント系での学習では、エージェントが全体ではなく個々の最適戦略を学習してしまう問題がある。本研究では、利益を追求する戦略と損失を回避する戦略をバランスよく選択するM-Qubedと、M-Qubedが上手く振る舞えないゲームにおいて協調を導くS-algという相補的な性質を持つ強化学習アルゴリズムを組み合わせ、繰り返し非ゼロ和ゲーム中で性能を分析し協調行動の発生の有無を確認する。
論文	PDFファイル