05月15日(Thu) 09:00〜10:40 H会場(102人-ひめぎんホール 第8会議室)
演題番号 | 4H1-4 |
---|---|
題目 | 繰り返しゲームでの強化学習アルゴリズムの組み合わせによる協調行動の学習 |
著者 | 藤田 渉(大阪大学工学部応用自然科学科) 森山 甲一(大阪大学 産業科学研究所) 福井 健一(大阪大学 産業科学研究所) 沼尾 正行(大阪大学 産業科学研究所) |
時間 | 05月15日(Thu) 10:00〜10:20 |
概要 | マルチエージェント系での学習では、エージェントが全体ではなく個々の最適戦略を学習してしまう問題がある。本研究では、利益を追求する戦略と損失を回避する戦略をバランスよく選択するM-Qubedと、M-Qubedが上手く振る舞えないゲームにおいて協調を導くS-algという相補的な性質を持つ強化学習アルゴリズムを組み合わせ、繰り返し非ゼロ和ゲーム中で性能を分析し協調行動の発生の有無を確認する。 |
論文 | PDFファイル |