2M5-OS-32b-2 マルチエージェント強化学習におけるエピソードの順序が獲得方策に与える影響

*セッションの無断動画配信はご遠慮下さい。

演題番号	2M5-OS-32b-2
題目	マルチエージェント強化学習におけるエピソードの順序が獲得方策に与える影響
著者	木村祥(千葉大学大学院融合理工学府地球環境科学専攻都市環境システムコース) 荒井幸代(千葉大学大学院工学研究科都市環境システムコース)
時間	05月24日(Wed) 19:50〜20:10
概要	マルチエージェント強化学習では，同時学習問題や不完全知覚問題に起因する非マルコフ性が最適な方策への収束を困難にしている。従来，発散を回避し，収束を促すための手段は，行動選択における探索（explore）の割合を小さくするなどの対症療法に依存している。そこで本研究では，エピソードの経験順序に着目し，追跡問題を対象として，学習の収束の効率，および収束値の改善に与える影響を考察する。
論文	PDFファイル