/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2017ホーム /

2M5-OS-32b-2 マルチエージェント強化学習におけるエピソードの順序が獲得方策に与える影響

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2017 このエントリーをはてなブックマークに追加

05月24日(Wed) 19:30〜20:10 M会場(ウインクあいち-10F 1005会議室)
2M5-OS-32b オーガナイズドセッション「OS-32 建築,都市環境のレジリエンスを支えるAI (2)」

演題番号2M5-OS-32b-2
題目マルチエージェント強化学習におけるエピソードの順序が獲得方策に与える影響
著者木村 祥(千葉大学大学院融合理工学府 地球環境科学専攻 都市環境システムコース)
荒井 幸代(千葉大学 大学院工学研究科都市環境システムコース)
時間05月24日(Wed) 19:50〜20:10
概要マルチエージェント強化学習では,同時学習問題や不完全知覚問題に起因する非マルコフ性が最適な方策への収束を困難にしている。従来,発散を回避し,収束を促すための手段は,行動選択における探索(explore)の割合を小さくするなどの対症療法に依存している。そこで本研究では,エピソードの経験順序に着目し,追跡問題を対象として,学習の収束の効率,および収束値の改善に与える影響を考察する。
論文PDFファイル