3K1-OS-06a-4 深層学習と強化学習を用いたゲームAIへの時系列予測の導入

*セッションの無断動画配信はご遠慮下さい。

演題番号	3K1-OS-06a-4
題目	深層学習と強化学習を用いたゲームAIへの時系列予測の導入
著者	松尾星吾(京都工芸繊維大学工芸科学部) 岡夏樹(京都工芸繊維大学情報工学・人間科学系)
時間	05月25日(Thu) 14:50〜15:10
概要	本研究では、深層学習と強化学習と時系列予測を用いてAtari2600のゲームをプレイするエージェントの開発を試みた。ゲームはプレイヤーの操作によって状態が分岐する。エージェントは分岐する将来の状態を予測し、予測した状態の中から最適な結果となる次の行動を選択する。実験では、Atariのゲームを複数学習させ、深層学習と強化学習のみの場合と時系列予測を付加した場合を比較しその効果を検討した。
論文	PDFファイル