05月25日(Thu) 13:50〜15:30 K会場(ウインクあいち-10F 1002会議室)
演題番号 | 3K1-OS-06a-4 |
---|---|
題目 | 深層学習と強化学習を用いたゲームAIへの時系列予測の導入 |
著者 | 松尾 星吾(京都工芸繊維大学工芸科学部) 岡 夏樹(京都工芸繊維大学 情報工学・人間科学系) |
時間 | 05月25日(Thu) 14:50〜15:10 |
概要 | 本研究では、深層学習と強化学習と時系列予測を用いてAtari2600のゲームをプレイするエージェントの開発を試みた。ゲームはプレイヤーの操作によって状態が分岐する。エージェントは分岐する将来の状態を予測し、予測した状態の中から最適な結果となる次の行動を選択する。実験では、Atariのゲームを複数学習させ、深層学習と強化学習のみの場合と時系列予測を付加した場合を比較しその効果を検討した。 |
論文 | PDFファイル |