/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2017ホーム /

3K1-OS-06a-4 深層学習と強化学習を用いたゲームAIへの時系列予測の導入

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2017 このエントリーをはてなブックマークに追加

05月25日(Thu) 13:50〜15:30 K会場(ウインクあいち-10F 1002会議室)
3K1-OS-06a オーガナイズドセッション「OS-6 汎用人工知能とその社会への影響(1)」

演題番号3K1-OS-06a-4
題目深層学習と強化学習を用いたゲームAIへの時系列予測の導入
著者松尾 星吾(京都工芸繊維大学工芸科学部)
岡 夏樹(京都工芸繊維大学 情報工学・人間科学系)
時間05月25日(Thu) 14:50〜15:10
概要本研究では、深層学習と強化学習と時系列予測を用いてAtari2600のゲームをプレイするエージェントの開発を試みた。ゲームはプレイヤーの操作によって状態が分岐する。エージェントは分岐する将来の状態を予測し、予測した状態の中から最適な結果となる次の行動を選択する。実験では、Atariのゲームを複数学習させ、深層学習と強化学習のみの場合と時系列予測を付加した場合を比較しその効果を検討した。
論文PDFファイル