演題番号 | 3C1-1 |
---|---|
題目 | 自律的タスク理解とモデルベース強化学習処理の自動構成 |
著者 | 大東 優 (北海道大学大学院情報科学研究科) 大森 隆司 (北海道大学大学院 情報科学研究科) 石川 悟 (北海道大学大学院 情報科学研究科) 森川 幸治 (松下電器産業株式会社 先端技術研究所 知能情報技術研究所) |
時間 | 6月9日(金) 10:00〜10:20 |
概要 | 従来の強化学習は複数のタスクに対する素早い学習は難しい.我々は,タスクに含まれる局所的因果関係を理解し,その組み合わせで学習処理を自律的に構築する手法を提案し,テレビゲームへの適用でその有効性を示す. |
論文 | PDFファイル |