05月24日(Wed) 17:50〜19:30 P会場(ウインクあいち-10F 1008会議室)
演題番号 | 2P4-3 |
---|---|
題目 | ドメイン非依存強化学習エージェントのための冗長なアクションの検出手法 |
著者 | 陣内 佑(東京大学大学院総合文化研究科) 福永 アレックス(東京大学大学院総合文化研究科) |
時間 | 05月24日(Wed) 18:30〜18:50 |
概要 | 強化学習研究の目的の一つは様々な環境に適用できる多目的のエージェントを開発することである。幅広い範囲の問題を解くためにエージェントは可能なアクションの数も多くなければならない。しかしながら、エージェントの行動計画は可能なアクションの数が多いほど難しい問題になる。本研究では他のアクションによって代替可能な冗長アクションを学習する手法を提案する。 |
論文 | PDFファイル |