/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2017ホーム /

2P4-3 ドメイン非依存強化学習エージェントのための冗長なアクションの検出手法

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2017 このエントリーをはてなブックマークに追加

05月24日(Wed) 17:50〜19:30 P会場(ウインクあいち-10F 1008会議室)
2P4 機械学習「機械学習-強化学習(1)」

演題番号2P4-3
題目ドメイン非依存強化学習エージェントのための冗長なアクションの検出手法
著者陣内 佑(東京大学大学院総合文化研究科)
福永 アレックス(東京大学大学院総合文化研究科)
時間05月24日(Wed) 18:30〜18:50
概要強化学習研究の目的の一つは様々な環境に適用できる多目的のエージェントを開発することである。幅広い範囲の問題を解くためにエージェントは可能なアクションの数も多くなければならない。しかしながら、エージェントの行動計画は可能なアクションの数が多いほど難しい問題になる。本研究では他のアクションによって代替可能な冗長アクションを学習する手法を提案する。
論文PDFファイル