演題番号 | 1D3-02 |
---|---|
題目 | 連続値入力に対応したProfit Sharingに基づく強化学習システム |
著者 | 宮崎 和光 (独立行政法人大学評価・学位授与機構) 小林 重信 (東京工業大学総合理工学研究科知能システム科学専攻) |
時間 | 6月15日(水) 15:30〜15:50 |
概要 | 著者らはこれまでいくつかのProfit Sharingに基づく強化学習システムを提案してきた。そこでは、つねに離散の入出力を前提としている。しかし実世界には状態間に位相が仮定できる問題が多く存在する。本稿では、そのような問題に対し、Profit Sharingに基づく強化学習システムを拡張するための方法を提案する。 |
論文 | PDFファイル |