1D3-02　連続値入力に対応したProfit Sharingに基づく強化学習システム

6月15日(水) 15:10～16:50　D会場
強化学習・基礎

演題番号	1D3-02
題目	連続値入力に対応したProfit Sharingに基づく強化学習システム
著者	宮崎和光 (独立行政法人大学評価・学位授与機構) 小林重信 (東京工業大学総合理工学研究科知能システム科学専攻)
時間	6月15日(水) 15:30～15:50
概要	著者らはこれまでいくつかのProfit Sharingに基づく強化学習システムを提案してきた。そこでは、つねに離散の入出力を前提としている。しかし実世界には状態間に位相が仮定できる問題が多く存在する。本稿では、そのような問題に対し、Profit Sharingに基づく強化学習システムを拡張するための方法を提案する。
論文	PDFファイル