1A3-2 複利型強化学習

06月09日(Wed) 14:35〜15:55 A会場(3F-会議室1)
1A3 機械学習「強化学習」

演題番号	1A3-2
題目	複利型強化学習
著者	松井藤五郎(とうごろう機械学習研究所)
時間	06月09日(Wed) 14:55〜15:15
概要	本論文では，複利リターン，つまり，リターンの幾何平均を最大化するための強化学習の枠組みである複利型強化学習を提案する．また，実験により複利型強化学習がいくつかの問題において有効であることを示す．
論文	PDFファイル