/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2010ホーム /

1A3-2 複利型強化学習

06月09日(Wed) 14:35〜15:55 A会場(3F-会議室1)
1A3 機械学習「強化学習」

演題番号1A3-2
題目複利型強化学習
著者松井 藤五郎(とうごろう機械学習研究所)
時間06月09日(Wed) 14:55〜15:15
概要本論文では,複利リターン,つまり,リターンの幾何平均を最大化するための強化学習の枠組みである複利型強化学習を提案する.また,実験により複利型強化学習がいくつかの問題において有効であることを示す.
論文PDFファイル