3D9　強化学習

6月22日(金) 14:30～16:10　D会場

題目	3D9-1　強化学習における報酬値探索へのGAの適用
著者	井上勇気 (法政大学情報科学研究科) 赤塚洋介 (法政大学情報科学研究科) 佐藤裕二 (法政大学情報科学部)
論文	PDFファイル

題目	3D9-2　Robot Control by Least-Squares Policy Iteration with Geodesic Gaussian Kernels
著者	八谷大岳 (東京工業大学大学院情報理工学研究科　計算工学専攻) 杉山将 (東京工業大学大学院情報理工学研究科計算工学専攻)
論文	PDFファイル

題目	3D9-3　外部報酬に導く内発的報酬の生成機構
著者	竹内誉羽 (株式会社ホンダ・リサーチ・インスティチュート・ジャパン) 庄野修 (株式会社ホンダ・リサーチ・インスティチュート・ジャパン) 辻野広司 (（株）ホンダ・リサーチ・インスティチュート・ジャパン)
論文	PDFファイル

題目	3D9-4　複素強化学習を用いたAcrobotの振り上げ制御
著者	澁谷長史 (横浜国立大学大学院工学府) 島田慎吾 (横浜国立大学大学院工学府) 濱上知樹 (横浜国立大学大学院工学府)
論文	PDFファイル

題目	3D9-5　強化学習を用いた株式取引エージェントにおける汎用政策の学習
著者	松井藤五郎 (東京理科大学理工学部経営工学科) 大和田勇人 (東京理科大学理工学部経営工学科)
論文	PDFファイル