題目 | 3D9-1 強化学習における報酬値探索へのGAの適用 |
---|---|
著者 | 井上 勇気 (法政大学 情報科学研究科) 赤塚 洋介 (法政大学 情報科学研究科) 佐藤 裕二 (法政大学 情報科学部) |
論文 | PDFファイル |
題目 | 3D9-2 Robot Control by Least-Squares Policy Iteration with Geodesic Gaussian Kernels |
---|---|
著者 | 八谷 大岳 (東京工業大学 大学院情報理工学研究科 計算工学専攻) 杉山 将 (東京工業大学 大学院情報理工学研究科 計算工学専攻) |
論文 | PDFファイル |
題目 | 3D9-3 外部報酬に導く内発的報酬の生成機構 |
---|---|
著者 | 竹内 誉羽 (株式会社ホンダ・リサーチ・インスティチュート・ジャパン) 庄野 修 (株式会社ホンダ・リサーチ・インスティチュート・ジャパン) 辻野 広司 ((株)ホンダ・リサーチ・インスティチュート・ジャパン) |
論文 | PDFファイル |
題目 | 3D9-4 複素強化学習を用いたAcrobotの振り上げ制御 |
---|---|
著者 | 澁谷 長史 (横浜国立大学大学院工学府) 島田 慎吾 (横浜国立大学大学院工学府) 濱上 知樹 (横浜国立大学大学院工学府) |
論文 | PDFファイル |
題目 | 3D9-5 強化学習を用いた株式取引エージェントにおける汎用政策の学習 |
---|---|
著者 | 松井 藤五郎 (東京理科大学 理工学部 経営工学科) 大和田 勇人 (東京理科大学 理工学部 経営工学科) |
論文 | PDFファイル |