/ プログラム / 発表一覧 / 著者一覧 / JSAI2007 ホーム

3D9 強化学習

6月22日(金) 14:30〜16:10 D会場


発表一覧

題目 3D9-1 強化学習における報酬値探索へのGAの適用
著者 井上 勇気 (法政大学 情報科学研究科)
赤塚 洋介 (法政大学 情報科学研究科)
佐藤 裕二 (法政大学 情報科学部)
論文 PDFファイル

題目 3D9-2 Robot Control by Least-Squares Policy Iteration with Geodesic Gaussian Kernels
著者 八谷 大岳 (東京工業大学 大学院情報理工学研究科 計算工学専攻)
杉山 将 (東京工業大学 大学院情報理工学研究科 計算工学専攻)
論文 PDFファイル

題目 3D9-3 外部報酬に導く内発的報酬の生成機構
著者 竹内 誉羽 (株式会社ホンダ・リサーチ・インスティチュート・ジャパン)
庄野 修 (株式会社ホンダ・リサーチ・インスティチュート・ジャパン)
辻野 広司 ((株)ホンダ・リサーチ・インスティチュート・ジャパン)
論文 PDFファイル

題目 3D9-4 複素強化学習を用いたAcrobotの振り上げ制御
著者 澁谷 長史 (横浜国立大学大学院工学府)
島田 慎吾 (横浜国立大学大学院工学府)
濱上 知樹 (横浜国立大学大学院工学府)
論文 PDFファイル

題目 3D9-5 強化学習を用いた株式取引エージェントにおける汎用政策の学習
著者 松井 藤五郎 (東京理科大学 理工学部 経営工学科)
大和田 勇人 (東京理科大学 理工学部 経営工学科)
論文 PDFファイル




/ プログラム / 発表一覧 / 著者一覧 / JSAI2007 ホーム