演題番号 | 3D9-1 |
---|---|
題目 | 強化学習における報酬値探索へのGAの適用 |
著者 | 井上 勇気 (法政大学 情報科学研究科) 赤塚 洋介 (法政大学 情報科学研究科) 佐藤 裕二 (法政大学 情報科学部) |
時間 | 6月22日(金) 14:30〜14:50 |
概要 | クラシファイアシステムの学習では、報酬値の設定によって学習の収束の早さが異なってくる。一方で、報酬値の設定には、決定指標が無く、経験則によって決めなくてはならないという問題がある。この問題の解決のため、本研究ではGAを用いて、報酬値の準最適解を自動的に探索することを提案する。 |
論文 | PDFファイル |