演題番号 | 3E1-02 |
---|---|
題目 | 異なる状況下で獲得した政策を基にした動的プランニングについて |
著者 | 高田 司郎 (近畿大学理工学部) 新出 尚之 (奈良女子大学理学部) 太田 正幸 (産業技術総合研究所) 山川 宏 ((株)富士通研究所) 宮崎 和光 (独立行政法人大学評価・学位授与機構) |
時間 | 6月17日(金) 09:20〜09:40 |
概要 | 異なる状況下で強化学習を用いて獲得した政策からある方式でサブプランが構築されたとする。本稿では、十分な熟考時間はあるが一旦スタートするとサブゴールを達成する(または諦める)まで再プランニングが出来ないような問題(たとえばカヌー レーシング)を対象とし、このサブプランを用いた動的プランニング方式を提案する。 |
論文 | PDFファイル |