3E1-02　異なる状況下で獲得した政策を基にした動的プランニングについて

演題番号	3E1-02
題目	異なる状況下で獲得した政策を基にした動的プランニングについて
著者	高田司郎 (近畿大学理工学部) 新出尚之 (奈良女子大学理学部) 太田　正幸 (産業技術総合研究所) 山川宏 (（株）富士通研究所) 宮崎和光 (独立行政法人大学評価・学位授与機構)
時間	6月17日(金) 09:20～09:40
概要	異なる状況下で強化学習を用いて獲得した政策からある方式でサブプランが構築されたとする。本稿では、十分な熟考時間はあるが一旦スタートするとサブゴールを達成する（または諦める）まで再プランニングが出来ないような問題（たとえばカヌーレーシング）を対象とし、このサブプランを用いた動的プランニング方式を提案する。
論文	PDFファイル