/ 戻る / プログラム / 発表一覧 / 著者一覧 / JSAI2003 ホーム /
演題番号 | 3F4-04 |
---|---|
題目 | コスト付きマルコフ決定過程における強化学習アルゴリズム |
著者 | 石黒 誉久 (名古屋工業大学電気情報工学科) 松井 藤五郎 (名古屋工業大学) 犬塚 信博 (名古屋工業大学電気情報工学科) 和田 幸一 (名古屋工業大学電気情報工学科) |
時間 | 6月27日(金) 15:40〜16:00 |
セッション | 強化学習 (14:40〜17:20 F 小会議室1+2) |
概要 | 行動にコストが発生する環境で、総報酬から総コストを引いた利益を最大化する問題について、強化学習アルゴリズムを検討する。このための問題変換と信用割当関数を与えて、実験によって考察する。 |
論文 | PDFファイル, |
/ 戻る / プログラム / 発表一覧 / 著者一覧 / JSAI2003 ホーム /