/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2013ホーム /

1E4-1 複利型強化学習による危険回避行動の学習

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2013 このエントリーをはてなブックマークに追加

06月04日(Tue) 16:20〜18:20 E会場(-国際会議場204号室)
1E4 機械学習「機械学習-2」

演題番号1E4-1
題目複利型強化学習による危険回避行動の学習
著者松井 藤五郎(中部大学生命健康科学部臨床工学科,中部大学工学部情報工学科)
落合 宏旭(中部大学工学部情報工学科)
時間06月04日(Tue) 16:20〜16:40
概要複利型強化学習は,利益率(リターン)の複利効果を最大化するような行動を学習することを目的としているが,結果として大きな負のリターンを避けるような行動を学習するという性質を持つ.
そこで,本論文では,格子世界の迷路タスクにおいて,複利型強化学習を用い,かつ,危険な行動に大きな負のリターンを与えることによって,危険を回避する行動を学習する方法を提案する.
論文PDFファイル