06月04日(Tue) 16:20〜18:20 E会場(-国際会議場204号室)
演題番号 | 1E4-1 |
---|---|
題目 | 複利型強化学習による危険回避行動の学習 |
著者 | 松井 藤五郎(中部大学生命健康科学部臨床工学科,中部大学工学部情報工学科) 落合 宏旭(中部大学工学部情報工学科) |
時間 | 06月04日(Tue) 16:20〜16:40 |
概要 | 複利型強化学習は,利益率(リターン)の複利効果を最大化するような行動を学習することを目的としているが,結果として大きな負のリターンを避けるような行動を学習するという性質を持つ. そこで,本論文では,格子世界の迷路タスクにおいて,複利型強化学習を用い,かつ,危険な行動に大きな負のリターンを与えることによって,危険を回避する行動を学習する方法を提案する. |
論文 | PDFファイル |