/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2013ホーム /

1E4-4 搾取と探索のトレードオフを解決する適応的強化学習の提案

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2013 このエントリーをはてなブックマークに追加

06月04日(Tue) 16:20〜18:20 E会場(-国際会議場204号室)
1E4 機械学習「機械学習-2」

演題番号1E4-4
題目搾取と探索のトレードオフを解決する適応的強化学習の提案
著者今井 遼太郎(北海道大学大学院情報科学研究科コンピュータサイエンス専攻)
吉川 毅(北海道大学大学院情報科学研究科コンピュータサイエンス専攻)
野中 秀俊(北海道大学大学院情報科学研究科コンピュータサイエンス専攻)
杉本 雅則(北海道大学大学院情報科学研究科コンピュータサイエンス専攻)
時間06月04日(Tue) 17:20〜17:40
概要本研究では,動的環境下での強化学習における搾取と探索のトレードオフを考える.既存研究では,事前に設計者がパラメータを制御したり,タスク依存度の高い指標を用いたりする場合が多い.これらの手法は強化学習の利点を損なうものである.そこで本研究では,エージェント自身がパラメータの制御を行い,環境変化に対しては,タスク依存度の低い指標からの認識と適宜行動価値の修正を図ることで適応するアルゴリズムを提案する.
論文PDFファイル