06月04日(Tue) 16:20〜18:20 E会場(-国際会議場204号室)
演題番号 | 1E4-4 |
---|---|
題目 | 搾取と探索のトレードオフを解決する適応的強化学習の提案 |
著者 | 今井 遼太郎(北海道大学大学院情報科学研究科コンピュータサイエンス専攻) 吉川 毅(北海道大学大学院情報科学研究科コンピュータサイエンス専攻) 野中 秀俊(北海道大学大学院情報科学研究科コンピュータサイエンス専攻) 杉本 雅則(北海道大学大学院情報科学研究科コンピュータサイエンス専攻) |
時間 | 06月04日(Tue) 17:20〜17:40 |
概要 | 本研究では,動的環境下での強化学習における搾取と探索のトレードオフを考える.既存研究では,事前に設計者がパラメータを制御したり,タスク依存度の高い指標を用いたりする場合が多い.これらの手法は強化学習の利点を損なうものである.そこで本研究では,エージェント自身がパラメータの制御を行い,環境変化に対しては,タスク依存度の低い指標からの認識と適宜行動価値の修正を図ることで適応するアルゴリズムを提案する. |
論文 | PDFファイル |