/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2014ホーム /

2H1-3in メタヒューリティクスによる強化学習のパラメータの最適化

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2014 このエントリーをはてなブックマークに追加

05月13日(Tue) 09:00〜10:20 H会場(102人-ひめぎんホール 第8会議室)
2H1 「強化学習の基礎」
05月14日(Wed) 09:00〜10:40 H会場(102人-ひめぎんホール 第8会議室)
3O1 「インタラクティブセッション」

演題番号2H1-3in
題目メタヒューリティクスによる強化学習のパラメータの最適化
著者安政 駿(筑波大学院 図書館情報メディア研究科 図書館情報メディア専攻)
手塚 太郎(筑波大学 図書館情報メディア系)
時間05月13日(Tue) 09:40〜10:00【一般口頭発表】
05月14日(Wed) 09:00〜10:40【インタラクティブ発表】
概要強化学習は機械学習の手法の一つとして広く使われているが、学習に先立ち報酬の決定や方策を更新する際に用いられるパラメータを決定する必要がある。しかし複雑な環境において最適なパラメータを見つけ出すことは多くの試行錯誤を伴い、容易ではない。本研究では、焼きなまし法などの特定の計算問題に依存しないメタヒューリティクスのアルゴリズムを用いることで、自動的に最適なパラメータを導き出す手法を提案する。
論文PDFファイル