05月13日(Tue) 09:00〜10:20 H会場(102人-ひめぎんホール 第8会議室)
演題番号 | 2H1-3in |
---|---|
題目 | メタヒューリティクスによる強化学習のパラメータの最適化 |
著者 | 安政 駿(筑波大学院 図書館情報メディア研究科 図書館情報メディア専攻) 手塚 太郎(筑波大学 図書館情報メディア系) |
時間 | 05月13日(Tue) 09:40〜10:00【一般口頭発表】05月14日(Wed) 09:00〜10:40【インタラクティブ発表】 |
概要 | 強化学習は機械学習の手法の一つとして広く使われているが、学習に先立ち報酬の決定や方策を更新する際に用いられるパラメータを決定する必要がある。しかし複雑な環境において最適なパラメータを見つけ出すことは多くの試行錯誤を伴い、容易ではない。本研究では、焼きなまし法などの特定の計算問題に依存しないメタヒューリティクスのアルゴリズムを用いることで、自動的に最適なパラメータを導き出す手法を提案する。 |
論文 | PDFファイル |