/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2010ホーム /

1A3-3 動的環境下における危険度予測法に基づく適応的強化学習

06月09日(Wed) 14:35〜15:55 A会場(3F-会議室1)
1A3 機械学習「強化学習」

演題番号1A3-3
題目動的環境下における危険度予測法に基づく適応的強化学習
著者三村 明寛(名古屋工業大学大学院工学研究科情報工学専攻)
加藤 昇平(名古屋工業大学 工学研究科情報工学専攻)
伊藤 英則(名古屋工業大学)
時間06月09日(Wed) 15:15〜15:35
概要近年,機械学習の分野において強化学習の研究が盛んに行われている.
強化学習とは,試行錯誤を通じて未知環境に適応する学習手法である.
しかしながら,強化学習の研究の多くは学習中における動的な環境の変化を考慮していない.
本研究では,環境の変化を知覚した時に危険度予測を用いることにより現在の最適戦略を変更し,環境変化に適応する強化学習手法を提案する.
論文PDFファイル