1A3-3 動的環境下における危険度予測法に基づく適応的強化学習

06月09日(Wed) 14:35〜15:55 A会場(3F-会議室1)
1A3 機械学習「強化学習」

演題番号	1A3-3
題目	動的環境下における危険度予測法に基づく適応的強化学習
著者	三村明寛(名古屋工業大学大学院工学研究科情報工学専攻) 加藤昇平(名古屋工業大学工学研究科情報工学専攻) 伊藤英則(名古屋工業大学)
時間	06月09日(Wed) 15:15〜15:35
概要	近年，機械学習の分野において強化学習の研究が盛んに行われている．強化学習とは，試行錯誤を通じて未知環境に適応する学習手法である．しかしながら，強化学習の研究の多くは学習中における動的な環境の変化を考慮していない．本研究では，環境の変化を知覚した時に危険度予測を用いることにより現在の最適戦略を変更し，環境変化に適応する強化学習手法を提案する．
論文	PDFファイル