/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2017ホーム /

2P4 機械学習「機械学習-強化学習（１）」

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2017

05月24日(Wed) 17:50～19:30 P会場(ウインクあいち-10F 1008会議室)
座長植村渉（龍谷大学）

発表一覧

時間	17:50～18:10
題目	2P4-1 マルチエージェント強化学習における主観的効用の進化過程に関する分析
著者	宮脇昌哉(名古屋工業大学大学院工学研究科情報工学専攻) 森山甲一(名古屋工業大学　大学院工学研究科) 武藤敦子(名古屋工業大学) 松井藤五郎(中部大学生命健康科学部臨床工学科) 犬塚信博(名古屋工業大学工学研究科情報工学専攻)
論文	PDFファイル

時間	18:10～18:30
題目	2P4-2 逆強化学習における制約条件の緩和法
著者	北里勇樹(千葉大学大学院工学研究科都市環境システムコース) 荒井幸代(千葉大学大学院工学研究科都市環境システムコース)
論文	PDFファイル

時間	18:30～18:50
題目	2P4-3 ドメイン非依存強化学習エージェントのための冗長なアクションの検出手法
著者	陣内佑(東京大学大学院総合文化研究科) 福永アレックス(東京大学大学院総合文化研究科)
論文	PDFファイル

時間	18:50～19:10
題目	2P4-4in1 逐次的自然方策勾配推定のための適応的学習率
著者	岩城諒(大阪大学大学院工学研究科知能機能創成工学専攻) 横山裕樹(玉川大学脳科学研究所) 浅田稔(大阪大学大学院工学研究科知能機能創成工学専攻)
論文	PDFファイル

時間	19:10～19:30
題目	2P4-5 POMDPs環境下におけるProfit SharingとGAによるサブゴール創発を行う強化学習法
著者	鈴木晃平(名古屋工業大学大学院工学研究科情報工学専攻) 加藤昇平(名古屋工業大学大学院工学研究科情報工学専攻／情報科学フロンティア研究院)
論文	PDFファイル