/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2017ホーム /

2P4 機械学習「機械学習-強化学習(1)」

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2017 このエントリーをはてなブックマークに追加

05月24日(Wed) 17:50~19:30 P会場(ウインクあいち-10F 1008会議室)
座長 植村 渉(龍谷大学)

発表一覧

時間 17:50~18:10
題目 2P4-1 マルチエージェント強化学習における主観的効用の進化過程に関する分析
著者 宮脇 昌哉(名古屋工業大学大学院工学研究科情報工学専攻)
森山 甲一(名古屋工業大学 大学院工学研究科)
武藤 敦子(名古屋工業大学)
松井 藤五郎(中部大学生命健康科学部臨床工学科)
犬塚 信博(名古屋工業大学 工学研究科情報工学専攻)
論文 PDFファイル

時間 18:10~18:30
題目 2P4-2 逆強化学習における制約条件の緩和法
著者 北里 勇樹(千葉大学大学院工学研究科都市環境システムコース)
荒井 幸代(千葉大学大学院工学研究科都市環境システムコース)
論文 PDFファイル

時間 18:30~18:50
題目 2P4-3 ドメイン非依存強化学習エージェントのための冗長なアクションの検出手法
著者 陣内 佑(東京大学大学院総合文化研究科)
福永 アレックス(東京大学大学院総合文化研究科)
論文 PDFファイル

時間 18:50~19:10
題目 2P4-4in1 逐次的自然方策勾配推定のための適応的学習率
著者 岩城 諒(大阪大学大学院工学研究科知能機能創成工学専攻)
横山 裕樹(玉川大学脳科学研究所)
浅田 稔(大阪大学大学院工学研究科知能機能創成工学専攻)
論文 PDFファイル

時間 19:10~19:30
題目 2P4-5 POMDPs環境下におけるProfit SharingとGAによるサブゴール創発を行う強化学習法
著者 鈴木 晃平(名古屋工業大学大学院工学研究科情報工学専攻)
加藤 昇平(名古屋工業大学 大学院工学研究科情報工学専攻/情報科学フロンティア研究院)
論文 PDFファイル