3D2-OS-37b-2 多層マルチモーダルLDAを用いた報酬のモデル化

*セッションの無断動画配信はご遠慮下さい。

演題番号	3D2-OS-37b-2
題目	多層マルチモーダルLDAを用いた報酬のモデル化
著者	宮澤和貴(電気通信大学情報理工学部知能機械工学科) 青木達哉(電気通信大学　情報理工学研究科　知能機械工学専攻) 日永田智絵(電気通信大学　情報理工学研究科　機械知能システム学専攻) 岩田健輔(電気通信大学　情報理工学研究科　機械知能システム学専攻) 中村友昭(電気通信大学情報理工学研究科知能機械工学専攻) 長井隆行(電気通信大学情報理工学研究科知能機械工学専攻)
時間	05月25日(Thu) 16:10〜16:30
概要	ロボットが実世界でより良い行動を行うためには，実世界を正しく理解することが重要である．実世界の正しい理解とは，自身の理解に基づいた行動を行った際に報酬がより多く得られることだと考える．そこで，本研究では報酬に基づいてより良い概念を学習する枠組みを提案する．これを，多層マルチモーダルLDAに報酬を取り入れたモデルを用いて強化学習をすることで実現することを目指す．
論文	PDFファイル