/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2017ホーム /

3D2-OS-37b-2 多層マルチモーダルLDAを用いた報酬のモデル化

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2017 このエントリーをはてなブックマークに追加

05月25日(Thu) 15:50〜17:30 D会場(ウインクあいち-9F 903会議室)
3D2-OS-37b オーガナイズドセッション「OS-37 記号創発ロボティクス(2)」

演題番号3D2-OS-37b-2
題目多層マルチモーダルLDAを用いた報酬のモデル化
著者宮澤 和貴(電気通信大学 情報理工学部 知能機械工学科)
青木 達哉(電気通信大学 情報理工学研究科 知能機械工学専攻)
日永田 智絵(電気通信大学 情報理工学研究科 機械知能システム学専攻)
岩田 健輔(電気通信大学 情報理工学研究科 機械知能システム学専攻)
中村 友昭(電気通信大学 情報理工学研究科 知能機械工学専攻)
長井 隆行(電気通信大学情報理工学研究科知能機械工学専攻)
時間05月25日(Thu) 16:10〜16:30
概要ロボットが実世界でより良い行動を行うためには,実世界を正しく理解することが重要である.実世界の正しい理解とは,自身の理解に基づいた行動を行った際に報酬がより多く得られることだと考える.そこで,本研究では報酬に基づいてより良い概念を学習する枠組みを提案する.これを,多層マルチモーダルLDAに報酬を取り入れたモデルを用いて強化学習をすることで実現することを目指す.
論文PDFファイル