05月25日(Thu) 15:50〜17:30 D会場(ウインクあいち-9F 903会議室)
演題番号 | 3D2-OS-37b-2 |
---|---|
題目 | 多層マルチモーダルLDAを用いた報酬のモデル化 |
著者 | 宮澤 和貴(電気通信大学 情報理工学部 知能機械工学科) 青木 達哉(電気通信大学 情報理工学研究科 知能機械工学専攻) 日永田 智絵(電気通信大学 情報理工学研究科 機械知能システム学専攻) 岩田 健輔(電気通信大学 情報理工学研究科 機械知能システム学専攻) 中村 友昭(電気通信大学 情報理工学研究科 知能機械工学専攻) 長井 隆行(電気通信大学情報理工学研究科知能機械工学専攻) |
時間 | 05月25日(Thu) 16:10〜16:30 |
概要 | ロボットが実世界でより良い行動を行うためには,実世界を正しく理解することが重要である.実世界の正しい理解とは,自身の理解に基づいた行動を行った際に報酬がより多く得られることだと考える.そこで,本研究では報酬に基づいてより良い概念を学習する枠組みを提案する.これを,多層マルチモーダルLDAに報酬を取り入れたモデルを用いて強化学習をすることで実現することを目指す. |
論文 | PDFファイル |