06月04日(Tue) 14:10〜16:10 L会場(-商工会議所9F 95-97号室)
演題番号 | 1L3-OS-24a-5 |
---|---|
題目 | 対称性推論と運動学習の分節化 |
著者 | 浦上 大輔(東京工科大学コンピュータサイエンス学部) 高橋 達二(東京電機大学 理工学部 情報システムデザイン学系) アルスビヒーン ヒシャム(東京工科大学大学院バイオ情報メディア研究科) アルアルワン アリー(東京工科大学コンピュータサイエンス学部) 関口 暁宣(東京工科大学コンピュータサイエンス学部) 松尾 芳樹(東京工科大学コンピュータサイエンス学部) |
時間 | 06月04日(Tue) 15:50〜16:10 |
概要 | 強化学習によって複雑な運動を獲得するために,複数の内部モデルの構築や複数の報酬を用意することにより,動作を分節して学習する方法が研究されている.本研究では,このような方法を用いず,人間の推論傾向(論理を混同する傾向)を模倣してQ学習に応用することにより同様の運動が獲得できることを,大車輪ロボットを例として検証する.その結果をもとに,学習過程における記号の分節化と混同の両義性について議論する. |
論文 | PDFファイル |