1L3-OS-24a-5 対称性推論と運動学習の分節化

*セッションの無断動画配信はご遠慮下さい。

演題番号	1L3-OS-24a-5
題目	対称性推論と運動学習の分節化
著者	浦上大輔(東京工科大学コンピュータサイエンス学部) 高橋達二(東京電機大学理工学部情報システムデザイン学系) アルスビヒーンヒシャム(東京工科大学大学院バイオ情報メディア研究科) アルアルワンアリー(東京工科大学コンピュータサイエンス学部) 関口暁宣(東京工科大学コンピュータサイエンス学部) 松尾芳樹(東京工科大学コンピュータサイエンス学部)
時間	06月04日(Tue) 15:50〜16:10
概要	強化学習によって複雑な運動を獲得するために，複数の内部モデルの構築や複数の報酬を用意することにより，動作を分節して学習する方法が研究されている．本研究では，このような方法を用いず，人間の推論傾向（論理を混同する傾向）を模倣してQ学習に応用することにより同様の運動が獲得できることを，大車輪ロボットを例として検証する．その結果をもとに，学習過程における記号の分節化と混同の両義性について議論する．
論文	PDFファイル