/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2013ホーム /

1L3-OS-24a-5 対称性推論と運動学習の分節化

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2013 このエントリーをはてなブックマークに追加

06月04日(Tue) 14:10〜16:10 L会場(-商工会議所9F 95-97号室)
1L3-OS-24a オーガナイズドセッション「OS-24 内部観測と推論-1」

演題番号1L3-OS-24a-5
題目対称性推論と運動学習の分節化
著者浦上 大輔(東京工科大学コンピュータサイエンス学部)
高橋 達二(東京電機大学 理工学部 情報システムデザイン学系)
アルスビヒーン ヒシャム(東京工科大学大学院バイオ情報メディア研究科)
アルアルワン アリー(東京工科大学コンピュータサイエンス学部)
関口 暁宣(東京工科大学コンピュータサイエンス学部)
松尾 芳樹(東京工科大学コンピュータサイエンス学部)
時間06月04日(Tue) 15:50〜16:10
概要強化学習によって複雑な運動を獲得するために,複数の内部モデルの構築や複数の報酬を用意することにより,動作を分節して学習する方法が研究されている.本研究では,このような方法を用いず,人間の推論傾向(論理を混同する傾向)を模倣してQ学習に応用することにより同様の運動が獲得できることを,大車輪ロボットを例として検証する.その結果をもとに,学習過程における記号の分節化と混同の両義性について議論する.
論文PDFファイル