演題番号 | 1C2-4 |
---|---|
題目 | インタラクションにおけるニューラルネットを利用した強化学習の効果 |
著者 | 竹内 誉羽(ホンダ・リサーチ・インスティチュート・ジャパン) 辻野 広司(ホンダ・リサーチ・インスティチュート・ジャパン) |
時間 | 06月09日(Wed) 14:00〜14:20 |
概要 | 人とインタラクションしながら、手順をエージェントが学習する課題を想定する。この場合、人からの指示は必ずしも一定しておらず人の指示以外の情報を参考に手順を実行しなければならなくなる場合が考えられる。ニューラルネットによる学習器は、情報の欠損に対して頑健であると考えられる。本報告ではモジュール構造をもたせたニューラルネットによって実装された強化学習器を使って、この利点を簡単な実験により示す。 |
論文 | PDFファイル |