/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2015ホーム /

2D1-OS-12a-4in 不確実性の下での満足化を通じた最適化

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2015 このエントリーをはてなブックマークに追加

05月31日(Sun) 09:00〜10:40 D会場(3F北-大講義室-368)
2D1-OS-12a オーガナイズドセッション「OS-12 記号創発ロボティクス (1)」
06月01日(Mon) 09:00〜11:00 D会場(3F北-大講義室-368)
3O1 「インタラクティブセッション」

演題番号2D1-OS-12a-4in
題目不確実性の下での満足化を通じた最適化
著者高橋 達二(東京電機大学 理工学部)
大用 庫智(関西学院大学 総合政策学部)
甲野 佑(東京電機大学大学院 先端科学技術研究科 情報学専攻)
横須賀 聡(東京電機大学 理工学部)
時間05月31日(Sun) 10:20〜10:40【一般口頭発表】
06月01日(Mon) 09:00〜11:00【インタラクティブ発表】
概要最適化に対比される概念として、ある価値基準を境界とした「良い」と「悪い」への環境の分節化に基づく「満足化」がある。本研究で提案する満足化のモデルは、従来のポリシーレベルでなく価値関数のレベルで実装され、直感的な基準パラメータを一つのみ持つのみにも関わらず、基本的な強化学習タスクにおいて優れたパフォーマンスを示し、また人間の意志決定や判断に現れるいくつかの認知的な特性を再現する。
論文PDFファイル