05月31日(Sun) 09:00〜10:40 D会場(3F北-大講義室-368)
演題番号 | 2D1-OS-12a-4in |
---|---|
題目 | 不確実性の下での満足化を通じた最適化 |
著者 | 高橋 達二(東京電機大学 理工学部) 大用 庫智(関西学院大学 総合政策学部) 甲野 佑(東京電機大学大学院 先端科学技術研究科 情報学専攻) 横須賀 聡(東京電機大学 理工学部) |
時間 | 05月31日(Sun) 10:20〜10:40【一般口頭発表】06月01日(Mon) 09:00〜11:00【インタラクティブ発表】 |
概要 | 最適化に対比される概念として、ある価値基準を境界とした「良い」と「悪い」への環境の分節化に基づく「満足化」がある。本研究で提案する満足化のモデルは、従来のポリシーレベルでなく価値関数のレベルで実装され、直感的な基準パラメータを一つのみ持つのみにも関わらず、基本的な強化学習タスクにおいて優れたパフォーマンスを示し、また人間の意志決定や判断に現れるいくつかの認知的な特性を再現する。 |
論文 | PDFファイル |