/
プログラム
/
発表一覧
/
著者一覧
/
JSAI2006 ホーム
3F2-4 MDP集団におけるマルチユーザ強化学習エージェント
6月9日(金) 13:00〜14:40 F会場
OS「HAI(ヒューマンエージェントインタラクション)」1
演題番号
3F2-4
題目
MDP集団におけるマルチユーザ強化学習エージェント
著者
片上 大輔
(東京工業大学大学院総合理工学研究科)
新田 克己
(東京工業大学大学院総合理工学研究科)
時間
6月9日(金) 14:00〜14:20
概要
本研究では、ユーザ集団とのインタラクションから学習を行なうマルチユーザ強化学習エージェント(MULA-Q)を提案し、マルコフ決定過程(MDP)の上のマルチタスク強化学習問題において提案手法の有効性を定量的に評価する。
論文
PDFファイル
/
プログラム
/
発表一覧
/
著者一覧
/
JSAI2006 ホーム