/ プログラム / 発表一覧 / 著者一覧 / JSAI2006 ホーム

3C1-2 模倣学習と強化学習の調和による効率的行動獲得

6月9日(金) 10:00〜11:20 C会場
強化学習・エージェント学習

演題番号3C1-2
題目模倣学習と強化学習の調和による効率的行動獲得
著者田渕 一真 (京都大学工学研究科)
谷口 忠大 (京都大学工学研究科)
椹木 哲夫 (京都大学工学研究科)
時間6月9日(金) 10:20〜10:40
概要強化学習を行う際,学習者は事前知識を持たなければ膨大な学習時間を費やさねばならない.これに対し,人間は他者の行動を,それが必ずしも最適な行動とは言えない場合でも模倣することにより探索時間を効率的に低減していると考えられる.本研究では機械学習の研究において,従来別々の問題として考えられて来た模倣学習と強化学習を,自然な形で融合させる学習手法を提案する.
論文PDFファイル

/ プログラム / 発表一覧 / 著者一覧 / JSAI2006 ホーム