/ 戻る / プログラム / 発表一覧 / 著者一覧 / JSAI2003 ホーム /
セッション番号 | 3F4 |
---|---|
タイトル | 強化学習 |
座長/オーガナイザ | 座長:木村 元 (東京工業大学) |
日時・場所 | 6月27日(金) 14:40〜17:20 F 小会議室1+2 |
題目 | 3F4-01 Profit Sharing法における強化関数に関する一考察 |
---|---|
著者 | 植村 渉 (大阪市立大学大学院工学研究科) 辰巳 昭治 (大阪市立大学大学院工学研究科) 北村 泰彦 (大阪市立大学大学院工学研究科) |
論文 | PDFファイル, |
題目 | 3F4-02 罰を考慮したProfit Sharing強化学習法 |
---|---|
著者 | 鈴木 淳司 (名古屋工業大学) |
論文 | PDFファイル, |
題目 | 3F4-03 POMDPsへの行動優先度学習型強化学習アルゴリズムの適用 |
---|---|
著者 | 松井 藤五郎 (名古屋工業大学) 犬塚 信博 (名古屋工業大学電気情報工学科) 世木 博久 (名古屋工業大学) |
論文 | PDFファイル, |
題目 | 3F4-04 コスト付きマルコフ決定過程における強化学習アルゴリズム |
---|---|
著者 | 石黒 誉久 (名古屋工業大学電気情報工学科) 松井 藤五郎 (名古屋工業大学) 犬塚 信博 (名古屋工業大学電気情報工学科) 和田 幸一 (名古屋工業大学電気情報工学科) |
論文 | PDFファイル, |
題目 | 3F4-05 非マルコフ性を有する環境のモデリング |
---|---|
著者 | 金澤 勇樹 (北海道大学 大学院工学研究科 システム情報工学専攻) 栗原 正仁 (北海道大学 大学院工学研究科 システム情報工学専攻) |
論文 | PDFファイル, |
題目 | 3F4-06 各種のゲームで適切な行動を導く自己評価の生成法 |
---|---|
著者 | 森山 甲一 (東京工業大学 情報理工学研究科 計算工学専攻) 沼尾 正行 (大阪大学 産業科学研究所 知能アーキテクチャー研究分野) |
論文 | PDFファイル, |
題目 | 3F4-07 強化学習を用いたSoar情報収集機構の試作 |
---|---|
著者 | 保知 良暢 (名古屋工業大学大学院工学研究科) 大囿 忠親 (名古屋工業大学 電気情報工学専攻) 新谷 虎松 (名古屋工業大学 電気情報工学専攻) |
論文 | PDFファイル, |
題目 | 3F4-08 マクロアクションの自動生成について |
---|---|
著者 | 陳 宇 |
論文 | PDFファイル, |
/ 戻る / プログラム / 発表一覧 / 著者一覧 / JSAI2003 ホーム /