演題番号 | 1A1-1 |
---|---|
題目 | ラベル信頼度を用いたブースティング手法のインバランスデータへの応用 |
著者 | 中田 康太(株式会社東芝研究開発センター) 村上 知子(株式会社東芝研究開発センター) |
時間 | 06月09日(Wed) 09:00〜09:20 |
概要 | ラベル情報の信頼度が異なるデータセットに対して分類精度を向上するブースティング手法Credit AdaBoost (CAB)が提案されている。本研究ではCABを文書分類とネット動画コンテンツ推薦に応用する。現実には文書データ及びネット動画コンテンツデータは正例の比率が著しく低い場合が多いため、インバランス性を考慮して信頼度の低いデータのラベル信頼度を決定するCAB手法を提案し、分類精度を向上する。 |
論文 | PDFファイル |