演題番号 | 2E2-3in |
---|---|
題目 | 機械学習・アフィリエイトID・HTML構造の類似性の併用によるスプログ検出 |
著者 | 森尻 惇宜史(筑波大学大学院システム情報工学研究科 知能機能システム専攻) 片山 太一(日本電信電話株式会社) 宇津呂 武仁(筑波大学 大学院 システム情報工学研究科 知能機能システム専攻) 河田 容英((株)ナビックス) 福原 知宏(独立行政法人産業技術総合研究所サービス工学研究センター) |
時間 | 06月02日(Thu) 11:15〜11:35【一般口頭発表】06月01日(Wed) 18:10〜20:10【インタラクティブ発表】 |
概要 | スプログの検出において,アフィリエイトIDを用いて自動収集したスプログおよび人手で収集した非スプログを訓練データとして機械学習手法を適用することにより,アフィリエイトIDおよびHTML構造の類似性の二種類の手がかりを併用しても検出が容易でないスプログの検出を行う方式を提案する.さらに,HTML構造の類似性を併用することにより適合率を改善する方式を提案する. |
論文 | PDFファイル |