/ プログラム / 発表一覧 / 著者一覧 / JSAI2007 ホーム

1G3-1 HTMLタグの木構造に着目したWebページのクラスタリング手法

6月20日(水) 16:30〜18:10 G会場
情報検索・抽出・分類#2

演題番号1G3-1
題目HTMLタグの木構造に着目したWebページのクラスタリング手法
著者折原 大 (電気通信大学大学院 電気通信学研究科 システム工学専攻)
内海 彰 (電気通信大学 電気通信学部 システム工学科)
時間6月20日(水) 16:30〜16:50
概要本研究では,従来の内容に基づくクラスタリング手法とは異なり,ページのスタイルに基づくWebページのクラスタリング手法を提案する.提案する手法では,Webページに特有のHTMLタグ情報に着目し,HTMLタグの木構造の情報に基づいたクラスタリングを行う.
論文PDFファイル

/ プログラム / 発表一覧 / 著者一覧 / JSAI2007 ホーム