/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2010ホーム /

3A4-2 N-gramと決定木による筆者識別

06月11日(Fri) 14:35〜15:35 A会場(3F-会議室1)
3A4 データマイニング「テキストマイニング (2)」

演題番号3A4-2
題目N-gramと決定木による筆者識別
著者谷口 裕大(神奈川工科大学情報学部情報工学科)
殿生 剛士(神奈川工科大学大学院情報工学専攻)
杉村 博(神奈川工科大学 情報工学専攻)
松本 一教(神奈川工科大学 情報工学部)
時間06月11日(Fri) 14:55〜15:15
概要文章表現上の特徴である文体は筆者により異なる.その特徴を分析することで筆者を識別する方法は,多くの応用例から重要な技術だといえる.本研究ではN-gramに注目する.単純な抽出では,文章毎に固有な情報を含むため,それらを一度別の表現に置き換え,その後,決定木学習の手法を用いて,筆者識別ルールを学習する.Nの値の決定,およびN-gram中での変数選択について検証する.
論文PDFファイル