演題番号 | 3A4-2 |
---|---|
題目 | N-gramと決定木による筆者識別 |
著者 | 谷口 裕大(神奈川工科大学情報学部情報工学科) 殿生 剛士(神奈川工科大学大学院情報工学専攻) 杉村 博(神奈川工科大学 情報工学専攻) 松本 一教(神奈川工科大学 情報工学部) |
時間 | 06月11日(Fri) 14:55〜15:15 |
概要 | 文章表現上の特徴である文体は筆者により異なる.その特徴を分析することで筆者を識別する方法は,多くの応用例から重要な技術だといえる.本研究ではN-gramに注目する.単純な抽出では,文章毎に固有な情報を含むため,それらを一度別の表現に置き換え,その後,決定木学習の手法を用いて,筆者識別ルールを学習する.Nの値の決定,およびN-gram中での変数選択について検証する. |
論文 | PDFファイル |