05月14日(Wed) 15:20〜17:00 M会場(70人-看護会館 第1研修室)
演題番号 | 3M4-3 |
---|---|
題目 | 様々なデータ圧縮を用いた多言語に対応するtweetsの話題分類法の精度比較 |
著者 | 王 駿キ(筑波大学/システム情報工学研究科/知能機能システム専攻) 佐藤 栄一(筑波大学/システム情報工学研究科/知能機能システム専攻) 延原 肇(筑波大学/システム情報工学研究科/知能機能システム専攻) |
時間 | 05月14日(Wed) 16:00〜16:20 |
概要 | 本稿では、データ圧縮技術をテキスト分類に使用することによりテキストの言語に依存しない話題分類を実現し、短文投稿サイトTwitterに投稿されている複数の言語のTweetの分類を行う。また、圧縮の代わりにTweet文字列のエントロピーを用いた場合についても評価し、それぞれの手法の分類精度の比較を行った。 |
論文 | PDFファイル |