/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2014ホーム /

3M4-3 様々なデータ圧縮を用いた多言語に対応するtweetsの話題分類法の精度比較

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2014 このエントリーをはてなブックマークに追加

05月14日(Wed) 15:20〜17:00 M会場(70人-看護会館 第1研修室)
3M4 「ツイッター分析・処理」

演題番号3M4-3
題目様々なデータ圧縮を用いた多言語に対応するtweetsの話題分類法の精度比較
著者王 駿キ(筑波大学/システム情報工学研究科/知能機能システム専攻)
佐藤 栄一(筑波大学/システム情報工学研究科/知能機能システム専攻)
延原 肇(筑波大学/システム情報工学研究科/知能機能システム専攻)
時間05月14日(Wed) 16:00〜16:20
概要本稿では、データ圧縮技術をテキスト分類に使用することによりテキストの言語に依存しない話題分類を実現し、短文投稿サイトTwitterに投稿されている複数の言語のTweetの分類を行う。また、圧縮の代わりにTweet文字列のエントロピーを用いた場合についても評価し、それぞれの手法の分類精度の比較を行った。
論文PDFファイル