05月31日(Sun) 09:00〜10:40 E会場(5F北-中講義室 (593))
演題番号 | 2E1-1 |
---|---|
題目 | 教師なしクラスタリングによるテキストのトピック抽出 |
著者 | 狩野 竜示(富士ゼロックス研究技術開発本部) 根本 啓一(富士ゼロックス株式会社 研究技術開発本部 コミュニケーション技術研究所) 大西 健司(富士ゼロックス株式会社 研究技術開発本部 コミュニケーション技術研究所) |
時間 | 05月31日(Sun) 09:00〜09:20 |
概要 | 多量のテキスト群に潜在する,テーマや話題を表す単語群をトピックと呼ぶ.このような,限られた単語群によって多量のテキストに存在する話題を表現する方法は,VOCなどの大量のテキストを処理する場面でも有効であると考えられる.本稿では,トピックと,そこから得られる話題との関連性を明らかにするため,トピック抽出に影響をあたえるパラメータと,トピックが表す話題との関連性を検証した. |
論文 | PDFファイル |