演題番号 | 2L1-2 |
---|---|
題目 | トップk頻出係り受けパターンのリアルタイム検索 |
著者 | 宅間 大介(日本アイ・ビー・エム株式会社) |
時間 | 06月19日(Fri) 16:40〜12:00 |
概要 | 索引付けされた大規模なテキストデータを用いて,ダイナミックに与えられる係り受けパターンに対し,その拡張パターンでテキスト中に頻出するものを高速計算する方法を提案する.具体的には,自動車不具合データで,「○○の時にエンジンが停止」という文脈で「○○」に入る頻出キーワードを動的に検索するといったことが可能になり,テキストマイニング,自動QA等の分野のインフラとしての応用が期待される. |
論文 | PDFファイル |