06月01日(Mon) 13:20〜15:00 L会場(研究棟2F-中講義室 (R791))
演題番号 | 3L3-2 |
---|---|
題目 | Repair Topic Model |
著者 | 石畠 正和(NTTコミュニケーション科学基礎研究所) 岩田 具治(NTTコミュニケーション科学基礎研究所) |
時間 | 06月01日(Mon) 13:40〜14:00 |
概要 | 記号系列データを扱う確率モデルとしてHMMがよく知られている。HMMの学習計算量は系列長をL、潜在状態数をKとすればO(LK^2) であり、L が非常に大きい場合はスケールしない。記号系列データを記号集合と捉えればLDAなどのトピックモデルを利用可能だが、構造情報は考慮できない。本稿では、LDAに文法圧縮手法であるRepairを組合せることで、高速に構造情報を考慮したトピックモデリングを実現する。 |
論文 | PDFファイル |