06月05日(Wed) 09:00〜10:40 B会場(-国際会議場201号室)
演題番号 | 2B1-2 |
---|---|
題目 | 表記のバリエーションを考慮した近代日本語の形態素解析 |
著者 | 岡 照晃(奈良先端科学技術大学院大学情報科学研究科) 小町 守(奈良先端科学技術大学院大学 情報科学研究科 情報科学専攻) 小木曽 智信(国立国語研究所 言語資源研究系) 松本 裕治(奈良先端科学技術大学院大学 情報科学研究科) |
時間 | 06月05日(Wed) 09:20〜09:40 |
概要 | 形態素解析辞書近代文語UniDicの公開により,近代文語論説文の形態素解析が行えるようになった. しかし,この辞書は表記の整った校訂済み資料の解析を念頭に単語登録が行われているため,濁点無表記に代表される表記のバリエーションを含んだ未校訂の資料での解析性能は低い. そこで本発表では,表記のバリエーションを考慮した辞書引きにより,辞書に未登録の表記にも対応可能な形態素解析手法について述べる. |
論文 | PDFファイル |