/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2013ホーム /

2B1-2 表記のバリエーションを考慮した近代日本語の形態素解析

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2013 このエントリーをはてなブックマークに追加

06月05日(Wed) 09:00〜10:40 B会場(-国際会議場201号室)
2B1 自然言語処理・情報検索「自然言語-4」

演題番号2B1-2
題目表記のバリエーションを考慮した近代日本語の形態素解析
著者岡 照晃(奈良先端科学技術大学院大学情報科学研究科)
小町 守(奈良先端科学技術大学院大学 情報科学研究科 情報科学専攻)
小木曽 智信(国立国語研究所 言語資源研究系)
松本 裕治(奈良先端科学技術大学院大学 情報科学研究科)
時間06月05日(Wed) 09:20〜09:40
概要形態素解析辞書近代文語UniDicの公開により,近代文語論説文の形態素解析が行えるようになった.
しかし,この辞書は表記の整った校訂済み資料の解析を念頭に単語登録が行われているため,濁点無表記に代表される表記のバリエーションを含んだ未校訂の資料での解析性能は低い.
そこで本発表では,表記のバリエーションを考慮した辞書引きにより,辞書に未登録の表記にも対応可能な形態素解析手法について述べる.
論文PDFファイル