/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2010ホーム /

2G1-OS3-4 用法の違いを考慮した類似単語の置換とそれを用いた言語モデル学習データ自動生成

06月10日(Thu) 09:00〜12:15 G会場(3F-特別室2・3)
2G1-OS3 オーガナイズドセッション「OS-3 意味と理解のコンピューティング」

演題番号2G1-OS3-4
題目用法の違いを考慮した類似単語の置換とそれを用いた言語モデル学習データ自動生成
著者清水 信哉(東京大学工学部電子情報工学科)
齋藤 大輔(東京大学大学院)
鈴木 雅之(東京大学大学院)
峯松 信明(東京大学)
広瀬 啓吉(東京大学)
時間06月10日(Thu) 10:35〜10:55
概要言語モデル作成に必要な学習データの不足を補うため、学習データ中の語を類似する語と置換し、文を自動生成するという手法を検討している。単語は文脈によって意味、用法が変化することが多く、置換可能な単語もそれに 依存して変化することが予想される。そこで係り受け情報を用いることにより、 単語の文脈による意味、用法の違いを考慮した適切な単語置換を試みる。 さらに評価実験の結果についても報告する。
論文PDFファイル