演題番号 | 2G1-OS3-4 |
---|---|
題目 | 用法の違いを考慮した類似単語の置換とそれを用いた言語モデル学習データ自動生成 |
著者 | 清水 信哉(東京大学工学部電子情報工学科) 齋藤 大輔(東京大学大学院) 鈴木 雅之(東京大学大学院) 峯松 信明(東京大学) 広瀬 啓吉(東京大学) |
時間 | 06月10日(Thu) 10:35〜10:55 |
概要 | 言語モデル作成に必要な学習データの不足を補うため、学習データ中の語を類似する語と置換し、文を自動生成するという手法を検討している。単語は文脈によって意味、用法が変化することが多く、置換可能な単語もそれに 依存して変化することが予想される。そこで係り受け情報を用いることにより、 単語の文脈による意味、用法の違いを考慮した適切な単語置換を試みる。 さらに評価実験の結果についても報告する。 |
論文 | PDFファイル |