演題番号 | 3H9-4 |
---|---|
題目 | 動向情報編纂のためのテキストからの統計量の自動抽出 |
著者 | 森 辰則 (横浜国立大学 大学院 環境情報研究院) 藤岡 篤史 (横浜国立大学 大学院 環境情報学府) 村田 一郎 (横浜国立大学 大学院 環境情報学府) |
時間 | 6月22日(金) 15:30〜15:50 |
概要 | 動向情報の自動編纂を行なうためには,テキストから各種統計量を自動抽出することが必要である.その自動抽出は,統計量の諸元を表す表現(統計量名)ならびに対応する数量を抽出するとともに,両者を対応づけることによりなされるが,特に,テキスト中で様々な現れ方をする統計量名の自動抽出が要となる.そこで,本論文では,統計量名の自動抽出に重点を置いてテキストからの統計量の自動抽出を考察する.抽出すべき統計量名は単一の短い言語表現であることは稀であり,様々な構成要素から成立ち,テキスト中に散在することが普通である.そこで,統計量名の成立ちを考察し,機械学習手法により各構成要素を個別に抽出する方法について考察する. |
論文 | PDFファイル |