/ プログラム / 発表一覧 / 著者一覧 / JSAI2007 ホーム

3H9-4 動向情報編纂のためのテキストからの統計量の自動抽出

6月22日(金) 14:30〜16:10 H会場
情報編纂のための情報抽出

演題番号3H9-4
題目動向情報編纂のためのテキストからの統計量の自動抽出
著者森 辰則 (横浜国立大学 大学院 環境情報研究院)
藤岡 篤史 (横浜国立大学 大学院 環境情報学府)
村田 一郎 (横浜国立大学 大学院 環境情報学府)
時間6月22日(金) 15:30〜15:50
概要動向情報の自動編纂を行なうためには,テキストから各種統計量を自動抽出することが必要である.その自動抽出は,統計量の諸元を表す表現(統計量名)ならびに対応する数量を抽出するとともに,両者を対応づけることによりなされるが,特に,テキスト中で様々な現れ方をする統計量名の自動抽出が要となる.そこで,本論文では,統計量名の自動抽出に重点を置いてテキストからの統計量の自動抽出を考察する.抽出すべき統計量名は単一の短い言語表現であることは稀であり,様々な構成要素から成立ち,テキスト中に散在することが普通である.そこで,統計量名の成立ちを考察し,機械学習手法により各構成要素を個別に抽出する方法について考察する.
論文PDFファイル

/ プログラム / 発表一覧 / 著者一覧 / JSAI2007 ホーム