06月13日(Wed) 09:00〜12:00 C会場(-山口県教育会館/第二研修室+第三研修室(72+30))
演題番号 | 2C1-NFC-2-2(2C1-NFC-2-2in) |
---|---|
題目 | ナイーブベイズによる文書分類のためのWikipediaカテゴリグラフ解析 |
著者 | 白川 真澄(大阪大学 情報科学研究科) 中山 浩太郎(東京大学 知の構造化センター) 原 隆浩(大阪大学) 西尾 章治郎(大阪大学) |
時間 | 06月13日(Wed) 09:20〜09:40 |
概要 | 文書をあらかじめ設定したカテゴリに分類するタスクは,情報検索の分野において重要な課題である.文書分類の一般的なアプローチとしてナイーブベイズが挙げられるが,教師データを用意するためのコストが問題であった.そこで本研究では,Wikipediaのカテゴリ構造を解析することで,ナイーブベイズに必要な教師データ,すなわち,ある語句が出現したときのカテゴリの事後確率を自動的に計算する手法を提案する. |
論文 | PDFファイル |