演題番号 | 2C2-3 |
---|---|
題目 | 企業の公式Webサイトからの手がかり語を用いた基本情報属性抽出 |
著者 | 鶴田 雅信(豊橋技術科学大学 電子・情報工学専攻) 増山 繁(豊橋技術科学大学) |
時間 | 06月10日(Thu) 11:15〜11:35 |
概要 | 企業の公式 Web サイトには、投資家などにとって有用な情報である、企業の基本情報が記述されているページが存在する。本研究では、基本情報が含まれるページへのリンクに含まれやすいと考えられる語(手がかり語)、および、企業の公式 Web サイトのトップページリストのみを用いて、クローリングと同時に企業の基本情報の属性、および、属性値を自動的に抽出するシステムを提案する。 |
論文 | PDFファイル |