演題番号 | 2H4-4 |
---|---|
題目 | 会話データを対象にした有効な分析視点の設定と対象概念の自動抽出 |
著者 | 竹内 広宜 (日本IBM株式会社 東京基礎研究所) 那須川 哲哉 (日本IBM株式会社 東京基礎研究所) 渡辺 日出雄 (日本IBM株式会社 東京基礎研究所) |
時間 | 6月21日(木) 10:00〜10:20 |
概要 | テキストマイニングを使った分析では、適切な分析観点(カテゴリ)を設定し、分析対象となる概念を定義した上で、辞書という形で語やフレーズを事前に人手で纏め上げる作業が重要である。コールログが人手による概略から成り、重要事項のみが記載されたテキストの場合には、その分析には対象テキストにおける頻出語を基に辞書を定義することが行われていた。生の会話を直接テキストマイニングの対象とする場合、一見すると分析とは無関係な内容も多く含んでおり、選択可能となる分析の観点が多岐にわたる。その中から、特定の目的に応じた分析の切り口として有用となる概念を事前に人手で定義することは難しい。本研究では会話データの分析において分析目的に応じて有用な分析官…および概念を会話の流れを利用して自動的に抽出する方法を提案し、その有効性を実データを用いた分析で示す。 |
論文 | PDFファイル |