/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2013ホーム /

4B1-1 統語・意味コーパスの統合と再解釈による大規模な日本語CCG文法の開発

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2013 このエントリーをはてなブックマークに追加

06月07日(Fri) 09:00〜11:20 B会場(-国際会議場201号室)
4B1 自然言語処理・情報検索「自然言語-6」

演題番号4B1-1
題目統語・意味コーパスの統合と再解釈による大規模な日本語CCG文法の開発
著者植松 すみれ(東京大学知の構造化センター)
松崎 拓也(国立情報学研究所 社会共有知研究センター)
花岡 洋輝(東京大学大学院情報理工学系研究科コンピュータ科学専攻)
宮尾 祐介(国立情報学研究所コンテンツ科学研究系)
美馬 秀樹(東京大学知の構造化センター)
時間06月07日(Fri) 09:00〜09:20
概要語彙化文法に基づいた日本語の構文・意味解析器を実現するために、コーパスを基に大規模な日本語文法を開発する手法を示す。日本語の構文情報付きコーパスは係り受け形式が多くそのまま語彙化文法開発には適用できないが、本手法では京大コーパス並びに関連するコーパスの情報を統合、再解釈して語彙化文法に基づく構文コーパスを構成し、日本語文法を獲得する。また実際に獲得した文法を解析に用いた際の精度により評価を行う。
論文PDFファイル