06月07日(Fri) 09:00〜11:20 B会場(-国際会議場201号室)
演題番号 | 4B1-1 |
---|---|
題目 | 統語・意味コーパスの統合と再解釈による大規模な日本語CCG文法の開発 |
著者 | 植松 すみれ(東京大学知の構造化センター) 松崎 拓也(国立情報学研究所 社会共有知研究センター) 花岡 洋輝(東京大学大学院情報理工学系研究科コンピュータ科学専攻) 宮尾 祐介(国立情報学研究所コンテンツ科学研究系) 美馬 秀樹(東京大学知の構造化センター) |
時間 | 06月07日(Fri) 09:00〜09:20 |
概要 | 語彙化文法に基づいた日本語の構文・意味解析器を実現するために、コーパスを基に大規模な日本語文法を開発する手法を示す。日本語の構文情報付きコーパスは係り受け形式が多くそのまま語彙化文法開発には適用できないが、本手法では京大コーパス並びに関連するコーパスの情報を統合、再解釈して語彙化文法に基づく構文コーパスを構成し、日本語文法を獲得する。また実際に獲得した文法を解析に用いた際の精度により評価を行う。 |
論文 | PDFファイル |