06月06日(Thu) 13:20〜15:40 M会場(-商工会議所9F 99号室)
演題番号 | 3M3-OS-07d-2 |
---|---|
題目 | PrivateCrowdSourcingを用いた言語、音声資源の収集 |
著者 | 芦川 将之((株)東芝 研究開発センター) 有賀 康顕((株)東芝 研究開発センター) 宮村 祐一((株)東芝 研究開発センター) |
時間 | 06月06日(Thu) 14:00〜14:20 |
概要 | 音声認識・合成や自然言語処理において、日々新しく生まれる新語により解析誤りが発生してしまう。新語など辞書に登録されていない未知語を減らすため、我々は、Webクローラによるデータ収集と、プライベートなCrowdSourcingを構築することで、継続的に新語を獲得する言語資源獲得プラットフォームを開発した。本稿では、CrowdSourcingにより得られた言語資源とその応用例について述べる。 |
論文 | PDFファイル |