/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2013ホーム /

3M3-OS-07d-2 PrivateCrowdSourcingを用いた言語、音声資源の収集

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2013 このエントリーをはてなブックマークに追加

06月06日(Thu) 13:20〜15:40 M会場(-商工会議所9F 99号室)
3M3-OS-07d オーガナイズドセッション「OS-07 ヒューマンコンピュテーションとクラウドソーシング-4」

演題番号3M3-OS-07d-2
題目PrivateCrowdSourcingを用いた言語、音声資源の収集
著者芦川 将之((株)東芝 研究開発センター)
有賀 康顕((株)東芝 研究開発センター)
宮村 祐一((株)東芝 研究開発センター)
時間06月06日(Thu) 14:00〜14:20
概要音声認識・合成や自然言語処理において、日々新しく生まれる新語により解析誤りが発生してしまう。新語など辞書に登録されていない未知語を減らすため、我々は、Webクローラによるデータ収集と、プライベートなCrowdSourcingを構築することで、継続的に新語を獲得する言語資源獲得プラットフォームを開発した。本稿では、CrowdSourcingにより得られた言語資源とその応用例について述べる。
論文PDFファイル