演題番号 | 3B1-OS22c-2 |
---|---|
題目 | 調音運動のone-modelを用いた音声認識・合成の改良 |
著者 | 新田 恒雄(豊橋技術科学大学 大学院工学研究科 情報・知能工学専攻) 小野田 高幸(豊橋技術科学大学 大学院工学研究科 情報・知能工学専攻) 荒木 厚太(豊橋技術科学大学 大学院工学研究科 情報・知能工学専攻) 入部 百合絵(豊橋技術科学大学 情報メディア基盤センター) 桂田 浩一(豊橋技術科学大学 大学院工学研究科 情報・知能工学専攻) |
時間 | 06月03日(Fri) 13:20〜13:40 |
概要 | 音声認識と音声合成を共通の調音運動HMMを利用して実現する方式を開発している。今回の報告では,これまでのmonophoneからtriphoneとすると共に,調音運動の時間制御精度を向上させることで,標準的なMFCCのtriphoneを凌ぐ音声認識性能が得られることを示す。また音声合成では,音源の改良を行い,CELP方式の符号帳設計を改良することで,MOS値4の高い音質が得られることを示す。 |
論文 | PDFファイル |