/ プログラム/ 発表一覧/ 著者一覧企業展示一覧/ jsai2017ホーム /

2K5-OS-33c-2 自然残響の考慮による聴覚音声スパース符号化再考

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2017 このエントリーをはてなブックマークに追加

05月24日(Wed) 19:30〜20:10 K会場(ウインクあいち-10F 1002会議室)
2K5-OS-33c オーガナイズドセッション「OS-33 脳科学とAI(3)」

演題番号2K5-OS-33c-2
題目自然残響の考慮による聴覚音声スパース符号化再考
著者寺島 裕貴(日本電信電話株式会社 NTT コミュニケーション科学基礎研究所)
古川 茂人(日本電信電話株式会社 NTTコミュニケーション科学基礎研究所)
時間05月24日(Wed) 19:50〜20:10
概要聴覚末梢の特性を理解するために、入力である音声を効率的に表現するスパース符号化モデルが提案されてきた。本研究ではまず、このモデルを屋内外の自然な環境下で録音した音声に適用すると不整合が生じることを示す。さらに、自然界における音声残響を考慮するとこの不整合を再現できることを示し、モデルの再解釈を試みる。
論文PDFファイル