05月24日(Wed) 13:50〜15:30 L会場(ウインクあいち-10F 1003会議室)
演題番号 | 2L2-OS-09a-3 |
---|---|
題目 | 聴覚系モデルを用いた音のテクスチャ変換 |
著者 | 上村 卓也(NTTコミュニケーション科学基礎研究所) 寺島 裕貴(日本電信電話株式会社 NTT コミュニケーション科学基礎研究所) 古川 茂人(日本電信電話株式会社 NTTコミュニケーション科学基礎研究所) |
時間 | 05月24日(Wed) 14:50〜15:10 |
概要 | ある音の内容は保持したままテクスチャのみを変換する手法を提案する。過去に提案された、聴覚系を模擬したモデルによる音のテクスチャ合成と、畳み込みニューラルネットワークによる画像のテクスチャ変換を組み合わせた。本手法では、異なる2音から計算したモデルの出力波形を元に、それぞれの特徴を受け継いだ新たな音を合成する。例として音声や音楽に適用し、水中で喋ったような音声や、鳥の鳴き声のような音楽を合成した。 |
論文 | PDFファイル |