第35回 言語・音声理解と対話処理研究会 (SIG-SLUD)

日時: 2002年6月7日(金) 10:00-17:30
場所:京都工芸繊維大学 1号館3階 大学院会議室
   (京都市左京区松ヶ崎御所海道町)
   京都市営地下鉄烏丸線松ヶ崎駅下車徒歩約10分
   駅から大学までの地図 | 大学内の地図

参加費:無料
資料代:
 SLUD研究会に登録の方: 郵送(当日新たに購入される場合: 1,500円/部)
 SLUD研究会に非登録の方: 1,500円/部
 学生の方: 無料
プログラム:

[10:00-12:00]

(1) 擬人化エージェントのための{VoiceXML}処理系の開発
        岐津 三泰, 西本 卓也, 荒木 雅弘 (京都工繊大)

        音声合成・音声認識・顔画像合成処理を統合する対話制御エンジンと
        してのVoiceXML処理系について報告する。

(2) マルチモーダルインタラクションによるニュース映像中の人物認識と検索
        藤本 雅清, 山本 夏夫, 有木 康雄, 熊野 雅仁 (龍谷大)

        指先指示と音声入力によって、ニュース映像中に出現する人物を指定
        し、認識、検索を行うシステムについて検討を行った。

(3) ロボットとの音声対話のための信念ネットワークを用いた適応的言語理解
        山肩 洋子, 河原 達也, 奥乃 博 (京大)

        音声対話によりオブジェクトを探索するロボットの実現をめざす。音
        声がオブジェクトを指示する際の曖昧性を、信念ネットワークにより
        解消する手法を述べる。

(4) 並列処理型計算機を用いた音声対話システムの検討
        田熊 竜太, 岩野 公司, 古井 貞煕 (東工大)

        並列処理型計算機を用いた音声対話店舗検索システムを構築した。発
        話内容に応じた複数の認識器を並行駆動し、それらの結果から最適な
        ものを選択する。

[13:00-14:00]

(5) 対面対話の収録と解析のための信号処理とパターン認識
        松坂 要佐, 小林 哲則 (早大)

        対面対話の収録と解析のための信号処理技術とパターン認識技術の開
        発を行っている。その中で、対話音声の調波構造に着目した混合音分
        離法は、防音壁のない状態で収録された対話音声を比較的簡易な処理
        で話者ごとの音声に分離する技術であり、対話研究のツールとして有
        用なものであると考える。本チュートリアルでは、その原理と性能に
        ついて紹介し、公開ツールの使用方法を説明する。また、時間の許す
        範囲で対話における話者の頭部動作の認識などのパターン認識技術に
        ついても紹介する予定である。

[14:15-15:45]

(6) 日本語の複数個体集合を表す名詞句について
        山森 良枝 (神戸大)

        日本語の普通名詞は形態上単・複の区別がなく、複数集合は普通類別
        詞構造によって表現される。しかし、「数詞+N」の可算名詞構造が
        ないわけではない。本稿では、複数集合が日本語ではどのような場合
        にどのように表示されるのか、非類別詞言語といわれる英語のそれと
        比較しながら、検討する。

(7) 基本周波数とポーズによる構文構造の推定
        大須賀 智子, 鈴木 則夫, 堀内 靖雄, 市川 熹 (千葉大)

        音声の基本周波数とポーズ情報のみから、判別分析を用いて構文木を
        推定する手法を提案した.

(8) あいづちの音響的要素の意味の定量的推定
        岡本 匡史, Nigel Ward (東大)

        「あいづちの意味は構成する音響的要素の意味の和で表される」とい
        うモデルのもと、音響的要素(音素、鼻音化)の意味を数値的に求め
        た。

[16:00-17:30]

(9) 話者交替における視線とうなずきの分析
        前田 真季子, 堀内 靖雄, 市川 熹 (千葉大)

        うなずきや視線の動きといったジェスチャーが対話の話者交替時にお
        いてどのような役割を持っているのかを分析する

(10) 発話間間隔が発話意図解釈におよぼす影響
        木村 大生, 橋彌 和秀 (京大)

        同一の音声材料の発話間間隔を操作することによる発話意図解釈の変
        化を検討したところ、500~800msの発話間間隔では字義通りにおこな
        われた意図解釈が、それ以上の間隔を置くと、字義通りでない解釈に
        シフトすることが観察された。

(11) 音声コーパスにおける講演の音声特徴と印象との関係について
        山住 賢司, 籠宮 隆之, 槙 洋一, 前川 喜久雄 (東京都立大/国語研)

        日本語話し言葉コーパスに収録された模擬講演の音声データに対する
        印象評定値と音声特徴量の関係について共分散構造分析を用い検討し
        た。