/ プログラム/ 発表一覧/ 著者一覧/ 企業展示一覧/ jsai2013ホーム /

1F4-3 Twitter上の「おはよう」を例とした崩れた表記の検出と分析

*セッションの無断動画配信はご遠慮下さい。

Tweet #jsai2013 このエントリーをはてなブックマークに追加

06月04日(Tue) 16:20〜18:20 F会場(-国際会議場2F 特別会議室)
1F4 自然言語処理・情報検索「自然言語-2」

演題番号1F4-3
題目Twitter上の「おはよう」を例とした崩れた表記の検出と分析
著者藤沼 祥成(東京大学大学院 情報理工学系研究科 コンピュータ科学専攻)
横野 光(国立情報学研究所 社会共有知研究センター)
相澤 彰子(国立情報学研究所 コンテンツ科学研究系,東京大学大学院 情報理工学系研究科 コンピュータ科学専攻)
時間06月04日(Tue) 17:00〜17:20
概要近年 Twitterの発展により正式な表記でないもの、いわゆる崩れた表記が増加した。崩れた表記には話者の感情等の情報が含まれており、正式な表記に直すとそれらの情報が失われると考えられる。本論文ではそのような情報を抽出の最初の段階として「おはよう」に注目し、崩された「おはよう」を抽出した。また、その崩された「おはよう」がどのようなルールにて正式な表記から崩れた表記に変化するかについて分析を行う。
論文PDFファイル