06月04日(Tue) 16:20〜18:20 F会場(-国際会議場2F 特別会議室)
演題番号 | 1F4-3 |
---|---|
題目 | Twitter上の「おはよう」を例とした崩れた表記の検出と分析 |
著者 | 藤沼 祥成(東京大学大学院 情報理工学系研究科 コンピュータ科学専攻) 横野 光(国立情報学研究所 社会共有知研究センター) 相澤 彰子(国立情報学研究所 コンテンツ科学研究系,東京大学大学院 情報理工学系研究科 コンピュータ科学専攻) |
時間 | 06月04日(Tue) 17:00〜17:20 |
概要 | 近年 Twitterの発展により正式な表記でないもの、いわゆる崩れた表記が増加した。崩れた表記には話者の感情等の情報が含まれており、正式な表記に直すとそれらの情報が失われると考えられる。本論文ではそのような情報を抽出の最初の段階として「おはよう」に注目し、崩された「おはよう」を抽出した。また、その崩された「おはよう」がどのようなルールにて正式な表記から崩れた表記に変化するかについて分析を行う。 |
論文 | PDFファイル |