Slide 4
Slide 4 text
試してみたこと
時間がないので機械学習にはアリモノを使う
Jubatus(PFN & NTT) - jubaClassifier
fastText(Facebook)
特徴量としてなにを使うか
文字n-gram
たとえば「こんにちは」の2-gramなら、「こん んに にち ちは」の5つに分割
形態素n-gram
「こんにちは」は一つの形態素「こんにちは」になる(と思う)
「こんにちは、プロデューサーさん!」なら以下のように5つに分割
こんにちは 感動詞,*,*,*,*,*,こんにちは,コンニチハ,コンニチワ
、 記号,読点,*,*,*,*,、,、,、
プロデューサー 名詞,一般,*,*,*,*,プロデューサー,プロデューサー,プロデューサー
さん 名詞,接尾,人名,*,*,*,さん,サン,サン
! 名詞,サ変接続,*,*,*,*,* 4