Slide 11
Slide 11 text
3-3 ツイートの分析となおすけ辞書の作成
• ツイート⽂字列を形態素解析し、配列に格納
私の名前は中野です。→ [“私”, “の”, “名前”, ”は”, ”中野”, ”で
す”, ”。”]
• マルコフ連鎖のためのダミー⽂字列を挿⼊
[“_BEGIN_”, “私”, “の”, “名前”, ”は”, ”中野”, ”です”, ”。”, “_END_”]
• N階マルコフモデルを作成する
• N個のネストしたハッシュを作成
• ハッシュが存在すれば、要素としての配列に挿⼊
hash[“_BEGIN_”][“私”] = [‘の’, ‘は’, ‘が’, ‘と’, ‘で’,...]
hash[“私”][“の”] = [‘名前’, ‘好き’, ‘嫁’, ‘名前’, ‘彼⼥’,...]
: :