Slide 26
Slide 26 text
Similarityを計算する式
26
similarity = 𝛼 ∗ idfsum
− 𝛽 ∗ morphemes
• 長い文にペナルティを与えている。
• idfsum
はIDFの合計値
• morphemesは現在類似度を計算している文の形態素の数
• 𝛼, 𝛽は重視する値を調節するパラメータ
• 今回は𝛼に5,𝛽に0.1を代入
• similarityが3以上のとき抽出対象となる。
・ ゲーム
差 首位
DeNA 敗れ
返り咲い
類似度を計算する文
試合
首位
similarity
= 5 ∗ 1.02 − 0.1 ∗ 9
= 4.20 ≥ 3