Slide 13
Slide 13 text
逐次的な類似性の判定
13
• テキストと画像それぞれに,軽量かつ逐次処理可能なハッシュ手法を採用
テキスト: TF-IDF+ランダム超平面 LSH
𝒉1
𝒉2
11
01
00
10
原型 𝒙
▲ 亜種 𝒙′
𝑏𝑖
= {1 if 𝒙⋅𝒉𝑖
>0
0 otherwise
画像: 差分ハッシュ(dHash)
200
𝑝𝑖,1
120
𝑝𝑖,2
160
𝑝𝑖,3
90
𝑝𝑖,4
140
𝑝𝑖,5
0 1 0 1
輝度値
ビット 𝑏𝑖,𝑗
0101
𝑏𝑖,𝑗
= {1 if 𝑝𝑖,𝑗+1
>𝑝𝑖,𝑗
0 otherwise
• 部分的な変更を含む亜種を同一パターンとしてカウント可能