Upgrade to Pro — share decks privately, control downloads, hide ads and more …

適応的スパムフィルタのための軽量な類似メッセージカウンタ / jsai2026-adaptiv...

適応的スパムフィルタのための軽量な類似メッセージカウンタ / jsai2026-adaptive-spam-filter

2026.06.09 2026年度 人工知能学会全国大会(第40回)(JSAI2026)

Avatar for monochromegane

monochromegane

June 09, 2026

More Decks by monochromegane

Other Decks in Research

Transcript

  1. 背景: スパムの増加と巧妙化 4 • メッセージ機能を有する情報システムで,スパムメッセージが増加・巧妙化 • AI の悪用で言語的・費用的な障壁が低下 • 生成

    AI を活用した巧妙なメッセージも出現し,攻撃手法が高度化 • 対抗策として,機械学習モデルや AI による防御機構の採用が不可欠 • 防御側でも AI を活用したアプローチが提案され,高度な判定が期待できる • 例)gpt-oss-safeguard [OpenAI 25] [OpenAI 25] OpenAI: Introducing gpt-oss-safeguard | OpenAI (2025)
  2. 課題: 実運用上のコストと時間差 5 • 実運用では処理時間の増大によるメッセージ遅延や GPU インスタンスの稼働 コストが課題 • アカウントを跨いだ大量類似メッセージ送信(スパムキャンペーン)で顕著

    例)gpt-oss-safeguard-120b 等を Google Cloud の H100×1 で運用 → 数〜数十秒/メッセージ・約 $11.06/h(≒ $8,000/月) • 軽量なモデルでも,新パターンの検知からデータ収集・再学習・本番反映まで には一定の時間を要する • この時間差の間,システムは未知のスパムに対して脆弱な状態となる 例)コンテナイメージのビルド・学習・予測 API のデプロイが各数分,起動パイプラインのオーバーヘッドも加わり,合 計 30 分〜1 時間のタイムラグ
  3. 本研究のアプローチ 6 • システムを通過するメッセージの類似性と出現頻度に着目したアプローチが研 究されている • 既存の類似メッセージ検出手法には実運用上の課題が残る • テキストと画像が混在するマルチモーダルなメッセージへの対応 •

    検出処理自体がボトルネックとならないための低レイテンシ・低コスト化 • 本研究: これらの要件を満たす軽量な類似メッセージカウンタを提案 • 頻度変化に応じて判定を調整する適応的なスパムフィルタリングを実現
  4. 類似性と出現頻度に着目するアプローチ 8 • 軽量な LSH・SimHash の類似判定はスパム判定モデルを仮定 [Ali 15][Ho 14] •

    新パターンが常にスパムとは限らない場合,類似性と出現頻度に着目 [Coskun 12] • 部分的な改変を含む類似メッセージを捉えるため,n-gram 出現回数を Counting Bloom Filter を用いて m 個の bin で近似カウント • ただし,bin ごとの頻度閾値の事前学習や,n-gram ごとの複数 bin 参照・ 閾値判定が必要でコストが大きい [Ali 15] Ali et al.: Online Malicious Spam Email Detection using LSH (2015) [Ho 14] Ho et al.: SimHash Algorithm in Spam Email Detection (2014) [Coskun 12] Coskun & Giura: Online Detection of Near-Duplicate SMS Spam (2012)
  5. マルチモーダル対応と運用コストの課題 9 • スパムメッセージは画像内にも混入する [Zhang 23] • テキストと同様に,画像でも類似メッセージをカウントできるのが望ましい 例)画像内に埋め込んだテキストや,QR コードによる誘導など

    • 既存手法の多くはテキストを想定 • 画像に対する類似判定の頑健性は期待できない • 意味的特徴を保持する埋め込みモデルなら画像も扱える [Cheng 23] • ただし,軽量な方式と比べ処理時間・運用コストが大きい 例)埋め込みモデルの推論に加え,ベクトルの近似近傍探索(ANN)エンジンの運用が必要 [Zhang 23] Zhang et al.: A Late Multi-modal Fusion Model for Detecting Hybrid Spam E-mail (2023) [Cheng 23] Cheng et al.: Efficient Data Representation Learning in Google-scale Systems (2023)
  6. 逐次的な類似性の判定 13 • テキストと画像それぞれに,軽量かつ逐次処理可能なハッシュ手法を採用 テキスト: TF-IDF+ランダム超平面 LSH 𝒉1 𝒉2 11

    01 00 10 原型 𝒙 ▲ 亜種 𝒙′ 𝑏𝑖 = {1 if 𝒙⋅𝒉𝑖 >0 0 otherwise 画像: 差分ハッシュ(dHash) 200 𝑝𝑖,1 120 𝑝𝑖,2 160 𝑝𝑖,3 90 𝑝𝑖,4 140 𝑝𝑖,5 0 1 0 1 輝度値 ビット 𝑏𝑖,𝑗 0101 𝑏𝑖,𝑗 = {1 if 𝑝𝑖,𝑗+1 >𝑝𝑖,𝑗 0 otherwise • 部分的な変更を含む亜種を同一パターンとしてカウント可能
  7. 頻度変化に応じた判定の調整 14 • 類似メッセージの出現頻度を Count-Min Sketch で近似計算 Add(𝑘) : 𝐶[𝑖,

    ℎ𝑖 (𝑘)] ← 𝐶[𝑖, ℎ𝑖 (𝑘)] + 1 (∀𝑖 ∈ {1, …, 𝑑}) 1 2 1 1 2 3 +1 5 +1 4 +1 1 0 1 1 ⋯ ビット列 𝑏1 𝑏2 …𝑏𝑛 / 𝑏𝑖,𝑗 連結 𝑘 ハッシュ値 ℎ1 (𝑘) ℎ2 (𝑘) ℎ3 (𝑘) 𝑑 行 𝑤 列 Est(𝑘) = min(3, 5, 4) = 3 • 最小値の採用により,ハッシュ衝突による過大評価を抑制 • メモリは固定サイズ・加算と推定は定数時間
  8. 時間経過への対処 15 • SW-CMS(𝑁個の CMS をリング状に管理)を導入 CMS 最古 CMS 1

    つ前 CMS(現在) ⋯ ⋯ ⋯ 𝑑 × 𝑤 カウンタ表 𝑊回ごと に進む 新規 メッセージ 次に上書き=忘却 Est(𝑘) = ∑𝑁 𝑡=1 CMS𝑡 (𝑘) (全ウィンドウのカウントを合算) • 各ウィンドウは𝑊回の観測で次のウィンドウへ切替 • メモリは𝑁 × 𝑑 × 𝑤で一定 → 出現頻度が減ったパターンは自然に忘却
  9. 評価方法 17 • 亜種を大量に含む未知のスパムキャンペーンを模擬し,以下のデータで検出性 能を検証 • テキスト: SMS Spam Collection(単語の追加・削除・置換で亜種

    9 種) • 画像: CIFAR-10(Gaussian・Salt/Pepper ノイズで亜種 9 種) • 原型・亜種と通常メッセージを無作為に混合した列を 1 件ずつ逐次処理 • 評価指標: 平均検出遅延と偽陽性率 • 加えて,処理時間・メモリ使用量の実用性を検証
  10. スパムキャンペーン検出性能 18 • 平均検出遅延: • 各キャンペーンで何件目の亜種で初めて検出できたか(少ないほど高速) • テキスト 3.39 ±

    0.40 件・画像 3.58 ± 0.66 件 — 数件レベルで迅速に検出 • 偽陽性率: • キャンペーン以外が衝突で誤検出された割合(小さいほど良い) • 画像 0%・テキスト 3.61 ± 0.06% • テキスト側は短文集合で語彙数が限られ,衝突しやすかったため
  11. ハッシュの頑健性の分析(テキスト) 19 • ハッシュマッチ率: 編集を加えても原型と同一ハッシュが得られた亜種の割合 追加 削除 置換 1 語

    2 語 3 語 1 語 2 語 3 語 1 語 2 語 3 語 86% 85% 73% 52% 21% 11% 52% 33% 13% • 未知語彙の追加に強い: TF-IDF ベクトルに影響しないため • 既知語彙の削除・置換ではマッチ率が低下するが,既存フィルタが学習済みの パターンのため ML モデルでの判定が期待できる • 埋め込み+LSH でも,コサイン類似度 95.7% と意味的に近いペアのマッチ率 は 20% に留まり,精度低下の主因は LSH の離散化特性にあると示唆された
  12. ハッシュの頑健性の分析(画像) 20 • ハッシュマッチ率: 編集を加えても原型と同一ハッシュが得られた亜種の割合 Gaussian Salt Pepper 0.1% 0.2%

    0.4% 0.1% 0.2% 0.4% 0.1% 0.2% 0.4% 42% 46% 43% 69% 51% 22% 74% 56% 23% • Gaussian は全体的に低い: 全体ノイズが多くの箇所で大小関係を変えるため • Salt/Pepper は局所的な改変に強い: 隣接ピクセルの大小関係に基づくため • QR コード変更のような局所的な改変には検出が有利
  13. パフォーマンス評価 21 • テキスト・画像各 10,000 件で処理時間とメモリを計測(Apple M3 Pro) 処理ステップ テキスト

    画像 ベクトル化/ハッシュ化 74.93 ms 182.93 ms LSH 変換 35.82 ms — SW-CMS 操作 252.90 ms 238.36 ms 合計 363.64 ms 421.30 ms 1 件あたり 36 μs 42 μs メモリ使用量(理論値) 6.93 MB 4.00 MB • 1 件あたり 36〜42μs と高速で,Web 推奨の 100ms 以内に対し影響は軽微 • メモリはテキスト 6.93MB・画像 4.00MB の固定サイズ(件数に依存しない) • 既存フィルタに追加しても遅延・運用コストへの影響は最小限
  14. まとめ 23 • 機械学習モデルの再学習・反映までの時間差を補う,軽量な類似メッセージカ ウンタを提案 • 軽量なハッシュ(LSH・dHash)と時間窓の近似頻度計算で,マルチモーダル に低遅延・省メモリで逐次対応 • 評価では,平均

    3〜4 件の検出遅延でスパムキャンペーンの亜種を検出,処理 時間・メモリも実用的 • ハッシュ値への影響の大きい編集ではマッチ率が低下 • 今後はより頑健で軽量なハッシュ手法を研究