適応的スパムフィルタのための軽量な類似メッセージカウンタ / jsai2026-adaptive-spam-filter

適応的スパムフィルタのための軽量な類似メッセージカウンタ三宅悠介 / Pepabo R&D Institute, GMO Pepabo, Inc.
2026.06.09 第 40 回人工知能学会全国大会（JSAI2026）

目次 2 1. はじめに 2. 関連研究 3. 提案手法 4. 評価
5. おわりに

1. はじめに

背景: スパムの増加と巧妙化 4 • メッセージ機能を有する情報システムで，スパムメッセージが増加・巧妙化 • AI の悪用で言語的・費用的な障壁が低下 • 生成
AI を活用した巧妙なメッセージも出現し，攻撃手法が高度化 • 対抗策として，機械学習モデルや AI による防御機構の採用が不可欠 • 防御側でも AI を活用したアプローチが提案され，高度な判定が期待できる • 例）gpt-oss-safeguard [OpenAI 25] [OpenAI 25] OpenAI: Introducing gpt-oss-safeguard | OpenAI (2025)

課題: 実運用上のコストと時間差 5 • 実運用では処理時間の増大によるメッセージ遅延や GPU インスタンスの稼働コストが課題 • アカウントを跨いだ大量類似メッセージ送信（スパムキャンペーン）で顕著
例）gpt-oss-safeguard-120b 等を Google Cloud の H100×1 で運用 → 数〜数十秒/メッセージ・約 $11.06/h（≒ $8,000/月） • 軽量なモデルでも，新パターンの検知からデータ収集・再学習・本番反映までには一定の時間を要する • この時間差の間，システムは未知のスパムに対して脆弱な状態となる例）コンテナイメージのビルド・学習・予測 API のデプロイが各数分，起動パイプラインのオーバーヘッドも加わり，合計 30 分〜1 時間のタイムラグ

本研究のアプローチ 6 • システムを通過するメッセージの類似性と出現頻度に着目したアプローチが研究されている • 既存の類似メッセージ検出手法には実運用上の課題が残る • テキストと画像が混在するマルチモーダルなメッセージへの対応 •
検出処理自体がボトルネックとならないための低レイテンシ・低コスト化 • 本研究: これらの要件を満たす軽量な類似メッセージカウンタを提案 • 頻度変化に応じて判定を調整する適応的なスパムフィルタリングを実現

2. 関連研究

類似性と出現頻度に着目するアプローチ 8 • 軽量な LSH・SimHash の類似判定はスパム判定モデルを仮定 [Ali 15][Ho 14] •
新パターンが常にスパムとは限らない場合，類似性と出現頻度に着目 [Coskun 12] • 部分的な改変を含む類似メッセージを捉えるため，n-gram 出現回数を Counting Bloom Filter を用いて m 個の bin で近似カウント • ただし，bin ごとの頻度閾値の事前学習や，n-gram ごとの複数 bin 参照・閾値判定が必要でコストが大きい [Ali 15] Ali et al.: Online Malicious Spam Email Detection using LSH (2015) [Ho 14] Ho et al.: SimHash Algorithm in Spam Email Detection (2014) [Coskun 12] Coskun & Giura: Online Detection of Near-Duplicate SMS Spam (2012)

マルチモーダル対応と運用コストの課題 9 • スパムメッセージは画像内にも混入する [Zhang 23] • テキストと同様に，画像でも類似メッセージをカウントできるのが望ましい例）画像内に埋め込んだテキストや，QR コードによる誘導など
• 既存手法の多くはテキストを想定 • 画像に対する類似判定の頑健性は期待できない • 意味的特徴を保持する埋め込みモデルなら画像も扱える [Cheng 23] • ただし，軽量な方式と比べ処理時間・運用コストが大きい例）埋め込みモデルの推論に加え，ベクトルの近似近傍探索（ANN）エンジンの運用が必要 [Zhang 23] Zhang et al.: A Late Multi-modal Fusion Model for Detecting Hybrid Spam E-mail (2023) [Cheng 23] Cheng et al.: Efficient Data Representation Learning in Google-scale Systems (2023)

類似メッセージカウンタに求められる要件 10 1. テキストと画像の両方に対する，計算コストを抑えた軽量な類似性判定 2. メッセージの到着に応じた逐次的な処理 3. 長期運用でパターン種類が増えても，メモリが際限なく増大しない仕組み

3. 提案手法

提案手法の概要（処理フロー） 12 Message ML Model Spam Score Text TF-IDF LSH
Image dHash SW-CMS Count Aggregate Score

逐次的な類似性の判定 13 • テキストと画像それぞれに，軽量かつ逐次処理可能なハッシュ手法を採用テキスト: TF-IDF＋ランダム超平面 LSH 𝒉1 𝒉2 11
01 00 10 原型 𝒙 ▲ 亜種 𝒙′ 𝑏𝑖 = {1 if 𝒙⋅𝒉𝑖 >0 0 otherwise 画像: 差分ハッシュ（dHash） 200 𝑝𝑖,1 120 𝑝𝑖,2 160 𝑝𝑖,3 90 𝑝𝑖,4 140 𝑝𝑖,5 0 1 0 1 輝度値ビット 𝑏𝑖,𝑗 0101 𝑏𝑖,𝑗 = {1 if 𝑝𝑖,𝑗+1 >𝑝𝑖,𝑗 0 otherwise • 部分的な変更を含む亜種を同一パターンとしてカウント可能

頻度変化に応じた判定の調整 14 • 類似メッセージの出現頻度を Count-Min Sketch で近似計算 Add(𝑘) : 𝐶[𝑖,
ℎ𝑖 (𝑘)] ← 𝐶[𝑖, ℎ𝑖 (𝑘)] + 1 (∀𝑖 ∈ {1, …, 𝑑}) 1 2 1 1 2 3 +1 5 +1 4 +1 1 0 1 1 ⋯ ビット列 𝑏1 𝑏2 …𝑏𝑛 / 𝑏𝑖,𝑗 連結 𝑘 ハッシュ値 ℎ1 (𝑘) ℎ2 (𝑘) ℎ3 (𝑘) 𝑑 行 𝑤 列 Est(𝑘) = min(3, 5, 4) = 3 • 最小値の採用により，ハッシュ衝突による過大評価を抑制 • メモリは固定サイズ・加算と推定は定数時間

時間経過への対処 15 • SW-CMS（𝑁個の CMS をリング状に管理）を導入 CMS 最古 CMS 1
つ前 CMS（現在） ⋯ ⋯ ⋯ 𝑑 × 𝑤 カウンタ表 𝑊回ごとに進む新規メッセージ次に上書き＝忘却 Est(𝑘) = ∑𝑁 𝑡=1 CMS𝑡 (𝑘) （全ウィンドウのカウントを合算） • 各ウィンドウは𝑊回の観測で次のウィンドウへ切替 • メモリは𝑁 × 𝑑 × 𝑤で一定 → 出現頻度が減ったパターンは自然に忘却

5. 評価

評価方法 17 • 亜種を大量に含む未知のスパムキャンペーンを模擬し，以下のデータで検出性能を検証 • テキスト: SMS Spam Collection（単語の追加・削除・置換で亜種
9 種） • 画像: CIFAR-10（Gaussian・Salt/Pepper ノイズで亜種 9 種） • 原型・亜種と通常メッセージを無作為に混合した列を 1 件ずつ逐次処理 • 評価指標: 平均検出遅延と偽陽性率 • 加えて，処理時間・メモリ使用量の実用性を検証

スパムキャンペーン検出性能 18 • 平均検出遅延: • 各キャンペーンで何件目の亜種で初めて検出できたか（少ないほど高速） • テキスト 3.39 ±
0.40 件・画像 3.58 ± 0.66 件 — 数件レベルで迅速に検出 • 偽陽性率: • キャンペーン以外が衝突で誤検出された割合（小さいほど良い） • 画像 0%・テキスト 3.61 ± 0.06% • テキスト側は短文集合で語彙数が限られ，衝突しやすかったため

ハッシュの頑健性の分析（テキスト） 19 • ハッシュマッチ率: 編集を加えても原型と同一ハッシュが得られた亜種の割合追加削除置換 1 語
2 語 3 語 1 語 2 語 3 語 1 語 2 語 3 語 86% 85% 73% 52% 21% 11% 52% 33% 13% • 未知語彙の追加に強い: TF-IDF ベクトルに影響しないため • 既知語彙の削除・置換ではマッチ率が低下するが，既存フィルタが学習済みのパターンのため ML モデルでの判定が期待できる • 埋め込み＋LSH でも，コサイン類似度 95.7% と意味的に近いペアのマッチ率は 20% に留まり，精度低下の主因は LSH の離散化特性にあると示唆された

ハッシュの頑健性の分析（画像） 20 • ハッシュマッチ率: 編集を加えても原型と同一ハッシュが得られた亜種の割合 Gaussian Salt Pepper 0.1% 0.2%
0.4% 0.1% 0.2% 0.4% 0.1% 0.2% 0.4% 42% 46% 43% 69% 51% 22% 74% 56% 23% • Gaussian は全体的に低い: 全体ノイズが多くの箇所で大小関係を変えるため • Salt/Pepper は局所的な改変に強い: 隣接ピクセルの大小関係に基づくため • QR コード変更のような局所的な改変には検出が有利

パフォーマンス評価 21 • テキスト・画像各 10,000 件で処理時間とメモリを計測（Apple M3 Pro）処理ステップテキスト
画像ベクトル化／ハッシュ化 74.93 ms 182.93 ms LSH 変換 35.82 ms — SW-CMS 操作 252.90 ms 238.36 ms 合計 363.64 ms 421.30 ms 1 件あたり 36 μs 42 μs メモリ使用量（理論値） 6.93 MB 4.00 MB • 1 件あたり 36〜42μs と高速で，Web 推奨の 100ms 以内に対し影響は軽微 • メモリはテキスト 6.93MB・画像 4.00MB の固定サイズ（件数に依存しない） • 既存フィルタに追加しても遅延・運用コストへの影響は最小限

6. おわりに

まとめ 23 • 機械学習モデルの再学習・反映までの時間差を補う，軽量な類似メッセージカウンタを提案 • 軽量なハッシュ（LSH・dHash）と時間窓の近似頻度計算で，マルチモーダルに低遅延・省メモリで逐次対応 • 評価では，平均
3〜4 件の検出遅延でスパムキャンペーンの亜種を検出，処理時間・メモリも実用的 • ハッシュ値への影響の大きい編集ではマッチ率が低下 • 今後はより頑健で軽量なハッシュ手法を研究

適応的スパムフィルタのための軽量な類似メッセージカウンタ / jsai2026-adaptiv...

適応的スパムフィルタのための軽量な類似メッセージカウンタ / jsai2026-adaptive-spam-filter

monochromegane

More Decks by monochromegane

Other Decks in Research

Featured

Transcript

適応的スパムフィルタのための軽量な類似メッセージカウンタ三宅悠介 / Pepabo R&D Institute, GMO Pepabo, Inc.

目次 2 1. はじめに 2. 関連研究 3. 提案手法 4. 評価

1. はじめに

背景: スパムの増加と巧妙化 4 • メッセージ機能を有する情報システムで，スパムメッセージが増加・巧妙化 • AI の悪用で言語的・費用的な障壁が低下 • 生成

課題: 実運用上のコストと時間差 5 • 実運用では処理時間の増大によるメッセージ遅延や GPU インスタンスの稼働コストが課題 • アカウントを跨いだ大量類似メッセージ送信（スパムキャンペーン）で顕著

2. 関連研究

類似性と出現頻度に着目するアプローチ 8 • 軽量な LSH・SimHash の類似判定はスパム判定モデルを仮定 [Ali 15][Ho 14] •

3. 提案手法

提案手法の概要（処理フロー） 12 Message ML Model Spam Score Text TF-IDF LSH

逐次的な類似性の判定 13 • テキストと画像それぞれに，軽量かつ逐次処理可能なハッシュ手法を採用テキスト: TF-IDF＋ランダム超平面 LSH 𝒉1 𝒉2 11

頻度変化に応じた判定の調整 14 • 類似メッセージの出現頻度を Count-Min Sketch で近似計算 Add(𝑘) : 𝐶[𝑖,

時間経過への対処 15 • SW-CMS（𝑁個の CMS をリング状に管理）を導入 CMS 最古 CMS 1

5. 評価

評価方法 17 • 亜種を大量に含む未知のスパムキャンペーンを模擬し，以下のデータで検出性能を検証 • テキスト: SMS Spam Collection（単語の追加・削除・置換で亜種

スパムキャンペーン検出性能 18 • 平均検出遅延: • 各キャンペーンで何件目の亜種で初めて検出できたか（少ないほど高速） • テキスト 3.39 ±

ハッシュの頑健性の分析（テキスト） 19 • ハッシュマッチ率: 編集を加えても原型と同一ハッシュが得られた亜種の割合追加削除置換 1 語

ハッシュの頑健性の分析（画像） 20 • ハッシュマッチ率: 編集を加えても原型と同一ハッシュが得られた亜種の割合 Gaussian Salt Pepper 0.1% 0.2%

パフォーマンス評価 21 • テキスト・画像各 10,000 件で処理時間とメモリを計測（Apple M3 Pro）処理ステップテキスト

6. おわりに