• 既存手法の多くはテキストを想定 • 画像に対する類似判定の頑健性は期待できない • 意味的特徴を保持する埋め込みモデルなら画像も扱える [Cheng 23] • ただし,軽量な方式と比べ処理時間・運用コストが大きい 例)埋め込みモデルの推論に加え,ベクトルの近似近傍探索(ANN)エンジンの運用が必要 [Zhang 23] Zhang et al.: A Late Multi-modal Fusion Model for Detecting Hybrid Spam E-mail (2023) [Cheng 23] Cheng et al.: Efficient Data Representation Learning in Google-scale Systems (2023)