顔認証技術の新方向

AI Community 2026.04.17 洪嘉源 GOドライブ株式会社顔認証技術の新方向

2 最新の顔認証を取り巻く「3つの壁」 Deepfakeの脅威・生体データの法規制・汎用性の欠如安全性プライバシー倫理性 Foundation Models and Biometrics:
A Survey and Outlook (IEEE T- IFS 2025)[1] • 概要：生体認証における基礎モデル（Foundation Models）の適用範囲を網羅した最新サーベイ。従来の「特定の環境下での高精度」から、「あらゆる攻撃やデバイスに対応する汎用性」へのシフトを指摘。 • 安全性、プライバシー、倫理性に関する新たな課題の提示。

3 生体認証に影響を与える4つの主要モデル • LLM (大言語モデル): 認証結果の論理的推論、メタデータ解析、システムの可読性向上。 • VLM (視覚言語モデル): 画像とテキストの紐付け。自然言語による人物検索（例：「赤い服の男」）。
• ALM (音声言語モデル): ノイズに強い声紋認証、感情や状態を考慮した音声解析。 • LMM (多模態大型モデル): 顔・声・歩容などを統合した、より堅牢なマルチモーダル認証。

4 5つの主要な応用領域 • 生体識別 (Recognition): ゼロショット学習による、未知の環境下での高精度なマッチング。 • ソフト生体検知 (Soft-biometric): 年齢、性別、服装、身体的特徴の自動抽出し、サーチのサポートとして利用。
• Deepfake・偽造検知: 生成AIで作られた「偽の顔」や「加工された証拠」の微細な違和感を特定。 • 反欺瞞・活体検知 (Anti-spoofing): 3Dマスクや写真による攻撃を、より高度な質感解析で防御。 • 合成データ生成: 拡散モデル（Diffusion Models）を用いた、プライバシーに配慮した学習用データの生成。

5 技術的ブレイクスルー：革新的な3つのメリット • ゼロショット/少サンプル学習 (Zero/Few-shot Learning): 膨大なラベル付きデータがなくても、新しい環境や対象に対して即座に対応可能。 • 説明可能性 (Explainability/XAI):
「なぜ本人だと判断したのか」を自然言語で説明可能にし、システムの信頼性を向上。 • クロスモーダル・検索: テキスト、画像、音声の壁を越えた自由な検索と認証スキームの構築。

6 課題社会実装に向けたハードル • セキュリティのリスク: 基礎モデル自体への敵対的攻撃（Adversarial Attack）の懸念。 • プライバシーと法規制: 膨大な学習データに関するGDPR（EU一般データ保護規則）等の規制遵守。
• 公平性とバイアス: 特定の人種や性別における精度の偏りの解消。 • エッジデバイスへの実装: 巨大なモデルをスマートフォン等の端末でどう動かすか（軽量化技術）。

7 最新の顔認証の方向① Adaptive Face Anti-Spoofing Through Enhanced Data Manipulation and
Feature Contrast Techniques (DMFC-FAS) (ICCV 2025) [2] 方向：Deepfakeに対する「物理的・生理的」防御 • 現在の課題: 1. ドメインシフト: 学習データにない新しい照明条件、デバイス、攻撃手法（未知のドメイン）に遭遇すると、精度が大幅に低下する。 2. 特徴の限界: 従来のモデルは特定のデータセットに過学習しやすく、本質的な「生体（Live）」と「偽造（Spoof）」の差を捉えきれていない。 • 提案手法 : 顔なりすまし防止データ操作（Data Manipulation）と特徴対照（Feature Contrast）を組み合わせた、適応型の汎化フレームワーク

8 最新の顔認証の方向① Adaptive Face Anti-Spoofing Through Enhanced Data Manipulation and
Feature Contrast Techniques (DMFC-FAS) (ICCV 2025) 1. 強化されたデータ操作 (Enhanced Data Manipulation - DM): 単なる画像加工ではなく、ドメイン間の特徴的な差異を意図的に作り出し、モデルに「環境に依存しない本質的な特徴」を学習させる。 2. 特徴対照技術 (Feature Contrast - FC): 対照学習 (Contrastive Learning): 本人の顔（Real）同士は近く、偽造（Spoof）は遠くに配置するだけでなく、異なる攻撃手法間でも特徴を明確に分離。 3. 適応的メカニズム (Adaptive Mechanism): 入力データの特性に応じてモデルの重みを動的に調整し、多様なドメインに柔軟に対応。

9 最新の顔認証の方向② FSFM: A Generalizable Face Security Foundation Model via
Self-Supervised Facial Representation Learning (CVPR 2025) [3] 方向：強力の基盤モデルを構築 • 現状の課題: 1. 従来のモデル（FASやDeepfake検知）は特定のデータセットや攻撃手法に過学習しやすく、未知の攻撃（Unseen attacks）への汎化性能が低い。 2. タスクごとに個別のモデルを訓練する必要があり、非効率。

Self-Supervised Facial Representation Learning (CVPR 2025) • 提案手法: 1. Face Security Foundation Model (FSFM): 大規模な顔データから「セキュリティに特化した特徴」を事前に学習する基盤モデル。 2. ラベルのない膨大なデータから、顔の微細な質感や偽造の痕跡を捉える表現能力を獲得。MIM (Masked Image Modeling) と ID (Instance Discrimination) を組み合わせた自己教師あり学習。顔の一部を隠して復元させることで、局所的な特徴（偽造の痕跡）と大範囲的な意味（個人の識別）の両方を学習。

Self-Supervised Facial Representation Learning (CVPR 2025) • 学習戦略: 1. MIM (Masked Image Modeling): 画像の一部を隠し、残りの部分から隠された部分を復元する学習手法（MAE等）をベースに。 2. ラベル（本物/偽物）に頼らず、顔画像の「空間的・周波数的な一貫性」を学習。 3. Facial Representation Learning: 顔の皮膚の質感、光の反射、微細な動きなど、アイデンティティ（誰か）ではなく、セキュリティ（生体かどうか）に重要な情報を抽出。 • アーキテクチャの強み: 1. 大規模な多様なデータセットで事前学習。 2. アダプティブ・チューニング: 最小限の追加学習（Few-shot）や学習なし（Zero-shot）で、 FAS、ディープフェイク検知、顔偽造検出などの複数タスクに対応可能。

12 最新の顔認証の方向③ NegFaceDiff: The Power of Negative Context in Identity-Conditioned
Diffusion for Synthetic Face Generation (ICCV 2025 Workshop)[4] 方向：実データゼロでの学習（Real-Data-Free FR） • 概要: 拡散モデル（Diffusion Model）にNegative Contextを導入。 Positive Contextで似たような顔（を生成しないように制御し、 Negative Contextで合成データセット内の「IDの分離性」を高め、実データに匹敵する識別性能を実現。

13 最新の顔認証の方向④ Rethinking Vision-Language Model in Face Forensics: Multi-Modal Interpretable
Forged Face Detector (M2F2-Det) (CVPR 2025) [5] 方向：視覚言語モデル (VLM) による説明可能な認証 • 概要: CLIPとLLMを統合し、認証結果と同時に「目元の微細なテクスチャに不自然なアーティファクトがあるためDeepfakeと判断」といったテキスト説明を生成する技術。

14 まとめ • 生体認証は「点」の照合から「文脈」の理解へ • 精度から信頼へ • 実データから合成データへ

15 [1] Hatef Otroshi Shahreza, Sébastien Marcel. Foundation Models and
Biometrics: A Survey and Outlook. 2024 IEEE 6th International Symposium on Logistics and Industrial Informatics (LINDI). [2] Jielong Wang, Kaifeng Huang, Zehua Lan, Senxu He, Minzhe Huang, Ruyi Cai. Adaptive Face Anti-Spoofing Through Enhanced Data Manipulation and Feature Contrast Techniques. In ICCV, 2025. [3] Gaojian Wang, Feng Lin, Tong Wu, Zhenguang Liu, Zhongjie Ba, Kui Ren. FSFM: A Generalizable Face Security Foundation Model via Self-Supervised Facial Representation Learning. In CVPR, 2025. [4] Eduarda Caldeira, Naser Damer, Fadi Boutros. NegFaceDiff: The Power of Negative Context in Identity-Conditioned Diffusion for Synthetic Face Generation. In ICCV Workshops, 2025. [5] Xiao Guo, Xiufeng Song, Yue Zhang, Xiaohong Liu, Xiaoming Liu. Rethinking Vision-Language Model in Face Forensics: Multi-Modal Interpretable Forged Face Detector. In CVPR, 2025. Reference

顔認証技術の新方向

顔認証技術の新方向

Plot Hong

More Decks by Plot Hong

Other Decks in Technology

Featured

Transcript

AI Community 2026.04.17 洪嘉源 GOドライブ株式会社顔認証技術の新方向

2 最新の顔認証を取り巻く「3つの壁」 Deepfakeの脅威・生体データの法規制・汎用性の欠如安全性プライバシー倫理性 Foundation Models and Biometrics:

5 技術的ブレイクスルー：革新的な3つのメリット • ゼロショット/少サンプル学習 (Zero/Few-shot Learning): 膨大なラベル付きデータがなくても、新しい環境や対象に対して即座に対応可能。 • 説明可能性 (Explainability/XAI):

6 課題社会実装に向けたハードル • セキュリティのリスク: 基礎モデル自体への敵対的攻撃（Adversarial Attack）の懸念。 • プライバシーと法規制: 膨大な学習データに関するGDPR（EU一般データ保護規則）等の規制遵守。

7 最新の顔認証の方向① Adaptive Face Anti-Spoofing Through Enhanced Data Manipulation and

8 最新の顔認証の方向① Adaptive Face Anti-Spoofing Through Enhanced Data Manipulation and

9 最新の顔認証の方向② FSFM: A Generalizable Face Security Foundation Model via

10 最新の顔認証の方向② FSFM: A Generalizable Face Security Foundation Model via

11 最新の顔認証の方向② FSFM: A Generalizable Face Security Foundation Model via

12 最新の顔認証の方向③ NegFaceDiff: The Power of Negative Context in Identity-Conditioned

13 最新の顔認証の方向④ Rethinking Vision-Language Model in Face Forensics: Multi-Modal Interpretable

14 まとめ • 生体認証は「点」の照合から「文脈」の理解へ • 精度から信頼へ • 実データから合成データへ

15 [1] Hatef Otroshi Shahreza, Sébastien Marcel. Foundation Models and