ArcFaceの仕組み

ArcFaceの仕組み ~角度による距離学習を理解する~ Inoue Yuichi

自己紹介 • RISTでインターンやらせてもらってます。 • 京都大学薬学研究科　博士課程１回生 • 最近コンペに出てます。 Fintech DC 1st,
FUJIFILMコンペ特別賞, AI RUSH 14th, Kaggle GANコンペ 60th (銅メダル) • Twitter (@inoichan)

本日の内容 • 角度による距離学習を理解する。 • Angular Marginを理解する。 • 発表タイトルは「ArcFace」なのですが、理論部分はほぼ「SphereFace」で説明します。今日はしないお話
• どのくらい顔を判断できるか。 (直接, 論文を見てみてくださいm(_ _)m)

断りのない限り、図は下記からの引用です。 ArcFace: Additive Angular Margin Loss for Deep Face Recognition

ArcFaceとは... • 距離学習の「角度 Version」 • 良い感じの「Margin」 • オープンなデータセットに使える

Softmaxの直前の層の捉え方を工夫し、角度でデータ間の類似度を判定して学習できるようにした。そのときに、同じクラスはより近く、違うクラスはより遠くなるようにマージンを工夫した。なぜこれがうまくいくのか？？？ ArcFaceとは...

ArcFaceとは... 内積の公式

距離学習(Metrics Learning)とは？データ間の「距離」を測ることで、そのデータ同士が同じか違うかを判断する方法。似ているデータは距離が近いし、違うデータは距離が遠いと考える。参考URL copypasteの日記 : Metric Learning
入門

・Siamese Net (contrastive loss) - 2種類のInput - 同じラベルの時は近く、違うラベルの時は遠く学習 -
ユークリッド距離 (参考) Siamese Neural Networks for One-shot Image Recognition Dimensionality Reduction by Learning an Invariant Mapping Trains a Siamese MLP on pairs of digits from the MNIST dataset. (引用) A Deep Siamese Neural Network Learns the Human-Perceived Similarity Structure of Facial Expressions Without Explicit Categories

・Triplet Network - 3種類のInput - 同じラベルとは近く、違うラベルとは遠くなるように同時に学習 - ユークリッド距離良い感じにペア選ぶの難しい！
(引用) DEEP METRIC LEARNING USING TRIPLET NETWORK (参考) Deep Metric Learning の定番⁈ Triplet Lossを徹底解説

・Center Loss - 2種類のloss - 同じクラスのデータがコンパクトになるように学習 - ユークリッド距離 (引用)
A Discriminative Feature Learning Approach for Deep Face Recognition (参考) Center lossを読んでみた_20170618@abeja

・Center Loss - 2種類のloss - 同じクラスのデータがコンパクトになるように学習 (引用) A Discriminative
Feature Learning Approach for Deep Face Recognition (参考) Center lossを読んでみた_20170618@abeja ユークリッド距離で考えるの、本当に適しているのか？

・SphereFace：角度による距離学習 - Softmax Lossによって学習された特徴量は、本質的には角度によって分布している。 Center Lossのようにユークリッド距離を元にした方法は適さない。 (引用) SphereFace:
Deep Hypersphere Embedding for Face Recognition

・SphereFace (引用) SphereFace: Deep Hypersphere Embedding for Face Recognition それぞれのクラスの確率
Decision boundary (決定境界) (p1 = p2 となるところ) 決定境界この決定境界よりも自分のクラスの方に近づくように学習は進んでいく。

・SphereFace (引用) SphereFace: Deep Hypersphere Embedding for Face Recognition このように置くと...
θはxとWの間の角度！！！

・SphereFace (引用) SphereFace: Deep Hypersphere Embedding for Face Recognition 角度によって決定境界が決まる！
θはxとWの間の角度！！！

・SphereFace (引用) SphereFace: Deep Hypersphere Embedding for Face Recognition 決定境界はW1とW2の二等分線
角度によって決定境界が決まる！

・SphereFace (引用) SphereFace: Deep Hypersphere Embedding for Face Recognition

・SphereFace (引用) SphereFace: Deep Hypersphere Embedding for Face Recognition 良い感じにMarginを与える！！！

手書き、ご了承ください。

・SphereFace 通常のSoftmax loss

・SphereFace クラス１の「x」が正しく分類されるためには、決定境界より左側に位置するように学習がされなければならない。決定境界

・SphereFace 「x」と「W1」の間の角「θ」に1以上のマージン「m」を掛ける。すると、「 x」と「W1」の間の角は本来より大きく見積もられる。

・SphereFace 決定境界が本来よりも左側に来る。

・SphereFace クラス1の「x」はより「W1」の近くに位置するように、「W2」からは遠くに位置するように学習される。

・SphereFace (引用) SphereFace: Deep Hypersphere Embedding for Face Recognition その結果、同じクラス内の角度の幅が狭くなり、クラ
ス間の角度が大きくなる。

・SphereFace (引用) SphereFace: Deep Hypersphere Embedding for Face Recognition

・SphereFaceの推論 (引用) SphereFace: Deep Hypersphere Embedding for Face Recognition 推論するときは、各クラスの訓練データから抽出した特徴量ベクトルの重心と、テ
ストデータの特徴量ベクトルを Cosine類似度で測る。値が 1に近ければ、そのクラスとなす角が小さい、すなわち距離が近いということになる。黄緑クラスの訓練データから抽出した特徴量ベクトルの重心テストデータの特徴量ベクトルこの2つのベクトルがなす角がどれくらい小さいかを、Cosine類似度で求める！

・SphereFaceのまとめ (引用) SphereFace: Deep Hypersphere Embedding for Face Recognition

・CosFace (引用) CosFace: Large Margin Cosine Loss for Deep Face
Recognition L2-normalizationすることで、xも Wも同じ超球面上にくる。(2次元だったら単位円上のベクトルになる。)

・CosFace (引用) CosFace: Large Margin Cosine Loss for Deep Face
Recognition s：softmaxの温度パラメータ本来は少しでも決定境界より自分のクラス側にきたら、 cosθ1はcosθ2より大きくなる。 cosθ1からmarginを引くことで (cosθ1 - m)、xはよりW1に近づかないとcosθ2より大きくならない！！

・ArcFace CosFaceと同じようにxとWをL2-normalizationしている。

・ArcFace マージンの捉え方は SphereFaceに近い！定数を自分のクラスの θに足す。

まとめ • CNNなどで特徴抽出してきたベクトルを超球面上の点にスケールして、角度でクラスを分類するという解釈をした。 • 学習時に適切なMarginを与えることで、うまく同じクラスのデータはより近くなり、異なるクラスのデータはより遠くなるように学習することができた。

Thank you!!!

実装するのに参考にしたもの • [Keras]MobileNetV2+ArcFaceを使ってペットボトルを分類してみた! • https://github.com/4uiiurz1/keras-arcface • 「Human Protein Atlas Image
Classiﬁcation」のbestﬁttingの1st place solution Appendix

ArcFaceのとてもわかりやすいサイトモダンな深層距離学習 (deep metric learning) 手法: SphereFace, CosFace, ArcFace たぶん、このサイトはArcFaceに少しでも興味持った人は一度は見ているはず！
Softmaxの温度パラメータについてもわかりやすく説明してくれている！！！ Appendix

・マージンによる分類のされ方の違い Appendix SphereFaceでは2つのクラスの角度が近い時、うまく距離を開けることができないが、 CosFace, ArcFaceはその場合でもうまく距離を確保することができる。

・SphereFace, CosFace, ArcFaceを同時に使う Appendix

ArcFaceの仕組み

ArcFaceの仕組み

More Decks by Inoichan

Other Decks in Research

Featured

Transcript