3D Clustering and Metric Learning

by masa-ita

Slide 1

Slide 1 text

3Dクラスタリングと距離学習板垣正敏 2021-11-14 ＠Python機械学習勉強会 in 新潟

Slide 2

Slide 2 text

今⽇お話しすることモチベーション ModelNet10データセットを⽤いた3次元データのクラスタリング Voxel化したデータのk-means++/t-SNEによるクラスタリング 10クラスの識別器として学習させた3D-CNNモデルの特徴ベクトルを使ったクラスタリング Autoencoderの隠れベクトルを使ったクラスタリング k-means++による疑似ラベル⽣成と3D-CNN訓練によるクラスタリング AugmentationとTriplet Lossによる距離学習から得た特徴ベクトルのクラスタリング上記の実験結果まとめコード（Jupyter Notebook）は下記で公開している https://github.com/masa-ita/3d_clustering_experiments 2

Slide 3

Slide 3 text

モチベーション新潟国際情報⼤学藤⽥教授と、新潟県歴史博物館、東京国⽴博物館、九州国⽴博物館の研究者の⽅々、BSNアイネットと私で、考古学へのディープラーニング適⽤を研究している中で、縄⽂⼟器の3Dスキャニングデータをもとにしたクラスタリングが題材に上った。縄⽂⼟器のスキャンはまだ始まったばかりであったため、ModelNetを使って分析モデルの調査を⾏うことになった。深層学習によるクラスタリングの⼿法を調べているうち、Autoencoderの隠れベクトルに距離学習を組み込んでいる例を知り、距離学習⾃体がクラスタリングに使えないかと考えた。 3 https://arxiv.org/abs/2009.04091v1

Slide 4

Slide 4 text

今回使ったデータ︓ ModelNet10 Dataset プリンストン⼤学が公開している3 次元物体識別ベンチマーク⽤データセット ModelNet10は4900のオブジェクトから成るCADデータを元にした3D オブジェクトデータセット⾊、階調のなどテクスチャのないデータクラス数によりModelNet10と ModelNet40があるライセンスは学術研究に限定今回はtrimeshライブラリを使い、 64x64x64のVoxelデータにリサイズ変換後使⽤ 4

Slide 5

Slide 5 text

クラスタリングと可視化のための⼿法 k-means クラスタリングの代表的⼿法ランダムに選んだ中⼼（セントロイド）からの距離をもとに初期クラスターを形成、クラスターの中⼼の再計算とクラスターの⽣成を繰り返す⽅法。 PCA（主成分分析）分散共分散⾏列の固有ベクトルを⽤いて、相関のある特徴量から互いに相関のない特徴量空間へのマッピングを⾏う⽅法。次元削減にも⽤いられる。 t-SNE 次元削減とクラスター顕著化の⼿法。⾼次元空間の中のサンプル（点）を中⼼とする t分布を仮定し、距離から類似度を計算。Kullback–Leibler 情報量を指標として⽬的とする低次元空間に類似分布を反復再現し、低次元へのマッピングを⾏う⽅法。 5

Slide 6

Slide 6 text

特徴量抽出︓4種類の⽅法 Raw Features 64x64x64のVoxelの3Dデータ（3階のテンソル）を226224次元のフラットなベクトルに変換 3D-CNN Classifier 分類器として訓練した3D-CNNから得たベクトルを特徴量とする Autoencoder ⼊⼒を再現するように学習させたAutoencoderの隠れベクトルを特徴量とする k-means Pseudo Label 3D-CNN k−means法での疑似ラベル⽣成と3D-CNNの学習を繰り返す Triplet Loss with Augmented Data サンプルをデータ拡張により⽔増して1つのクラスとし、Triplet Lossで距離学習させ特徴量とする 6

Slide 7

Slide 7 text

特徴量抽出器としての3D-CNN 3D-CNNを使った分類器を学習させる学習済みの3D-CNNで分類層の⼀つ前の出⼒（活性化関数適⽤前）を特徴量とする 7 この層の出⼒を特徴量として取り出す

Slide 8

Slide 8 text

Autoencoder ⾃⼰学習であるAutoencoder の隠れベクトルを特徴量としてクラスタリングを⾏う⼿法 Ex. https://github.com/deve lopfeng/DeepClustering http://ecmlpkdd2017.ijs.s i/papers/paperID345.pdf 隠れベクトルは32768次元他のモデルのようにGAP後の 128次元では再現性が低いため、⾼次元なモデルを使⽤したバッチサイズ10、エポック数 200 8 Encoderの出⼒を特徴量とする

Slide 9

Slide 9 text

k-means++による疑似ラベル反復学習 DeepCluster ＆DeeperCluster by Facebook Research Deep Clustering for Unsupervised Learning of Visual Features https://arxiv.org/abs/1807.05520 https://github.com/facebookresearch /deepcluster Unsupervised Pre-Training of Image Features on Non-Curated Data https://arxiv.org/abs/1905.01278 https://github.com/facebookresearch /deepercluster 9

Slide 10

Slide 10 text

距離学習とは多次元の特徴量（⾔い換えれば埋め込みベクトル）を⽣成する上で、下記のように学習させる似た対象の埋め込みベクトル同⼠は近く似ていない対象の埋め込みベクトル同⼠は遠く検索や顔認証、異常検知などの分野で提案されてきた⼿法深層学習以前マハラノビス距離学習深層学習以後 Siamese Network Triplet Network L2 Softmax Network 10

Slide 11

Slide 11 text

Triplet Lossについて基準となるサンプル（アンカー）と、似ているサンプル（ポジティブ）、似ていないサンプル（ネガティブ）間の距離を⽐較似ていないサンプル同⼠の距離が、似ているサンプル同⼠の距離よりも設定したマージンだけ⼤きいように学習する学習には適切なTripletを選択する必要がある Hard Triplet 𝑑!" > 𝑑#" Semi-Hard Triplet 𝑑!" + 𝑚 > 𝑑#" https://copypaste-ds.hatenablog.com/entry/2019/03/01/164155 11 https://omoindrot.github.io/triplet-loss

Slide 12

Slide 12 text

データ拡張による教師なし距離学習 1サンプルを1クラスとし、データ拡張をすることでTripletを⽣成し距離学習データ拡張にはVolumentation-3Dを使⽤距離学習にはTensorFlow Addonsの TripletSemiHardLossを使⽤モデルの損失関数を変えるだけでバッチ内の⼀番難しいTripletの組み合わせで損失を計算する 1バッチ＝8サンプル×4拡張＝32個で実験 2エポック程度で学習は進まなくなる Sample1 AugSample1 AugSample2 AugSample3 AugSample4 Sample2 AugSample5 AugSample6 AugSample7 AugSample8 anchor positive negative 12

Slide 13

Slide 13 text

実験結果 13

Slide 14

Slide 14 text

クラスタ数によるクラスタ内残差平⽅和の変化 14 Raw Features Autoencoder k-means Pseudo Label Triplet Loss 3D-CNN Classifier k=10に変曲点

Slide 15

Slide 15 text

クラスタとラベルの対応関係 15 Raw Features Autoencoder k-means Pseudo Label Triplet Loss 3D-CNN Classifier クラスターとラベルが 1対1対応クラスターとラベルの関係ははっきりしない

Slide 16

Slide 16 text

PCAによる可視化︓クラスラベル 16 Raw Features Autoencoder k-means Pseudo Label Triplet Loss 3D-CNN Classifier クラスターが最もはっきりしている

Slide 17

Slide 17 text

PCA正規化後のt-SNE︓クラスラベル 17 Raw Features Autoencoder k-means Pseudo Label Triplet Loss 3D-CNN Classifier クラスターがはっきりしている最もクラスターが不鮮明

Slide 18

Slide 18 text

PCA正規化後のt-SNE︓クラスターID 18 Raw Features Autoencoder k-means Pseudo Label Triplet Loss 3D-CNN Classifier

Slide 19

Slide 19 text

まとめ Voxelデータによる3次元オブジェクトのクラスタリングを試⾏した特徴抽出を⾏う3D-CNNの事前学習データによるバイアスを避けるため、教師なし学習によるクラスタリングを前提とし、下記の3つを⽐較した Autoencoder クラスタリングによる疑似ラベル⽣成と3D-CNNの学習の⼆重ループデータ拡張とTriplet Lossによる距離学習疑似ラベル⽣成を⽤いた3D-CNNの学習では、分離性能の良いクラスタが得られたが、特徴量⾃体が初期設定のクラスタ数に影響を受けていることが確認されたデータ拡張とTriplet Lossによる距離学習では、学習が早い段階で収束してしまうため、抽象度の⾼い特徴抽出ができなかった Autoencoderはバイアス無しに特徴量を学習できる⼿法である 19

Slide 20

Slide 20 text

クラスタリングのための特徴量抽出はどうあるべきか︖ クラスタリングとは「似たもの同⼠を集める」ことである。したがって、クラスタリングのための特徴量抽出は、「データの中の共通点を⾒つけて抽出する」ことが望ましく、これは分類問題と共通することである。他⽅で、この学習は「共通点」以外の情報を「捨てている」可能性を意味している。⼀⽅、各サンプルを1つのクラスとみなして同⼀性の学習を⾏う⼿法では、「他とは異なる特徴」を学習することになり、「共通性」のウエイトは低くなると考えられる。 Autoencoderによる特徴量抽出では、こうした偏りがない特徴量抽出が⾏われていると考えられる。単なるグルーピングではなく、埋め込みベクトルの空間内の位置関係などを分析に使⽤する場合には、こうした共通点の強調や特異性の強調などのバイアスがかからない特徴量抽出が望ましいと考える。ただし、Autoencoderの学習には⼤量のデータと計算時間を要するため、少量のデータのクラスタリングには適していない。また、異常検知にも⽤いられている学習したデータに近くないものについては再現できない特性からわかるように、学習対象にない特徴については抽出できない可能性があることに留意する必要がある。 20