$30 off During Our Annual Pro Sale. View Details »

【論文紹介】Sparse Embedded k-means Clustering

Shuhei Goda
January 21, 2018

【論文紹介】Sparse Embedded k-means Clustering

Shuhei Goda

January 21, 2018
Tweet

More Decks by Shuhei Goda

Other Decks in Technology

Transcript

  1. 概要 l 背景 ü K-meansクラスタリングは、高次元データに対して計算コストが高い。 ü 先行研究では、Random ProjectionやSVDなどの線形次元削減による 手法を用いて計算コストの改善を行っているが、それでも、   程度 の計算コストが生じている。

    l 本論文の手法 ü Random Projectionで用いる写像行列にスパース行列を採用して、 高速な行列演算を実行することで、計算コストを      に抑える。 l 結論 ü 本論文の手法は、先行研究の手法に比べて、十分なクラスタリング精度 を達成しつつ、計算時間を大幅に短縮している。 1   ) (nd O )) ( ( X nnz O
  2. 本手法の概要 l Sparse Embedded k-Means Clustering ü RPの写像行列にスパース行列を採用することで、RPの計算量を          にする。

    ü 埋め込み次元が           である場合、信頼度      で、クラスタリングの最適解への近似精度が(1+ε)となる。 3   )) 6 , ) / 1 log( (max( 2 2      k O ) ( 1  O  )) ( ( X nnz O
  3. Sparse Embedding Matrix ≈ ε-Approximation Embedded Matrix 9   埋め込み次元の大きさに制約をかけることで、

    ランダム直交行列R=(QΦ)'を使った埋め込み行列X^=XR'は、 1-O(δ)の確率で(2)式の条件を満たす。(証明は3章)