概要
l 背景
ü K-meansクラスタリングは、高次元データに対して計算コストが高い。
ü 先行研究では、Random ProjectionやSVDなどの線形次元削減による
手法を用いて計算コストの改善を行っているが、それでも、 程度
の計算コストが生じている。
l 本論文の手法
ü Random Projectionで用いる写像行列にスパース行列を採用して、
高速な行列演算を実行することで、計算コストを に抑える。
l 結論
ü 本論文の手法は、先行研究の手法に比べて、十分なクラスタリング精度
を達成しつつ、計算時間を大幅に短縮している。
1
)
(nd
O
))
(
( X
nnz
O
Slide 3
Slide 3 text
k平均法の計算コスト削減を目的とした先行手法
l SVDやRandom Projectionを使用した、データ行列の次元削減
ü state-of-the-artなRPでも、 の計算量と (2+ε)の精度
2
)
log(
2 d
ndk
O
Slide 4
Slide 4 text
本手法の概要
l Sparse Embedded k-Means Clustering
ü RPの写像行列にスパース行列を採用することで、RPの計算量を
にする。
ü 埋め込み次元が である場合、信頼度
で、クラスタリングの最適解への近似精度が(1+ε)となる。
3
))
6
,
)
/
1
log(
(max(
2
2
k
O )
(
1
O
))
(
( X
nnz
O
Slide 5
Slide 5 text
Sparse Embedding Algorithm
4
ランダム直交行列の作成 ))
(
( X
nnz
O