Slide 17
Slide 17 text
k-means++<>
はじめに、ランダムに点を一つ選ぶ
次の点は、はじめに選んだ点との距離
に基づいた確率分布に基づいて選ぶ
(遠いほど選ばれやすくなる)
※scikit-learnはデフォルトではk-means++が実行されます
参考文献:sklearn.cluster.KMeans
『k-meansの初期値はなるべく離れた点を選んだほうが良い』というアイデアを利用
[1] Arthur, David, and Sergei Vassilvitskii. k-means++: The advantages of careful seeding. Stanford, 2006.