Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Constrained K-means Clustering (クラスタサイズの制限をしたK-...

Constrained K-means Clustering (クラスタサイズの制限をしたK-means法) を調べてみた

More Decks by NearMeの技術発表資料です

Other Decks in Programming

Transcript

  1. 1 背景 クラスタサイズ(1クラスターの内部の数)に 制限を加えたクラスタリングを行いたかった ⇨ “Constrained K-means Clustering”   というものを見つけたので使ってみた&中身を調べてみた ※“Constrained

    K-means Clustering”と検索するとたくさん出てくるが、   今回はクラスタサイズの制限ができるものを扱った 論文: https://www.researchgate.net/publication/2458036_Constrained_K-Means_Clustering (※この論文は要素がないクラスタを作らない工夫として、最小値の制限をしているが、 最大も同じように制限することでクラスタサイズの制限を行う)
  2. 8 最小費用フロー問題 (Minimum Cost Flow Problem) A B D C

    全体のコストを最小化しつつ、ノード Aからノード Dに10個届けたい 容量:5 コスト: 2 容量:8 コスト: 4 容量:5 コスト: 1 容量:10 コスト: 3 供給:10 需要:10 しかし、 A⇨Bは5個送れるが、コストは2かかる A⇨Cは8個送れるが、コストは4かかる…
  3. 9 Constrained K-means Clustering ・・・ データ クラスタ中心 ・・・ 1 1

    1 1 (最小値のみの制約) 供給(−需要) 容量 コスト
  4. 10 Constrained K-means Clustering ・・・ データ クラスタ中心 ・・・ 1 1

    1 1 人工需要 ノード データの 供給 クラスタ中心の 需要 (最小値のみの制約)
  5. 11 Constrained K-means Clustering ・・・ データ クラスタ中心 ・・・ 1 1

    1 1 人工需要 ノード データの 供給 クラスタ中心の 需要 (最小値のみの制約) 供給(−需要) 容量 コスト
  6. 12 Constrained K-means Clustering ・・・ データ クラスタ中心 ・・・ 1 1

    1 1 人工需要 ノード データの 供給 クラスタ中心の 需要 (最小値・最大値の制約) 供給(−需要) 容量 コスト
  7. 13 Constrained K-means Clustering https://colab.research.google.com/drive/1ytuPK2cS5I8RIv a5HQ7b9JzCYieNyEhF?usp=drive_link 【アルゴリズム】 1. クラスタの中心を選ぶ 2.

    データをそれぞれ最も近い クラスタに割り当てる 3. クラスタ中心を更新 最小費用フロー問題に落としたい ⇨ノード、エッジ、コスト、供給量、容量の定義が必要
  8. 14 参考文献 P. S. Bradley K. P. Bennett A. Demiriz Microsoft

    Research https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/tr-20 00-65.pdf https://qiita.com/kuga-qiita/items/5588d5469f3268b7fd39 https://fmarthoz.medium.com/k-means-algorithm-in-4-parts-6f44dc21d119 https://github.com/joshlk/k-means-constrained