Upgrade to Pro — share decks privately, control downloads, hide ads and more …

b3semi_2.pdf

MARUYAMA
February 03, 2017
130

 b3semi_2.pdf

MARUYAMA

February 03, 2017
Tweet

More Decks by MARUYAMA

Transcript

  1. 3.1 クラスタリングとは 5 ▪クラスタリング :似ているもの同士を一つのグループにまとめる作業 ▪クラスタ :出来上がったグループ ・ 文書, 単語,

    文, 句などあらゆるものが対象 ・ どんなクラスタが出来上がるのかを前もって知ることはできない
  2. 3.2 凝集型クラスタリング 11 ▪凝集型クラスタリングのアルゴリズム 入力:事例集合 D = {('), (*), …

    (|-|)} C = {' , * , … |-| } # 1つのクラスタに1つの事例を割り当てる ' ={(')}, * ={(*)}, …|-| ={(|-|)} while |C |≥2 # 最も似ているクラスタ対を見つける # クラスタ対の融合 (: , ; ) = arg max (D , E ) D , E ∈ (: , ; ) end while # 停止条件
  3. 3.2 凝集型クラスタリング 13 ▪ 単連結法(single-link method) : 2つのクラスタが与えられたとき, その中で最も近い事例対の 類似度を,

    その2つのクラスタの類似度とする方法 (D , E ) = max (M , N ) M ∈ D , N ∈ E ▪ 完全連結法(complete-link method) : 2つのクラスタが与えられたとき, その中で最も遠い事例対の 類似度を, その2つのクラスタの類似度とする方法 (D , E ) = min (M , N ) M ∈ D , N ∈ E
  4. 3.3 k-平均法 30 ▪ -平均法( -means) 入力:事例集合 D = {('),

    (*), … (|-|)} # 事例ベクトル集合の分割 until 収束 # 代表ベクトルの計算 ∀, :WX =arg max sim((D), O ) (D) into :WX end foreach クラスタ数k 無作為に代表ベクトル ' , * , … M を選定 foreach (D) ∈ ∀, O = ' O ∑ (D) (D) ∈ end until # c : クラスタ