Upgrade to Pro — share decks privately, control downloads, hide ads and more …

自己組織化写像とは / What are Self-Organizing Maps ?

Atom
February 07, 2019
160

自己組織化写像とは / What are Self-Organizing Maps ?

(1) Overall image of data analysis
(2) PCA and SOM
(3) SOM algorithm
(4) SOM and natural language processing

Atom

February 07, 2019
Tweet

More Decks by Atom

Transcript

  1. (1) データ解析の全体像 情報XがラベルYを持っているか?(教師ありか?) ・YES ! → 回帰分析・判別分析 ・NO ! →

    いろいろ(真の情報源について何か知りたい) 4 真の 情報源 データ 統計 モデル
  2. (1) データ解析の全体像 データ解析の発展として 1. データは多様体の上にある. → SOM, 砂時計型深層学習 2. データを少数の要因で説明できる.→

    独立成分解析, 非負値行列分解 3. データは幾つかのクラスタに分けられる. → 変分ベイズ法, 階層クラスタ法 4. データを発生した確率文法を推定したい. → 構文解析変分ベイズ法 6
  3. (2) PCAとSOM 7 主成分分析(principal component analysis)とは ・主成分と呼ばれる変数を合成する多変量解析の一手法 ・N次元実ユークリッド空間 ℝ に値をとるデータ(確率変数)

    X が確率密度関数 () に従うとする.データ X が ほぼ低次元の線形空間( ()の情報をできるだけ残せる部分 空間)上にあるとき,その線形空間を抽出する手法
  4. 近傍(競合)学習:ニューロンが競い合い,勝者ニューロンを決める データ{ | = 1,2, ⋯ } , SOM{ |

    = 1,2, ⋯ } ,学習回数: (1) ; = 1,2, ⋯ を初期化 (2) 番号 をランダムに選び, に一番近い を選ぶ (3) −1 ∶= −1 + ,−1 − −1 : = + , − +1 ∶= +1 + ,+1 − +1 (2),(3)を繰り返す.( , →0) 15 (3) SOMのアルゴリズム
  5. (2) の に一番近い を選び方は主に2通り ・内積: = argmax { � }

    こちらの場合 (3) で規格化が必要 ・ユークリッド距離: = argmin { − } 今回はユークリッド距離で説明する 16 (3) SOMのアルゴリズム
  6. 近傍関数: 一般にガウス関数を用いる , = () � exp(− − 2 22()

    ) 学習率 (),近傍半径() の例( :総学習回数) = 0 − + 1 = 1 + ( − 1) − 17 (3) SOMのアルゴリズム