Upgrade to Pro — share decks privately, control downloads, hide ads and more …

自己組織化写像とは / What are Self-Organizing Maps ?

Atom
February 07, 2019
140

自己組織化写像とは / What are Self-Organizing Maps ?

(1) Overall image of data analysis
(2) PCA and SOM
(3) SOM algorithm
(4) SOM and natural language processing

Atom

February 07, 2019
Tweet

Transcript

  1. (1) データ解析の全体像 情報XがラベルYを持っているか?(教師ありか?) ・YES ! → 回帰分析・判別分析 ・NO ! →

    いろいろ(真の情報源について何か知りたい) 4 真の 情報源 データ 統計 モデル
  2. (1) データ解析の全体像 データ解析の発展として 1. データは多様体の上にある. → SOM, 砂時計型深層学習 2. データを少数の要因で説明できる.→

    独立成分解析, 非負値行列分解 3. データは幾つかのクラスタに分けられる. → 変分ベイズ法, 階層クラスタ法 4. データを発生した確率文法を推定したい. → 構文解析変分ベイズ法 6
  3. (2) PCAとSOM 7 主成分分析(principal component analysis)とは ・主成分と呼ばれる変数を合成する多変量解析の一手法 ・N次元実ユークリッド空間 ℝ に値をとるデータ(確率変数)

    X が確率密度関数 () に従うとする.データ X が ほぼ低次元の線形空間( ()の情報をできるだけ残せる部分 空間)上にあるとき,その線形空間を抽出する手法
  4. 近傍(競合)学習:ニューロンが競い合い,勝者ニューロンを決める データ{ | = 1,2, ⋯ } , SOM{ |

    = 1,2, ⋯ } ,学習回数: (1) ; = 1,2, ⋯ を初期化 (2) 番号 をランダムに選び, に一番近い を選ぶ (3) −1 ∶= −1 + ,−1 − −1 : = + , − +1 ∶= +1 + ,+1 − +1 (2),(3)を繰り返す.( , →0) 15 (3) SOMのアルゴリズム
  5. (2) の に一番近い を選び方は主に2通り ・内積: = argmax { � }

    こちらの場合 (3) で規格化が必要 ・ユークリッド距離: = argmin { − } 今回はユークリッド距離で説明する 16 (3) SOMのアルゴリズム
  6. 近傍関数: 一般にガウス関数を用いる , = () � exp(− − 2 22()

    ) 学習率 (),近傍半径() の例( :総学習回数) = 0 − + 1 = 1 + ( − 1) − 17 (3) SOMのアルゴリズム