Upgrade to Pro — share decks privately, control downloads, hide ads and more …

PRML勉強会@長岡 第4章線形識別モデル

 PRML勉強会@長岡 第4章線形識別モデル

Shohei Okada

May 19, 2014
Tweet

More Decks by Shohei Okada

Other Decks in Science

Transcript

  1. 目的変数の表現 • 1-of-K符号化法 – = 5クラスの例 t = 0,1,0,0,0 T

    – の値はクラスが である確率と解釈可能 5
  2. 2クラス • 最も簡単な線形識別関数 x = T + 0 :重みベクトル 0

    :バイアスパラメータ ≥ 0ならばクラス1 決定面は = 0 14
  3. 16

  4. 2クラス • ダミー入力値0 = 1を導入 � = 0 , ,

    � = 0 , を導入 = �T � スッキリ! – ベクトルの次元が1増えてる 17
  5. 多クラス • 個の線形関数で構成される単独のクラス 識別を考える = T + 0 = �T

    � – すべての ≠ に対して () > ()である場合 点はクラス 19
  6. 多クラス • , 間の決定境界は = = 0 • つまり −

    T + 𝑘 − 𝑗 = 0 – 2クラスの時と同様の幾何学的性質が適用される – 各決定領域は凸領域 20
  7. 21

  8. 最小二乗法 • (結論)学習データ集合{ , }に対して � = T �† T

    :番目の行が Tである行列 �:番目の行が Tである行列 �†: �の擬似逆行列(→3.1.1) – が,いろいろ問題がある 23
  9. ベイズ! • 2クラスの場合を考える 1 x = x 1 1 x

    1 1 + x 2 (2) = 1 1+exp (−) = = ln x 1 1 x 2 (2) 39
  10. 多クラスの場合 • = x ∑ x () = exp ∑

    exp () = ln( x ) – 正規化指数関数 • ソフトマックス関数とも 41
  11. 最尤解 • 尤度関数は t, X , 1 , 2 ,

    = � x 1 , 1 − 𝒩 x 2 , 1− =1 ただし = 1 , ⋯ , T, = 1 46
  12. 最尤解 = 1 S1 + 2 S2 S1 = 1

    1 ∑ x − 1 x − 1 ∈1 S2 = 1 2 ∑ x − 2 x − 2 ∈2 • この結果は多クラスにも拡張可能 48
  13. 離散特徴 • 特徴が離散値 の場合を考える • 2値 ∈ 1,0 , 特徴数個の場合

    – 特徴量を抑えるためナイーブベイズを仮定 x = � 1 − 1− =1 49
  14. 離散特徴 • 正規化指数関数の引数は = �{ ln 𝑘 + 1 −

    ln 1 − 𝑘 } =1 + ln ( )  入力値 の線形関数となる 50
  15. 指数型分布族 • クラスの条件付き確率が指数型分布族のメ ンバーであると仮定 • x = ℎ x λ

    exp {λ Tu x } • u x = xとなるような分布については,正規 化指数関数の引数がxの線形関数となる 51
  16. 最尤法によるパラメータ決定 • データ集合 , , ∈ 0,1 , = ,

    = 1, ⋯ , に対する尤度関数 t w = � 1 − 1− =1 – t = 1 , ⋯ , T, = (1 | ) 57
  17. 最尤法によるパラメータ決定 • 負の対数をとって誤差関数とする w = − ln t w =

    − ∑ ln + 1 − ln 1 − =1 – 交差エントロピー誤差関数 58
  18. 反復重み付け最小二乗 • 二乗和誤差関数の場合 w = ∑ wT − = ΦTΦw

    − ΦTt =1 H = ∑ =1 = ΦΦ – Φは番目の行が Tで与えられる × 行列 62
  19. 反復重み付け最小二乗 • 代入して,整理すると w new = ΦΦ −1Φt – w

    old が消えた  反復回数1回で正確な解が求められる 63
  20. 反復重み付け最小二乗 • 交差エントロピー誤差関数の場合 • w new = ΦTRΦ −1 ΦTRz

    – Rは要素が = { 1 − }の対角行列 – z = Φw old − R−1(y − t) – 重み付き最小二乗問題に対する正規方程式集合 64
  21. 多クラスロジスティック回帰 • 尤度関数(1-of-K符号化法を使用) 1 , ⋯ , = ∏ ∏

    𝑛 𝑛 =1 =1 • 以下,2クラスの場合と同様に導出可能 66
  22. プロビット回帰 • 雑音しきい値モデル = � 1 if ≤ 0 otherwise

    • の値が確率密度()で与えら得る場合 = � 𝑑 −∞ 68
  23. 69