svm as a constrainted optimization

サポートベクターマシン (SVM) 4 import numpy as np from sklearn.svm import
SVC X = np.array([[-1, -1], [-1.5, 0], [-2, -1], [1, 1], [2, 1], [1, 2]]) y = np.array([-1, -1, -1, 1, 1, 1]) clf = SVC(kernel='linear') # わかりやすさのため線形 clf.fit(X, y) print('重み', clf.coef_) print('切片', clf.intercept_) • ラベル +1 • ラベル -1 • サポート • 2クラス分類器であって「2クラスを仕切る仕切りを入れて仕切りに最も近いデータとのマージンを最大にしよう」といったもの。 ‐ 図では入力空間に直接仕切りを入れているが (線形)、往々にして特徴空間にとばしてからやる。 ‐ 図ではマージン部分へのはみ出しがないがはみ出してもよい。はみ出しの総和をペナルティする。 • 仕切りが非線形なとき、データが乱雑なとき、学習結果の解釈が不要なとき等にロジスティック回帰より適すると思われる。サポート：仕切りに最も近いデータ。

SVM の最適化問題のイメージ (1/2) 5 • 入力空間にせよ特徴空間にせよ仕切りを入れる空間で仕切りを入れる → ラベル +1
のデータたちの箇所では正、ラベル -1 のデータたちの箇所では負になる線形関数の坂道を入れることにしてもよい (この関数の値が 0 になる箇所が仕切りである)。 • それだけだと線形関数の定数倍の自由度があるのでラベル ±1 のサポートの箇所での高さを ±1 となるようにする。そうすると坂道の傾きだけで仕切り～サポートの距離も決まる（下図）。 • ラベル +1 • ラベル -1 • サポート 1 1 1 𝑤 坂道の傾き 𝑤 • ということは坂道の傾きがなだらかであればあるほどよい……？坂道 𝑓 𝑥 = 𝑤T𝑥 + 𝑏 1 𝑤

SVM の最適化問題のイメージ (2/2) 6 • 坂道の傾きがなだらかであればあるほどよいが、「ラベル +1 のデータは全員高さが 1以上である」「ラベル
-1 のデータは全員高さが-1以下である」という条件を守らなければならない（でないとサポートの高さが ±1 であることに矛盾）。 • ラベル +1 • ラベル -1 • サポート 1 1 1 𝑤 坂道の傾き 𝑤 坂道 𝑓 𝑥 = 𝑤T𝑥 + 𝑏 1 𝑤 ＿人人人人人人人人人人人人人人＿＞不等式制約付き最適化問題＜￣Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y￣

svm as a constrainted optimization

svm as a constrainted optimization

CookieBox26

More Decks by CookieBox26

Featured

Transcript

サポートベクターマシン (SVM) 4 import numpy as np from sklearn.svm import

SVM の最適化問題のイメージ (1/2) 5 • 入力空間にせよ特徴空間にせよ仕切りを入れる空間で仕切りを入れる → ラベル +1

SVM の最適化問題のイメージ (2/2) 6 • 坂道の傾きがなだらかであればあるほどよいが、「ラベル +1 のデータは全員高さが 1以上である」「ラベル

svm as a constrainted optimization

svm as a constrainted optimization

CookieBox26

More Decks by CookieBox26

Featured

Transcript

サポートベクターマシン (SVM) 4 import numpy as np from sklearn.svm import

SVM の最適化問題のイメージ (1/2) 5 • 入力空間にせよ特徴空間にせよ仕切りを入 れる空間で仕切りを入れる → ラベル +1

SVM の最適化問題のイメージ (2/2) 6 • 坂道の傾きがなだらかであればあるほどよ いが、「ラベル +1 のデータは全員高さが 1以上である」「ラベル

SVM の最適化問題のイメージ (1/2) 5 • 入力空間にせよ特徴空間にせよ仕切りを入れる空間で仕切りを入れる → ラベル +1

SVM の最適化問題のイメージ (2/2) 6 • 坂道の傾きがなだらかであればあるほどよいが、「ラベル +1 のデータは全員高さが 1以上である」「ラベル