目に見えるパーセプトロン

2015.08.19 @tkengo 目に見えるパーセプトロン

分類対象 I

素性関数 I ( I ) = ( x1, x2, ·
· · , xn) = x 分類対象

素性関数重み I w = (w1, w2, · · ·
, wn) ( I ) = ( x1, x2, · · · , xn) = x 分類対象

素性関数重み識別関数 I w = (w1, w2, · ·
· , wn) ( I ) = ( x1, x2, · · · , xn) = x f ( x ) = w · x = n X i=1 wixi 分類対象

f ( x ) = w · x = n
X i=1 wixi ( I ) = ( x1, x2, · · · , xn) = x 素性関数重み識別関数 I w = (w1, w2, · · · , wn) 分類対象

仕切り直し

機械学習

ある程度の数のサンプルデータ集合を入力して解析を行い、そのデータから有用な規則、ルール、知識表現、判断基準などを抽出する機械学習とは by Wikipedia

有用な規則、ルール知識表現、判断基準とは？

例：メールのスパム判定

例：メールのスパム判定スパム判定するための明確な判断基準(ルール)があるわけではない

例：メールのスパム判定・「無料」「金儲け」「請求」等の単語が含まれているとスパムっぽい？・それぞれの単語って実際どの程度スパムっぽいのだろうか？・「無料」より「金儲け」という単語が入っていた方がスパムっぽい？・一般的なビジネスメールにも「請求」って含まれることもあるよね？・メールの文脈、つまり単語の前後にある単語も見る必要がある？・すると、単語の繋がり方によってスパム率も変わってくる？・「無料でお試し」より「無料で金儲け」の方がスパムっぽい？スパム判定するための明確な判断基準(ルール)があるわけではない

例：メールのスパム判定スパム判定するための明確な判断基準(ルール)があるわけではない・「無料」「金儲け」「請求」等の単語が含まれているとスパムっぽい？・それぞれの単語って実際どの程度スパムっぽいのだろうか？・「無料」より「金儲け」という単語が入っていた方がスパムっぽい？・一般的なビジネスメールにも「請求」って含まれることもあるよね？・メールの文脈、つまり単語の前後にある単語も見る必要がある？・すると、単語の繋がり方によってスパム率も変わってくる？・「無料でお試し」より「無料で金儲け」の方がスパムっぽい？パラメータが多すぎ、判断基準(ルール)を定義できない

機械学習とは by Wikipedia ある程度の数のサンプルデータ集合を入力して解析を行い、そのデータから有用な規則、ルール、知識表現、判断基準などを抽出する

ある程度の数のサンプルデータ集合を入力して解析を行い、そのデータから有用な規則、ルール、知識表現、判断基準などを抽出する ※サンプルデータの用意は多くの場合、人間の仕事　このメールはスパムなのでラベル”1” 　このメールはスパムではないのでラベル”-1” 　とか... 実際のメール本文と正解ラベル「学習用データ」と
呼んだりする

ある程度の数のサンプルデータ集合を入力して解析を行い、そのデータから有用な規則、ルール、知識表現、判断基準などを抽出するこのことを「学習」と呼ぶ ※サンプルデータの用意は多くの場合、人間の仕事　このメールはスパムなのでラベル”1” 　このメールはスパムではないのでラベル”-1” 　とか... 実際のメール本文
と正解ラベル「学習用データ」と呼んだりする

ある程度の数のサンプルデータ集合を入力して解析を行い、そのデータから有用な規則、ルール、知識表現、判断基準などを抽出するこのことを「学習」と呼ぶメールが本当にスパムかどうかを判断するためのルール ※どの単語が、どれくらいの割合で　どの単語の後にどの単語がきて
　とか... 実際のメール本文と正解ラベル「学習用データ」と呼んだりする ※サンプルデータの用意は多くの場合、人間の仕事　このメールはスパムなのでラベル”1” 　このメールはスパムではないのでラベル”-1” 　とか...

機械学習の種類

機械学習識別関数パーセプトロン SVM CRF 識別モデルナイーブベイズガウス混合モデル生成モデル機械学習と一口に言ってもいくつか分類があって、それぞれ学習の
仕方や理論が違う機械学習の種類

機械学習と一口に言ってもいくつか分類があって、それぞれ学習の仕方や理論が違うこの資料では機械学習の中で最も単純な識別関数について、さらにその中でも最も単純なパーセプトロンについて、その仕組みと学習の仕方を見ていきます。機械学習の種類

パーセプトロン

パーセプトロン •フランク・ローゼンブラットさんという人が提唱。

パーセプトロン •フランク・ローゼンブラットさんという人が提唱。視覚と脳の機能をモデル化してパターン認識したる

パーセプトロン •フランク・ローゼンブラットさんという人が提唱。視覚と脳の機能をモデル化してパターン認識したる •単層パーセプトロンと多層パーセプトロンがある。 •今回は最も単純な単層パーセプトロンのお話。 •主に二値分類に使われる。例： • メールがスパムか、スパムじゃないか •
画像にリンゴが含まれるか、含まれないか

分類の仕組み

分類の仕組み •分類対象データからなんとかして素性をベクトルとして抽出。 •素性の抽出の仕方はいろいろ。自分で考えなきゃいけない。 • 分類対象がメール(テキスト)であれば各単語の出現頻度とか。 • 分類対象が画像であればピクセル列のRGB値とか。色の濃淡とか。 •素性を抽出するための関数を素性関数と呼ぶ。

( I ) = ( x1, x2, · · ·
, xn) = x 最初にでてきたコレ！分類の仕組み •分類対象データからなんとかして素性をベクトルとして抽出。 •素性の抽出の仕方はいろいろ。自分で考えなきゃいけない。 • 分類対象がメール(テキスト)であれば各単語の出現頻度とか。 • 分類対象が画像であればピクセル列のRGB値とか。色の濃淡とか。 •素性を抽出するための関数を素性関数と呼ぶ。

public ArrayList<Integer> extractFeature(Object data) { ArrayList<Integer> feature = new ArrayList<>();
// dataから素性を抽出する処理 return feature; } 数式に馴染みがないならコードを思い浮かべてもおｋ分類の仕組み •分類対象データからなんとかして素性をベクトルとして抽出。 •素性の抽出の仕方はいろいろ。自分で考えなきゃいけない。 • 分類対象がメール(テキスト)であれば各単語の出現頻度とか。 • 分類対象が画像であればピクセル列のRGB値とか。色の濃淡とか。 •素性を抽出するための関数を素性関数と呼ぶ。

•たとえばこんな素性関数があったら。 // まったく実用的ではない超適当な素性関数 public ArrayList<Integer> extractFeature(Object data) { ArrayList<Integer> feature
= new ArrayList<>(); feature.add(data.hashCode() * 1 % 10 - 5); feature.add(data.hashCode() * 2 % 10 - 5); return feature; } 分類の仕組み

•たとえばこんな素性関数があったら。 •学習用データを与えると二次元のベクトルが吐かれる。 extractFeature(data1) → ( 1, 2) = extractFeature(data2) →
( 3, 2) = extractFeature(data3) → (-2, -4) = extractFeature(data4) → (-2, -2) = ... x1 x2 x3 x4 分類の仕組み // まったく実用的ではない超適当な素性関数 public ArrayList<Integer> extractFeature(Object data) { ArrayList<Integer> feature = new ArrayList<>(); feature.add(data.hashCode() * 1 % 10 - 5); feature.add(data.hashCode() * 2 % 10 - 5); return feature; }

•たくさん得られた二次元ベクトルを平面にプロットしてみる。 x y 分類の仕組みこの点ひとつひとつが学習用データから抽出した素性ベクトル

•たくさん得られた二次元ベクトルを平面にプロットしてみる。 •どうもこんな風に線が引けそう。 x y 分類の仕組み

•たくさん得られた二次元ベクトルを平面にプロットしてみる。 •どうもこんな風に線が引けそう。 x y 分類の仕組みこっち側はクラスA こっち側はクラスB

•たくさん得られた二次元ベクトルを平面にプロットしてみる。 •どうもこんな風に線が引けそう。 x y 分類の仕組みこっち側はクラスA こっち側はクラスB 未知のデータXの素性を抽出したらこの辺だった。クラスはAとBどっち？

•たくさん得られた二次元ベクトルを平面にプロットしてみる。 •どうもこんな風に線が引けそう。 x y 分類の仕組みこっち側はクラスA こっち側はクラスB 線のこっち側なのでクラスAに属するとわかる

•たくさん得られた二次元ベクトルを平面にプロットしてみる。 •どうもこんな風に線が引けそう。 x y 分類の仕組みこっち側はクラスA こっち側はクラスB 今度は未知のデータYの素性を抽出するとこの辺だった。
クラスはA？B？

•たくさん得られた二次元ベクトルを平面にプロットしてみる。 •どうもこんな風に線が引けそう。 x y 分類の仕組みこっち側はクラスA こっち側はクラスB 線のこっち側なのでクラスBと分かる。

•どうやって新しい点が線の向こう側かこっち側か判断するか？ x y 分類の仕組みこっち側はクラスA こっち側はクラスB

•どうやって新しい点が線の向こう側かこっち側か判断するか？ •ベクトルの内積を使う。 x y 分類の仕組みこっち側はクラスA こっち側はクラスB

•実は最初に引いた赤い線は重みベクトルを法線とする直線。 x y 分類の仕組みこっち側はクラスA こっち側はクラスB 重みベクトルw

•実は最初に引いた赤い線は重みベクトルを法線とする直線。 •重みベクトルと素性ベクトルの内積 a を取って以下の通り分類。 • クラスA if a >= 0
• クラスB if a < 0 x y 分類の仕組みこっち側はクラスA こっち側はクラスB 重みベクトルw

•法線ベクトルとは線に垂直なベクトルのこと。 x y ※補足　法線と内積 y = 0.5x の法線

•法線ベクトルとは線に垂直なベクトルのこと。 x y ※補足　法線と内積 y = 0.5x の法線 y =
x の法線

•法線ベクトルとは線に垂直なベクトルのこと。 x y ※補足　法線と内積 y = 0.5x の法線 y =
x の法線 y = 2x の法線

•簡単に言うと内積とはベクトルがどれだけ似ているか？の指標。 •似ているほど値が大きい。 •似ていないほど値が小さい。 x y ※補足　法線と内積ベクトルb ベクトルa a ·
b = 1 p 2 = 0.707106 ベクトルが似てるので正の数。

x y ※補足　法線と内積ベクトルb ベクトルa a · b = 0
ベクトルが似てるか似てないかわからない(直角)。こんな時の内積は0。 •簡単に言うと内積とはベクトルがどれだけ似ているか？の指標。 •似ているほど値が大きい。 •似ていないほど値が小さい。

x y ※補足　法線と内積ベクトルb ベクトルa まあまあ離れてきた。向きも違うし負の数。 a · b
= 1 p 2 = 0.707106 •簡単に言うと内積とはベクトルがどれだけ似ているか？の指標。 •似ているほど値が大きい。 •似ていないほど値が小さい。

x y ※補足　法線と内積ベクトルb ベクトルa 反対向いちゃった。全然似てないのでさっきより小さい負の数。 a ·
b = 1 •簡単に言うと内積とはベクトルがどれだけ似ているか？の指標。 •似ているほど値が大きい。 •似ていないほど値が小さい。

• クラスB if a < 0 x y 分類の仕組み重みベクトルw 素性ベクトルx w · x 0 すなわちxはクラスA

• クラスB if a < 0 x y 分類の仕組み重みベクトルw 素性ベクトルy すなわちyはクラスB w · y  0

分類の仕組み •このようにデータを分類する役割の関数を識別関数と言う。 •パーセプトロンにおいては識別関数 f(x) はベクトルの内積。

•このようにデータを分類する役割の関数を識別関数と言う。 •パーセプトロンにおいては識別関数 f(x) はベクトルの内積。分類の仕組み最初にでてきたコレ！ f ( x )
= w · x = n X i=1 wixi

•このようにデータを分類する役割の関数を識別関数と言う。 •パーセプトロンにおいては識別関数 f(x) はベクトルの内積。分類の仕組み数式に馴染みがないならコードを思い浮かべてもおｋ public float dot(ArrayList<Float> v1,
ArrayList<Float> v2) { float result = 0f; for (int i = 0; i < v1.size(); i++) { result += v1.get(i) * v2.get(i); } return result; }

学習の仕組み

•パーセプトロンにおける学習とは、最初に引いた赤い線を求めること。 x y 学習の仕組みコレ

•パーセプトロンにおける学習とは、最初に引いた赤い線を求めること。 •学習には学習用データとそれに対応する正解ラベルの組の配列を用意する。たとえば • スパムメールを集めてくる。それぞれの正解ラベルは”1”(スパムである)。 • ビジネスメールを集めてくる。それぞれの正解ラベルは”-1”(スパムではない)。 •学習用データはパーセプトロンの分類精度に直接関わってくるので、質も量も大事。
学習の仕組み

•図解。 x y 学習の仕組み ※簡単のためにここでは識別関数 f(x) は以下の値を返すものとする。　・内積が正であれば1 　・内積が負であれば-1

•図解。 x y 学習の仕組み最初は重みベクトルはまったくわからないのでとりあえずランダムに決めておく w ※簡単のためにここでは識別関数 f(x) は以下の値を返すものとする。
　・内積が正であれば1 　・内積が負であれば-1

x y 学習の仕組み x 1つ目の学習データから抽出した素性がこの辺だったとする。この素性の正解ラベルは”1”。 w •図解。 ※簡単のためにここでは識別関数
f(x) は以下の値を返すものとする。　・内積が正であれば1 　・内積が負であれば-1

x y 学習の仕組み x この素性を識別関数に通すと、wとx の内積は正なので”1”が返ってくる。 w w · x
0 •図解。 ※簡単のためにここでは識別関数 f(x) は以下の値を返すものとする。　・内積が正であれば1 　・内積が負であれば-1

x y 学習の仕組み x よって正解ラベルと識別関数が返したラベルが一致しているので重みの更新はしない。 w •図解。 ※簡単のためにここでは識別関数
f(x) は以下の値を返すものとする。　・内積が正であれば1 　・内積が負であれば-1

x y 学習の仕組み y 次に2つ目の学習データから素性を抽出するとこの辺だった。この素性の正解ラベルも”1”。 •図解。 ※簡単のためにここでは識別関数 f(x)
は以下の値を返すものとする。　・内積が正であれば1 　・内積が負であれば-1 w

x y 学習の仕組み y この素性を識別関数に通すとwとy の内積は負なので”-1”が返ってくる。 •図解。 ※簡単のためにここでは識別関数 f(x)
は以下の値を返すものとする。　・内積が正であれば1 　・内積が負であれば-1 w w · y  0

※ x y 学習の仕組み y 正解ラベルと識別関数のラベルが異なるので以下の式で重みを更新する！ •図解。 ※簡単のためにここでは識別関数
f(x) は以下の値を返すものとする。　・内積が正であれば1 　・内積が負であれば-1 w + y w = w + lyy ly はデータyの正解ラベル。この場合は1。 w

x y 学習の仕組みすると線がこんな風に回転。 •図解。 ※簡単のためにここでは識別関数 f(x) は以下の値を返すものとする。　・内積が正であれば1 　・内積が負であれば-1
w

x y 学習の仕組みこれでxもyも正しく識別できた状態の線になった。 •図解。 ※簡単のためにここでは識別関数 f(x) は以下の値を返すものとする。　・内積が正であれば1
　・内積が負であれば-1 w y x

x y 学習の仕組み •図解。 ※簡単のためにここでは識別関数 f(x) は以下の値を返すものとする。　・内積が正であれば1 　・内積が負であれば-1 w
次に3つ目の学習データから素性を抽出するとこの辺だった。この素性の正解ラベルは”-1”。 z

z この素性を識別関数に通すとwとz の内積は正なので”1”が返ってくる。 w · z 0

- z z ※ 正解ラベルと識別関数のラベルが異なるので再度以下の式で重みを更新する！はデータzの正解ラベル。この場合は-1。 w = w + lzz lz w

すると線がこんな風に回転。

これを学習データが無くなるまで繰り返していくと...

最終的には良い感じの線になってる。この線(すなわち重み)を使って未知のデータXやYを分類していく。

まとめ

まとめ 1. 分類対象データから素性を抽出する。 2. 抽出した素性を識別関数に渡す。 3. 識別関数では重みを利用して分類する。 4. 重みは学習用データから繰り返し学習する。

まとめ x y ちなみにこんな風に1本の直線を使ってデータを分けれる問題を線形分離可能と言う。

まとめ x y こんな風に直線で分割できなければ線形分離可能ではなくて線形分離不可能と言う。

まとめ x y 単層パーセプトロンでは線形分離可能な問題しか解けません！

まとめ •この資料ではずっと二次元で説明を進めてきたけど、多次元にも素直に拡張できる。 •二次元の場合は線、三次元の場合は平面で分割される。 •四次元、五次元、六次元、などは超平面で分割される。 •最後に三次元でのパーセプトロンの学習の過程を見て終わります。グリグリしてみましょう。 http://tkengo.github.io/perceptron_visualization/ (スペースキーで学習を進める)

目に見えるパーセプトロンおわり

目に見えるパーセプトロン

目に見えるパーセプトロン

More Decks by けんご

Other Decks in Technology

Featured

Transcript