Upgrade to Pro — share decks privately, control downloads, hide ads and more …

わかりやすいパターン認識1章 / Pattern Recognition Manual Easy to understand SS 01

02a84f9b8af46c6c3ef7c4b1f9bbb56f?s=47 masso
December 05, 2020

わかりやすいパターン認識1章 / Pattern Recognition Manual Easy to understand SS 01

わかりやすいパターン認識のセルフ輪読会資料〜第一章

02a84f9b8af46c6c3ef7c4b1f9bbb56f?s=128

masso

December 05, 2020
Tweet

Transcript

  1. わかりやすいパターン認識 第⼀章 パターン認識とは︖

  2. パターン認識の定義 観測されたパターンを予め定められた複数 の概念(class)のうちの⼀つに対応させる 処理

  3. パターン認識の事例 • ⼿書きのアルファベットを26クラスに対応させる • ⾳声データを五⼗⾳や単語に対応させる(⾳声認識) • ⼼電図波形から⼼臓の異常・正常状態を判定 構造化データ、⾮構造化データ(画像・⾃然⾔語・⾳声)に関わらず様々な分 野で「パターン認識」はある。

  4. パターン認識の⼀般的な処理の流れ 1. 前処理 1. ノイズ除去 2. 正規化 2. 特徴抽出 1.

    本質的な特徴のみ抽出 3. 識別 1. 辞書と照合 識別 認識
  5. 特徴ベクトルと特徴空間 • d個の特徴︓d次元特徴ベクトルx • クラス総数c︓クラス名ωc • 特徴ベクトルのはる空間=特徴空間 • 特徴空間じょうで、特徴ベクトルは、 クラスごとにかたまっているはずで、

    それらの塊=クラスタ
  6. ⼿書き数字認識の例 (5x5メッシュ2値画像) • 最もシンプルには…225パターン • 中には数字に関係ないものもある – リジェクト領域 • リジェクト領域は2種類

    – 「どこにも属さない」と「識別困難」 • 辞書作成は必須。辞書作成⾃体が、識別 処理に他ならないからである
  7. ⼿書き数字認識の例 (5x5メッシュ2値画像) • 全パターンは⾮現実的、代表パターンだけを記憶(≒識別辞 書に記録)する⽅法がある。 • 代表パターン=プロトタイプ • 各特徴ベクトルが、どのプロトタイプに最も近いかで判定す ることが多い

    (Nearest Neighbor rule︓NN法/最近傍決定則) • より⼀般化すると、k-NN法。最も近いk個のプロトタイプを 選び、k個のうち最も多くが属しているクラスを判定結果とす るやりかた。
  8. 特徴空間の分割〜プロトタイプを設定する • 全数記憶⽅式 – 現実のデータをサンプリングし、全体をよく表すパ ターンを(識別のための代表パターンとしての)プ ロトタイプとする⽅式 – 【注】サンプリング結果はすべてを表すものではな い

    • プロトタイプ⽅式→k-meansにつながる – 各クラスに対して、⼀つのパターンを選ぶという発 想 – クラスの重⼼位置を選ぶというのは、⾃然=k- means – クラスごとの代表パターン間の垂直⼆等分線(多次 元空間であれば、超平⾯)を決定境界という
  9. 終わり