Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
わかりやすいパターン認識1章 / Pattern Recognition Manual Eas...
Search
masso
December 05, 2020
Science
0
190
わかりやすいパターン認識1章 / Pattern Recognition Manual Easy to understand SS 01
わかりやすいパターン認識のセルフ輪読会資料〜第一章
masso
December 05, 2020
Tweet
Share
More Decks by masso
See All by masso
Stacktrace for rs/zerolog users
masso
0
350
データ解釈学入門 第一部 / Data hermeneutics Part 1
masso
8
2.2k
時系列分析と状態空間モデリングの基礎 / Foundations of Time Series Analysis and State Space Models 0
masso
1
650
わかりやすいパターン認識2章 / Pattern Recognition Manual Easy to understand SS 02
masso
0
1k
分析環境紹介LT / the introduction of as my analysis env is
masso
0
130
データ解析のための統計モデリング入門6章 / Handbook-of-statistical-modeling-for-data-analysis-section6
masso
0
550
DLGが目指すコミュニティの形 / DLG Community Objective
masso
0
2.7k
PowerAutomateによる社員健康状態集計システム / Employee health status tabulation system with Power Automate
masso
0
1.5k
Other Decks in Science
See All in Science
Cross-Media Technologies, Information Science and Human-Information Interaction
signer
PRO
3
31k
会社でMLモデルを作るとは @電気通信大学 データアントレプレナーフェロープログラム
yuto16
1
360
AI(人工知能)の過去・現在・未来 —AIは人間を超えるのか—
tagtag
1
200
Vibecoding for Product Managers
ibknadedeji
0
100
凸最適化からDC最適化まで
santana_hammer
1
320
Lean4による汎化誤差評価の形式化
milano0017
1
370
システム数理と応用分野の未来を切り拓くロードマップ・エンターテインメント(スポーツ)への応用 / Applied mathematics for sports entertainment
konakalab
1
430
機械学習 - K近傍法 & 機械学習のお作法
trycycle
PRO
0
1.2k
Masseyのレーティングを用いたフォーミュラレースドライバーの実績評価手法の開発 / Development of a Performance Evaluation Method for Formula Race Drivers Using Massey Ratings
konakalab
0
220
機械学習 - 授業概要
trycycle
PRO
0
270
サイコロで理解する原子核崩壊と拡散現象 〜単純化されたモデルで本質を理解する〜
syotasasaki593876
0
110
なぜ21は素因数分解されないのか? - Shorのアルゴリズムの現在と壁
daimurat
0
150
Featured
See All Featured
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.1k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
How to Ace a Technical Interview
jacobian
280
24k
The Invisible Side of Design
smashingmag
302
51k
Site-Speed That Sticks
csswizardry
13
960
Building Flexible Design Systems
yeseniaperezcruz
329
39k
Faster Mobile Websites
deanohume
310
31k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
A designer walks into a library…
pauljervisheath
210
24k
Rebuilding a faster, lazier Slack
samanthasiow
84
9.3k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Transcript
わかりやすいパターン認識 第⼀章 パターン認識とは︖
パターン認識の定義 観測されたパターンを予め定められた複数 の概念(class)のうちの⼀つに対応させる 処理
パターン認識の事例 • ⼿書きのアルファベットを26クラスに対応させる • ⾳声データを五⼗⾳や単語に対応させる(⾳声認識) • ⼼電図波形から⼼臓の異常・正常状態を判定 構造化データ、⾮構造化データ(画像・⾃然⾔語・⾳声)に関わらず様々な分 野で「パターン認識」はある。
パターン認識の⼀般的な処理の流れ 1. 前処理 1. ノイズ除去 2. 正規化 2. 特徴抽出 1.
本質的な特徴のみ抽出 3. 識別 1. 辞書と照合 識別 認識
特徴ベクトルと特徴空間 • d個の特徴︓d次元特徴ベクトルx • クラス総数c︓クラス名ωc • 特徴ベクトルのはる空間=特徴空間 • 特徴空間じょうで、特徴ベクトルは、 クラスごとにかたまっているはずで、
それらの塊=クラスタ
⼿書き数字認識の例 (5x5メッシュ2値画像) • 最もシンプルには…225パターン • 中には数字に関係ないものもある – リジェクト領域 • リジェクト領域は2種類
– 「どこにも属さない」と「識別困難」 • 辞書作成は必須。辞書作成⾃体が、識別 処理に他ならないからである
⼿書き数字認識の例 (5x5メッシュ2値画像) • 全パターンは⾮現実的、代表パターンだけを記憶(≒識別辞 書に記録)する⽅法がある。 • 代表パターン=プロトタイプ • 各特徴ベクトルが、どのプロトタイプに最も近いかで判定す ることが多い
(Nearest Neighbor rule︓NN法/最近傍決定則) • より⼀般化すると、k-NN法。最も近いk個のプロトタイプを 選び、k個のうち最も多くが属しているクラスを判定結果とす るやりかた。
特徴空間の分割〜プロトタイプを設定する • 全数記憶⽅式 – 現実のデータをサンプリングし、全体をよく表すパ ターンを(識別のための代表パターンとしての)プ ロトタイプとする⽅式 – 【注】サンプリング結果はすべてを表すものではな い
• プロトタイプ⽅式→k-meansにつながる – 各クラスに対して、⼀つのパターンを選ぶという発 想 – クラスの重⼼位置を選ぶというのは、⾃然=k- means – クラスごとの代表パターン間の垂直⼆等分線(多次 元空間であれば、超平⾯)を決定境界という
終わり