Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
わかりやすいパターン認識1章 / Pattern Recognition Manual Eas...
Search
masso
December 05, 2020
Science
0
180
わかりやすいパターン認識1章 / Pattern Recognition Manual Easy to understand SS 01
わかりやすいパターン認識のセルフ輪読会資料〜第一章
masso
December 05, 2020
Tweet
Share
More Decks by masso
See All by masso
Stacktrace for rs/zerolog users
masso
0
310
データ解釈学入門 第一部 / Data hermeneutics Part 1
masso
8
2.2k
時系列分析と状態空間モデリングの基礎 / Foundations of Time Series Analysis and State Space Models 0
masso
1
620
わかりやすいパターン認識2章 / Pattern Recognition Manual Easy to understand SS 02
masso
0
980
分析環境紹介LT / the introduction of as my analysis env is
masso
0
120
データ解析のための統計モデリング入門6章 / Handbook-of-statistical-modeling-for-data-analysis-section6
masso
0
540
DLGが目指すコミュニティの形 / DLG Community Objective
masso
0
2.6k
PowerAutomateによる社員健康状態集計システム / Employee health status tabulation system with Power Automate
masso
0
1.5k
Other Decks in Science
See All in Science
CV_3_Keypoints
hachama
0
200
研究って何だっけ / What is Research?
ks91
PRO
1
110
SpatialBiologyWestCoastUS2024
lcolladotor
0
150
ド文系だった私が、 KaggleのNCAAコンペでソロ金取れるまで
wakamatsu_takumu
2
980
データベース09: 実体関連モデル上の一貫性制約
trycycle
PRO
0
980
Machine Learning for Materials (Challenge)
aronwalsh
0
310
データベース02: データベースの概念
trycycle
PRO
2
870
[Paper Introduction] From Bytes to Ideas:Language Modeling with Autoregressive U-Nets
haruumiomoto
0
120
SciPyDataJapan 2025
schwalbe10
0
250
[第62回 CV勉強会@関東] Long-CLIP: Unlocking the Long-Text Capability of CLIP / kantoCV 62th ECCV 2024
lychee1223
1
970
高校生就活へのDA導入の提案
shunyanoda
0
2.8k
baseballrによるMLBデータの抽出と階層ベイズモデルによる打率の推定 / TokyoR118
dropout009
1
530
Featured
See All Featured
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
2.9k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
283
13k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Intergalactic Javascript Robots from Outer Space
tanoku
272
27k
KATA
mclloyd
31
14k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Build your cross-platform service in a week with App Engine
jlugia
231
18k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Why Our Code Smells
bkeepers
PRO
337
57k
Site-Speed That Sticks
csswizardry
10
750
Transcript
わかりやすいパターン認識 第⼀章 パターン認識とは︖
パターン認識の定義 観測されたパターンを予め定められた複数 の概念(class)のうちの⼀つに対応させる 処理
パターン認識の事例 • ⼿書きのアルファベットを26クラスに対応させる • ⾳声データを五⼗⾳や単語に対応させる(⾳声認識) • ⼼電図波形から⼼臓の異常・正常状態を判定 構造化データ、⾮構造化データ(画像・⾃然⾔語・⾳声)に関わらず様々な分 野で「パターン認識」はある。
パターン認識の⼀般的な処理の流れ 1. 前処理 1. ノイズ除去 2. 正規化 2. 特徴抽出 1.
本質的な特徴のみ抽出 3. 識別 1. 辞書と照合 識別 認識
特徴ベクトルと特徴空間 • d個の特徴︓d次元特徴ベクトルx • クラス総数c︓クラス名ωc • 特徴ベクトルのはる空間=特徴空間 • 特徴空間じょうで、特徴ベクトルは、 クラスごとにかたまっているはずで、
それらの塊=クラスタ
⼿書き数字認識の例 (5x5メッシュ2値画像) • 最もシンプルには…225パターン • 中には数字に関係ないものもある – リジェクト領域 • リジェクト領域は2種類
– 「どこにも属さない」と「識別困難」 • 辞書作成は必須。辞書作成⾃体が、識別 処理に他ならないからである
⼿書き数字認識の例 (5x5メッシュ2値画像) • 全パターンは⾮現実的、代表パターンだけを記憶(≒識別辞 書に記録)する⽅法がある。 • 代表パターン=プロトタイプ • 各特徴ベクトルが、どのプロトタイプに最も近いかで判定す ることが多い
(Nearest Neighbor rule︓NN法/最近傍決定則) • より⼀般化すると、k-NN法。最も近いk個のプロトタイプを 選び、k個のうち最も多くが属しているクラスを判定結果とす るやりかた。
特徴空間の分割〜プロトタイプを設定する • 全数記憶⽅式 – 現実のデータをサンプリングし、全体をよく表すパ ターンを(識別のための代表パターンとしての)プ ロトタイプとする⽅式 – 【注】サンプリング結果はすべてを表すものではな い
• プロトタイプ⽅式→k-meansにつながる – 各クラスに対して、⼀つのパターンを選ぶという発 想 – クラスの重⼼位置を選ぶというのは、⾃然=k- means – クラスごとの代表パターン間の垂直⼆等分線(多次 元空間であれば、超平⾯)を決定境界という
終わり