Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
第1章 画像認識の概要 2017年6月29日
Slide 2
Slide 2 text
参考書『画像認識』 • 『画像認識』 • 講談社、機械学習プロフェッショナルシリーズ • 著:原田達也=東京大学大学院情報理工学系研 究科教授 • 3000円(税別) 2
Slide 3
Slide 3 text
第1章 画像認識の概要 画像認識とは/画像認識の分類/クラス認識の手順/深い構造と浅い構造/物体検出/インスタンス 認識と画像検索/画像認識の認識性能を向上させるには?/数学表記について 第2章 局所特徴 局所特徴とは/検出器/空間フィルタリング/基本的な検出器/ 回転やアフィン変換に頑健な検出器/記述 子/検出器と記述子の組み合わせ 第3章 統計的特徴抽出 統計的特徴抽出とは/主成分分析/白色化/フィッシャー線形判別分析/正準相関分析/偏最小2乗法 第4章 コーディングとプーリング コーディングとプーリングの概要/確率分布を利用したコーディング/局所特徴のコード ワードによる再構築/多様体学習/特徴関数の線形内積によるカーネル関数近似/空間情報の活用 第5章 分類 分類とは/ベイズ決定則/識別関数/一般的な教師付き学習の枠組み/最適化/線形識別関数/確率的識別関数 /局所学習/集団学習/分類結果の評価 第6章 畳み込みニューラルネットワーク 画像認識における深層学習/フィードフォワードニューラルネットワーク/畳み込 みニューラルネットワーク/実装上の工夫/パラメータの最適化/畳み込みニューラルネットワークの例 第7章 物体検出 物体検出とは/物体領域候補の提案/線形分類器を用いた物体検出/集団学習を用いた物体検出/非最大値 の抑制/畳み込みニューラルネットワークを利用した物体検出/物体検出の評価 第8章 インスタンス認識と画像検索 インスタンス認識/画像検索/画像検索の評価 3
Slide 4
Slide 4 text
内容 • 画像認識とは • クラス認識 • インスタンス認識 • 画像認識の認識性能を向上させるための原則 • まとめ 4
Slide 5
Slide 5 text
画像認識とは
Slide 6
Slide 6 text
画像認識 (image recognition) • 画像に写る内容を理解すること 6 画像認識システム Input Output 安田講堂
Slide 7
Slide 7 text
7 画像認識の難しさ • 欲しい出力は「東大」? 安田講堂 理学部1号館 人間 入り口 雲 • 「人間」「雲」も認識してほしい? • 理学部1号館の認識には前提知識が必要
Slide 8
Slide 8 text
8 画像認識の歴史 1970 1980 1990 2000 2010 2020 1966年 人工知能の父 MinskyがMITの学部生に「カメラを計算機に接続し、撮影した物を記述させよ」 という課題を与えた 知識ベース処理 幾何学的処理 1999年 局所特徴「SIFT」 2003年 Bag of Visual Words 特徴を捉えるアルゴリズムの発達 深層学習のブーム到来
Slide 9
Slide 9 text
物体認識 9 画像認識の分類 画像認識 物体認識 シーン認識 インスタンス認識 クラス認識 インスタンス認識 前田敦子 渡辺麻友 クラス認識 AKB48 シーン認識 ライブで踊るAKB48の前田敦子、 渡辺麻友ら
Slide 10
Slide 10 text
クラス認識
Slide 11
Slide 11 text
11 手順 Input Output 「コンテナ船」 分類 = () 画像特徴抽出 サンプリング・記述 1 , 2 , … , コーディング 1 , 2 , … , 統計的特徴抽出 = (Ψ( )) プーリング = ( , … , )
Slide 12
Slide 12 text
12 サンプリング • 入力画像から代表的な点(特徴点)を取り出すこと 疎なサンプリング 密なサンプリング
Slide 13
Slide 13 text
13 局所記述 • 各特徴点を何らかの手法で「特徴量」として記述すること Ex. 記述子 • 画素値 • 明るさのヒストグラム 1 , 2 , … ,
Slide 14
Slide 14 text
14 統計的特徴抽出 • 局所特徴から外乱などによるノイズを除去すること • 「局所特徴=理想+確率的な散らばり」と仮定 • 統計処理で理想に近づけようとする ′ = Ψ( ) Ex. 主成分分析
Slide 15
Slide 15 text
15 コーディング • 後の分類に向けて、局所特徴 ′を認識に有効な、ある決まった 次元数の特徴ベクトルに変換する操作 • 基本的に cの次元は′よりも大きくなる = ′ = (Ψ( )) Ex. 確率分布の推定
Slide 16
Slide 16 text
16 プーリング • 特徴ベクトル群を1本のベクトルにまとめること = ( , … , )
Slide 17
Slide 17 text
17 分類 • プーリングしたベクトルを各クラスに割り振ること • さまざまな分類器が提案されている ※ シーン認識も、クラス認識とほぼ同様の過程 = ()
Slide 18
Slide 18 text
18 画像認識におけるdeep learning • deep learning 入 力 画 像 サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 ク ラ ス サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 ……
Slide 19
Slide 19 text
インスタンス認識
Slide 20
Slide 20 text
20 手順 画像の登録 クエリ画像の認識 1 , 2 , … , データベース 1 , 2 , … , 画像特徴の計算 = Φ(1 , 2 , … , ) インデックス化 = ℎ( ) 画像特徴の計算 = Φ(1 , 2 , … , ) インデックス化 = ℎ( ) 1 , 2 , … , 登録 局所特徴マッチング Output
Slide 21
Slide 21 text
画像認識の認識性能を向上 させるための原則
Slide 22
Slide 22 text
22 データ処理定理 • 「データ処理はデータの持つ情報を決して増やさない」 • 同時確率 , , = • ; ≥ ; • 相互情報量 ; = σ∈ σ∈ , log , () • Proof 世界の状況 収集したデータ 処理したデータ
Slide 23
Slide 23 text
23 データ処理定理が示唆すること • モデルの設計や学習方法も大切だが、性能限界は訓練データで 決まる • 画像認識では、より入力に近い処理の質を改善するべき • 分類器のチューニングも大切だが、より前の段階で工夫をするべき
Slide 24
Slide 24 text
まとめ
Slide 25
Slide 25 text
25 まとめ • 画像認識の概要を説明した • データ処理定理を紹介し、 画像認識で大切な心構えを説明した 画像認識 物体認識 シーン認識 インスタンス認識 クラス認識
Slide 26
Slide 26 text
26 参考書の構成 画像認識 物体認識 シーン認識 インスタンス認識 クラス認識 入 力 画 像 サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 ク ラ ス 2 3 4 5 6 畳み込みNN 応用 7 物体検出 8 インスタンス認識と検索 9 さらなる話題