『画像認識』第1章「画像認識の概要」輪読会資料 / Image Recognition Chapter 1

第1章画像認識の概要 2017年6月29日

参考書『画像認識』 • 『画像認識』 • 講談社、機械学習プロフェッショナルシリーズ • 著：原田達也＝東京大学大学院情報理工学系研究科教授 • 3000円（税別）
2

第1章画像認識の概要画像認識とは／画像認識の分類／クラス認識の手順／深い構造と浅い構造／物体検出／インスタンス認識と画像検索／画像認識の認識性能を向上させるには？／数学表記について第2章局所特徴局所特徴とは／検出器／空間フィルタリング／基本的な検出器／回転やアフィン変換に頑健な検出器／記述子／検出器と記述子の組み合わせ第3章
統計的特徴抽出統計的特徴抽出とは／主成分分析／白色化／フィッシャー線形判別分析／正準相関分析／偏最小2乗法第4章コーディングとプーリングコーディングとプーリングの概要／確率分布を利用したコーディング／局所特徴のコードワードによる再構築／多様体学習／特徴関数の線形内積によるカーネル関数近似／空間情報の活用第5章分類分類とは／ベイズ決定則／識別関数／一般的な教師付き学習の枠組み／最適化／線形識別関数／確率的識別関数／局所学習／集団学習／分類結果の評価第6章畳み込みニューラルネットワーク画像認識における深層学習／フィードフォワードニューラルネットワーク／畳み込みニューラルネットワーク／実装上の工夫／パラメータの最適化／畳み込みニューラルネットワークの例第7章物体検出物体検出とは／物体領域候補の提案／線形分類器を用いた物体検出／集団学習を用いた物体検出／非最大値の抑制／畳み込みニューラルネットワークを利用した物体検出／物体検出の評価第8章インスタンス認識と画像検索インスタンス認識／画像検索／画像検索の評価 3

内容 • 画像認識とは • クラス認識 • インスタンス認識 • 画像認識の認識性能を向上させるための原則 •
まとめ 4

画像認識とは

画像認識 (image recognition) • 画像に写る内容を理解すること 6 画像認識システム Input Output 安田講堂

7 画像認識の難しさ • 欲しい出力は「東大」？安田講堂理学部1号館人間入り口雲 •
「人間」「雲」も認識してほしい？ • 理学部1号館の認識には前提知識が必要

8 画像認識の歴史 1970 1980 1990 2000 2010 2020 1966年人工知能の父
MinskyがMITの学部生に「カメラを計算機に接続し、撮影した物を記述させよ」という課題を与えた知識ベース処理幾何学的処理 1999年局所特徴「SIFT」 2003年 Bag of Visual Words 特徴を捉えるアルゴリズムの発達深層学習のブーム到来

物体認識 9 画像認識の分類画像認識物体認識シーン認識インスタンス認識クラス認識インスタンス認識前田敦子
渡辺麻友クラス認識 AKB48 シーン認識ライブで踊るAKB48の前田敦子、渡辺麻友ら

クラス認識

11 手順 Input Output 「コンテナ船」分類 = () 画像特徴抽出サンプリング・記述
1 , 2 , … , コーディング 1 , 2 , … , 統計的特徴抽出 = (Ψ( )) プーリング = ( , … , )

12 サンプリング • 入力画像から代表的な点（特徴点）を取り出すこと疎なサンプリング密なサンプリング

13 局所記述 • 各特徴点を何らかの手法で「特徴量」として記述すること Ex. 記述子 • 画素値 • 明るさのヒストグラム
1 , 2 , … ,

14 統計的特徴抽出 • 局所特徴から外乱などによるノイズを除去すること • 「局所特徴＝理想＋確率的な散らばり」と仮定 • 統計処理で理想に近づけようとする ′ =
Ψ( ) Ex. 主成分分析

15 コーディング • 後の分類に向けて、局所特徴 ′を認識に有効な、ある決まった次元数の特徴ベクトルに変換する操作 • 基本的に cの次元は′よりも大きくなる =
′ = (Ψ( )) Ex. 確率分布の推定

16 プーリング • 特徴ベクトル群を1本のベクトルにまとめること = ( , … , )

17 分類 • プーリングしたベクトルを各クラスに割り振ること • さまざまな分類器が提案されている ※ シーン認識も、クラス認識とほぼ同様の過程 = ()

18 画像認識におけるdeep learning • deep learning 入力画像
サンプリングと記述統計的特徴抽出コーディングプーリング分類器クラスサンプリングと記述統計的特徴抽出コーディングプーリング分類器サンプリングと記述統計的特徴抽出コーディングプーリング分類器 ……

インスタンス認識

20 手順画像の登録クエリ画像の認識 1 , 2 , … ,
データベース 1 , 2 , … , 画像特徴の計算 = Φ(1 , 2 , … , ) インデックス化 = ℎ( ) 画像特徴の計算 = Φ(1 , 2 , … , ) インデックス化 = ℎ( ) 1 , 2 , … , 登録局所特徴マッチング Output

画像認識の認識性能を向上させるための原則

22 データ処理定理 • 「データ処理はデータの持つ情報を決して増やさない」 • 同時確率 , , = •
; ≥ ; • 相互情報量 ; = σ∈ σ∈ , log , () • Proof 世界の状況収集したデータ処理したデータ

23 データ処理定理が示唆すること • モデルの設計や学習方法も大切だが、性能限界は訓練データで決まる • 画像認識では、より入力に近い処理の質を改善するべき • 分類器のチューニングも大切だが、より前の段階で工夫をするべき

まとめ

25 まとめ • 画像認識の概要を説明した • データ処理定理を紹介し、画像認識で大切な心構えを説明した画像認識物体認識シーン認識
インスタンス認識クラス認識

26 参考書の構成画像認識物体認識シーン認識インスタンス認識クラス認識入力画
像サンプリングと記述統計的特徴抽出コーディングプーリング分類器クラス 2 3 4 5 6 畳み込みNN 応用 7 物体検出 8 インスタンス認識と検索 9 さらなる話題

『画像認識』第1章「画像認識の概要」輪読会資料 / Image Recognition Cha...

『画像認識』第1章「画像認識の概要」輪読会資料 / Image Recognition Chapter 1

Shotaro Ishihara

More Decks by Shotaro Ishihara

Other Decks in Technology

Featured

Transcript

第1章画像認識の概要 2017年6月29日

参考書『画像認識』 • 『画像認識』 • 講談社、機械学習プロフェッショナルシリーズ • 著：原田達也＝東京大学大学院情報理工学系研究科教授 • 3000円（税別）

内容 • 画像認識とは • クラス認識 • インスタンス認識 • 画像認識の認識性能を向上させるための原則 •

画像認識とは

画像認識 (image recognition) • 画像に写る内容を理解すること 6 画像認識システム Input Output 安田講堂

7 画像認識の難しさ • 欲しい出力は「東大」？安田講堂理学部1号館人間入り口雲 •

8 画像認識の歴史 1970 1980 1990 2000 2010 2020 1966年人工知能の父

物体認識 9 画像認識の分類画像認識物体認識シーン認識インスタンス認識クラス認識インスタンス認識前田敦子

クラス認識

11 手順 Input Output 「コンテナ船」分類 = () 画像特徴抽出サンプリング・記述

12 サンプリング • 入力画像から代表的な点（特徴点）を取り出すこと疎なサンプリング密なサンプリング

13 局所記述 • 各特徴点を何らかの手法で「特徴量」として記述すること Ex. 記述子 • 画素値 • 明るさのヒストグラム

14 統計的特徴抽出 • 局所特徴から外乱などによるノイズを除去すること • 「局所特徴＝理想＋確率的な散らばり」と仮定 • 統計処理で理想に近づけようとする ′ =

15 コーディング • 後の分類に向けて、局所特徴 ′を認識に有効な、ある決まった次元数の特徴ベクトルに変換する操作 • 基本的に cの次元は′よりも大きくなる =

16 プーリング • 特徴ベクトル群を1本のベクトルにまとめること = ( , … , )

17 分類 • プーリングしたベクトルを各クラスに割り振ること • さまざまな分類器が提案されている ※ シーン認識も、クラス認識とほぼ同様の過程 = ()

18 画像認識におけるdeep learning • deep learning 入力画像

インスタンス認識

20 手順画像の登録クエリ画像の認識 1 , 2 , … ,

画像認識の認識性能を向上させるための原則

22 データ処理定理 • 「データ処理はデータの持つ情報を決して増やさない」 • 同時確率 , , = •

まとめ

25 まとめ • 画像認識の概要を説明した • データ処理定理を紹介し、画像認識で大切な心構えを説明した画像認識物体認識シーン認識

26 参考書の構成画像認識物体認識シーン認識インスタンス認識クラス認識入力画