Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
『画像認識』第1章「画像認識の概要」輪読会資料 / Image Recognition Cha...
Search
Shotaro Ishihara
November 17, 2017
Technology
0
17k
『画像認識』第1章「画像認識の概要」輪読会資料 / Image Recognition Chapter 1
「画像認識」(講談社、機械学習プロフェッショナルシリーズ)の勉強会発表資料_第1章
Shotaro Ishihara
November 17, 2017
Tweet
Share
More Decks by Shotaro Ishihara
See All by Shotaro Ishihara
Semantic Shift Stability: 学習コーパス内の単語の意味変化を用いた事前学習済みモデルの時系列性能劣化の監査
upura
0
12
日本語ニュース記事要約支援に向けたドメイン特化事前学習済みモデルの構築と活用 / t5-news-summarization
upura
0
12
Web からのデータ収集と探究事例の紹介 / no94_jsai_seminar
upura
0
200
記者・編集者との協働:情報技術が変えるニュースメディア / Kaishi PU 2024
upura
0
83
ニュースメディアにおける生成 AI の活用と開発 / UTokyo Lecture Business Introduction
upura
0
270
マルチモーダル AI 実装の課題と解決策 / Developer X Summit
upura
0
300
ニュースメディアにおける事前学習済みモデルの可能性と課題 / IBIS2024
upura
3
870
「巨人の肩の上」で自作ライブラリを作る技術 / pyconjp2024
upura
3
1k
Quantifying Memorization and Detecting Training Data of Pre-trained Language Models using Japanese Newspaper
upura
0
75
Other Decks in Technology
See All in Technology
OCI Database with PostgreSQLのご紹介
rkajiyama
0
130
LLM とプロンプトエンジニアリング/チューターをビルドする / LLM, Prompt Engineering and Building Tutors
ks91
PRO
1
170
バックエンド留学した話/Backend study abroad story
kaonavi
0
140
サーバシステムを無理なくコンテナ移行する際に伝えたい4つのポイント/Container_Happy_Migration_Method
ozawa
1
130
さくらの夕べ Debianナイト - さくらのVPS編
dictoss
0
150
開発現場とセキュリティ担当をつなぐ脅威モデリング
cloudace
0
140
OPENLOGI Company Profile
hr01
0
62k
コンソールで学ぶ!AWS CodePipelineの機能とオプション
umekou
3
130
チームビルディング「脅威モデリング」ワークショップ
koheiyoshikawa
0
190
7,000名規模の 人材サービス企業における プロダクト戦略・戦術と課題 / Product strategy, tactics and challenges for a 7,000-employee staffing company
techtekt
0
230
大規模サービスにおける カスケード障害
takumiogawa
3
780
ペアプログラミングにQAが加わった!職能を超えたモブプログラミングの事例と学び
tonionagauzzi
1
160
Featured
See All Featured
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
29
2k
Stop Working from a Prison Cell
hatefulcrawdad
268
20k
Agile that works and the tools we love
rasmusluckow
328
21k
Into the Great Unknown - MozCon
thekraken
36
1.7k
A better future with KSS
kneath
239
17k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
12
640
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
7
640
Code Reviewing Like a Champion
maltzj
522
39k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.2k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
227
22k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
12k
We Have a Design System, Now What?
morganepeng
51
7.5k
Transcript
第1章 画像認識の概要 2017年6月29日
参考書『画像認識』 • 『画像認識』 • 講談社、機械学習プロフェッショナルシリーズ • 著:原田達也=東京大学大学院情報理工学系研 究科教授 • 3000円(税別)
2
第1章 画像認識の概要 画像認識とは/画像認識の分類/クラス認識の手順/深い構造と浅い構造/物体検出/インスタンス 認識と画像検索/画像認識の認識性能を向上させるには?/数学表記について 第2章 局所特徴 局所特徴とは/検出器/空間フィルタリング/基本的な検出器/ 回転やアフィン変換に頑健な検出器/記述 子/検出器と記述子の組み合わせ 第3章
統計的特徴抽出 統計的特徴抽出とは/主成分分析/白色化/フィッシャー線形判別分析/正準相関分析/偏最小2乗法 第4章 コーディングとプーリング コーディングとプーリングの概要/確率分布を利用したコーディング/局所特徴のコード ワードによる再構築/多様体学習/特徴関数の線形内積によるカーネル関数近似/空間情報の活用 第5章 分類 分類とは/ベイズ決定則/識別関数/一般的な教師付き学習の枠組み/最適化/線形識別関数/確率的識別関数 /局所学習/集団学習/分類結果の評価 第6章 畳み込みニューラルネットワーク 画像認識における深層学習/フィードフォワードニューラルネットワーク/畳み込 みニューラルネットワーク/実装上の工夫/パラメータの最適化/畳み込みニューラルネットワークの例 第7章 物体検出 物体検出とは/物体領域候補の提案/線形分類器を用いた物体検出/集団学習を用いた物体検出/非最大値 の抑制/畳み込みニューラルネットワークを利用した物体検出/物体検出の評価 第8章 インスタンス認識と画像検索 インスタンス認識/画像検索/画像検索の評価 3
内容 • 画像認識とは • クラス認識 • インスタンス認識 • 画像認識の認識性能を向上させるための原則 •
まとめ 4
画像認識とは
画像認識 (image recognition) • 画像に写る内容を理解すること 6 画像認識システム Input Output 安田講堂
7 画像認識の難しさ • 欲しい出力は「東大」? 安田講堂 理学部1号館 人間 入り口 雲 •
「人間」「雲」も認識してほしい? • 理学部1号館の認識には前提知識が必要
8 画像認識の歴史 1970 1980 1990 2000 2010 2020 1966年 人工知能の父
MinskyがMITの学部生に「カメラを計算機に接続し、撮影した物を記述させよ」 という課題を与えた 知識ベース処理 幾何学的処理 1999年 局所特徴「SIFT」 2003年 Bag of Visual Words 特徴を捉えるアルゴリズムの発達 深層学習のブーム到来
物体認識 9 画像認識の分類 画像認識 物体認識 シーン認識 インスタンス認識 クラス認識 インスタンス認識 前田敦子
渡辺麻友 クラス認識 AKB48 シーン認識 ライブで踊るAKB48の前田敦子、 渡辺麻友ら
クラス認識
11 手順 Input Output 「コンテナ船」 分類 = () 画像特徴抽出 サンプリング・記述
1 , 2 , … , コーディング 1 , 2 , … , 統計的特徴抽出 = (Ψ( )) プーリング = ( , … , )
12 サンプリング • 入力画像から代表的な点(特徴点)を取り出すこと 疎なサンプリング 密なサンプリング
13 局所記述 • 各特徴点を何らかの手法で「特徴量」として記述すること Ex. 記述子 • 画素値 • 明るさのヒストグラム
1 , 2 , … ,
14 統計的特徴抽出 • 局所特徴から外乱などによるノイズを除去すること • 「局所特徴=理想+確率的な散らばり」と仮定 • 統計処理で理想に近づけようとする ′ =
Ψ( ) Ex. 主成分分析
15 コーディング • 後の分類に向けて、局所特徴 ′を認識に有効な、ある決まった 次元数の特徴ベクトルに変換する操作 • 基本的に cの次元は′よりも大きくなる =
′ = (Ψ( )) Ex. 確率分布の推定
16 プーリング • 特徴ベクトル群を1本のベクトルにまとめること = ( , … , )
17 分類 • プーリングしたベクトルを各クラスに割り振ること • さまざまな分類器が提案されている ※ シーン認識も、クラス認識とほぼ同様の過程 = ()
18 画像認識におけるdeep learning • deep learning 入 力 画 像
サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 ク ラ ス サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 ……
インスタンス認識
20 手順 画像の登録 クエリ画像の認識 1 , 2 , … ,
データベース 1 , 2 , … , 画像特徴の計算 = Φ(1 , 2 , … , ) インデックス化 = ℎ( ) 画像特徴の計算 = Φ(1 , 2 , … , ) インデックス化 = ℎ( ) 1 , 2 , … , 登録 局所特徴マッチング Output
画像認識の認識性能を向上 させるための原則
22 データ処理定理 • 「データ処理はデータの持つ情報を決して増やさない」 • 同時確率 , , = •
; ≥ ; • 相互情報量 ; = σ∈ σ∈ , log , () • Proof 世界の状況 収集したデータ 処理したデータ
23 データ処理定理が示唆すること • モデルの設計や学習方法も大切だが、性能限界は訓練データで 決まる • 画像認識では、より入力に近い処理の質を改善するべき • 分類器のチューニングも大切だが、より前の段階で工夫をするべき
まとめ
25 まとめ • 画像認識の概要を説明した • データ処理定理を紹介し、 画像認識で大切な心構えを説明した 画像認識 物体認識 シーン認識
インスタンス認識 クラス認識
26 参考書の構成 画像認識 物体認識 シーン認識 インスタンス認識 クラス認識 入 力 画
像 サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 ク ラ ス 2 3 4 5 6 畳み込みNN 応用 7 物体検出 8 インスタンス認識と検索 9 さらなる話題