Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
『画像認識』第1章「画像認識の概要」輪読会資料 / Image Recognition Cha...
Search
Shotaro Ishihara
November 17, 2017
Technology
0
17k
『画像認識』第1章「画像認識の概要」輪読会資料 / Image Recognition Chapter 1
「画像認識」(講談社、機械学習プロフェッショナルシリーズ)の勉強会発表資料_第1章
Shotaro Ishihara
November 17, 2017
Tweet
Share
More Decks by Shotaro Ishihara
See All by Shotaro Ishihara
日本語新聞記事を用いた大規模言語モデルの暗記定量化 / LLMC2025
upura
0
180
Quantifying Memorization in Continual Pre-training with Japanese General or Industry-Specific Corpora
upura
1
37
JOAI2025講評 / joai2025-review
upura
0
430
AI エージェントを活用した研究再現性の自動定量評価 / scisci2025
upura
1
150
JSAI2025 企画セッション「人工知能とコンペティション」/ jsai2025-competition
upura
0
45
生成的推薦の人気バイアスの分析:暗記の観点から / JSAI2025
upura
0
260
Semantic Shift Stability: 学習コーパス内の単語の意味変化を用いた事前学習済みモデルの時系列性能劣化の監査
upura
0
70
日本語ニュース記事要約支援に向けたドメイン特化事前学習済みモデルの構築と活用 / t5-news-summarization
upura
0
77
Web からのデータ収集と探究事例の紹介 / no94_jsai_seminar
upura
0
350
Other Decks in Technology
See All in Technology
今!ソフトウェアエンジニアがハードウェアに手を出すには
mackee
12
4.8k
Android Audio: Beyond Winning On It
atsushieno
0
850
「どこから読む?」コードとカルチャーに最速で馴染むための実践ガイド
zozotech
PRO
0
460
KotlinConf 2025_イベントレポート
sony
1
140
La gouvernance territoriale des données grâce à la plateforme Terreze
bluehats
0
180
「全員プロダクトマネージャー」を実現する、Cursorによる仕様検討の自動運転
applism118
21
11k
DroidKaigi 2025 Androidエンジニアとしてのキャリア
mhidaka
2
310
💡Ruby 川辺で灯すPicoRubyからの光
bash0c7
0
120
AIのグローバルトレンド2025 #scrummikawa / global ai trend
kyonmm
PRO
1
290
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
8.7k
Snowflake Intelligenceにはこうやって立ち向かう!クラシルが考えるAI Readyなデータ基盤と活用のためのDataOps
gappy50
0
250
機械学習を扱うプラットフォーム開発と運用事例
lycorptech_jp
PRO
0
250
Featured
See All Featured
Stop Working from a Prison Cell
hatefulcrawdad
271
21k
[RailsConf 2023] Rails as a piece of cake
palkan
57
5.8k
We Have a Design System, Now What?
morganepeng
53
7.8k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
31
2.2k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.6k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.1k
Fireside Chat
paigeccino
39
3.6k
Building Applications with DynamoDB
mza
96
6.6k
4 Signs Your Business is Dying
shpigford
184
22k
jQuery: Nuts, Bolts and Bling
dougneiner
64
7.9k
Transcript
第1章 画像認識の概要 2017年6月29日
参考書『画像認識』 • 『画像認識』 • 講談社、機械学習プロフェッショナルシリーズ • 著:原田達也=東京大学大学院情報理工学系研 究科教授 • 3000円(税別)
2
第1章 画像認識の概要 画像認識とは/画像認識の分類/クラス認識の手順/深い構造と浅い構造/物体検出/インスタンス 認識と画像検索/画像認識の認識性能を向上させるには?/数学表記について 第2章 局所特徴 局所特徴とは/検出器/空間フィルタリング/基本的な検出器/ 回転やアフィン変換に頑健な検出器/記述 子/検出器と記述子の組み合わせ 第3章
統計的特徴抽出 統計的特徴抽出とは/主成分分析/白色化/フィッシャー線形判別分析/正準相関分析/偏最小2乗法 第4章 コーディングとプーリング コーディングとプーリングの概要/確率分布を利用したコーディング/局所特徴のコード ワードによる再構築/多様体学習/特徴関数の線形内積によるカーネル関数近似/空間情報の活用 第5章 分類 分類とは/ベイズ決定則/識別関数/一般的な教師付き学習の枠組み/最適化/線形識別関数/確率的識別関数 /局所学習/集団学習/分類結果の評価 第6章 畳み込みニューラルネットワーク 画像認識における深層学習/フィードフォワードニューラルネットワーク/畳み込 みニューラルネットワーク/実装上の工夫/パラメータの最適化/畳み込みニューラルネットワークの例 第7章 物体検出 物体検出とは/物体領域候補の提案/線形分類器を用いた物体検出/集団学習を用いた物体検出/非最大値 の抑制/畳み込みニューラルネットワークを利用した物体検出/物体検出の評価 第8章 インスタンス認識と画像検索 インスタンス認識/画像検索/画像検索の評価 3
内容 • 画像認識とは • クラス認識 • インスタンス認識 • 画像認識の認識性能を向上させるための原則 •
まとめ 4
画像認識とは
画像認識 (image recognition) • 画像に写る内容を理解すること 6 画像認識システム Input Output 安田講堂
7 画像認識の難しさ • 欲しい出力は「東大」? 安田講堂 理学部1号館 人間 入り口 雲 •
「人間」「雲」も認識してほしい? • 理学部1号館の認識には前提知識が必要
8 画像認識の歴史 1970 1980 1990 2000 2010 2020 1966年 人工知能の父
MinskyがMITの学部生に「カメラを計算機に接続し、撮影した物を記述させよ」 という課題を与えた 知識ベース処理 幾何学的処理 1999年 局所特徴「SIFT」 2003年 Bag of Visual Words 特徴を捉えるアルゴリズムの発達 深層学習のブーム到来
物体認識 9 画像認識の分類 画像認識 物体認識 シーン認識 インスタンス認識 クラス認識 インスタンス認識 前田敦子
渡辺麻友 クラス認識 AKB48 シーン認識 ライブで踊るAKB48の前田敦子、 渡辺麻友ら
クラス認識
11 手順 Input Output 「コンテナ船」 分類 = () 画像特徴抽出 サンプリング・記述
1 , 2 , … , コーディング 1 , 2 , … , 統計的特徴抽出 = (Ψ( )) プーリング = ( , … , )
12 サンプリング • 入力画像から代表的な点(特徴点)を取り出すこと 疎なサンプリング 密なサンプリング
13 局所記述 • 各特徴点を何らかの手法で「特徴量」として記述すること Ex. 記述子 • 画素値 • 明るさのヒストグラム
1 , 2 , … ,
14 統計的特徴抽出 • 局所特徴から外乱などによるノイズを除去すること • 「局所特徴=理想+確率的な散らばり」と仮定 • 統計処理で理想に近づけようとする ′ =
Ψ( ) Ex. 主成分分析
15 コーディング • 後の分類に向けて、局所特徴 ′を認識に有効な、ある決まった 次元数の特徴ベクトルに変換する操作 • 基本的に cの次元は′よりも大きくなる =
′ = (Ψ( )) Ex. 確率分布の推定
16 プーリング • 特徴ベクトル群を1本のベクトルにまとめること = ( , … , )
17 分類 • プーリングしたベクトルを各クラスに割り振ること • さまざまな分類器が提案されている ※ シーン認識も、クラス認識とほぼ同様の過程 = ()
18 画像認識におけるdeep learning • deep learning 入 力 画 像
サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 ク ラ ス サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 ……
インスタンス認識
20 手順 画像の登録 クエリ画像の認識 1 , 2 , … ,
データベース 1 , 2 , … , 画像特徴の計算 = Φ(1 , 2 , … , ) インデックス化 = ℎ( ) 画像特徴の計算 = Φ(1 , 2 , … , ) インデックス化 = ℎ( ) 1 , 2 , … , 登録 局所特徴マッチング Output
画像認識の認識性能を向上 させるための原則
22 データ処理定理 • 「データ処理はデータの持つ情報を決して増やさない」 • 同時確率 , , = •
; ≥ ; • 相互情報量 ; = σ∈ σ∈ , log , () • Proof 世界の状況 収集したデータ 処理したデータ
23 データ処理定理が示唆すること • モデルの設計や学習方法も大切だが、性能限界は訓練データで 決まる • 画像認識では、より入力に近い処理の質を改善するべき • 分類器のチューニングも大切だが、より前の段階で工夫をするべき
まとめ
25 まとめ • 画像認識の概要を説明した • データ処理定理を紹介し、 画像認識で大切な心構えを説明した 画像認識 物体認識 シーン認識
インスタンス認識 クラス認識
26 参考書の構成 画像認識 物体認識 シーン認識 インスタンス認識 クラス認識 入 力 画
像 サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 ク ラ ス 2 3 4 5 6 畳み込みNN 応用 7 物体検出 8 インスタンス認識と検索 9 さらなる話題