Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
『画像認識』第1章「画像認識の概要」輪読会資料 / Image Recognition Cha...
Search
Shotaro Ishihara
November 17, 2017
Technology
0
17k
『画像認識』第1章「画像認識の概要」輪読会資料 / Image Recognition Chapter 1
「画像認識」(講談社、機械学習プロフェッショナルシリーズ)の勉強会発表資料_第1章
Shotaro Ishihara
November 17, 2017
Tweet
Share
More Decks by Shotaro Ishihara
See All by Shotaro Ishihara
情報技術の社会実装に向けた応用と課題:ニュースメディアの事例から / appmech-jsce 2025
upura
0
280
日本語新聞記事を用いた大規模言語モデルの暗記定量化 / LLMC2025
upura
0
370
Quantifying Memorization in Continual Pre-training with Japanese General or Industry-Specific Corpora
upura
1
65
JOAI2025講評 / joai2025-review
upura
0
1.1k
AI エージェントを活用した研究再現性の自動定量評価 / scisci2025
upura
1
190
JSAI2025 企画セッション「人工知能とコンペティション」/ jsai2025-competition
upura
0
70
生成的推薦の人気バイアスの分析:暗記の観点から / JSAI2025
upura
0
310
Semantic Shift Stability: 学習コーパス内の単語の意味変化を用いた事前学習済みモデルの時系列性能劣化の監査
upura
0
94
日本語ニュース記事要約支援に向けたドメイン特化事前学習済みモデルの構築と活用 / t5-news-summarization
upura
0
110
Other Decks in Technology
See All in Technology
「図面」から「法則」へ 〜メタ視点で読み解く現代のソフトウェアアーキテクチャ〜
scova0731
0
310
Reinforcement Fine-tuning 基礎〜実践まで
ch6noota
0
190
寫了幾年 Code,然後呢?軟體工程師必須重新認識的 DevOps
cheng_wei_chen
1
1.4k
re:Inventで気になったサービスを10分でいけるところまでお話しします
yama3133
1
120
コミューンのデータ分析AIエージェント「Community Sage」の紹介
fufufukakaka
0
510
ログ管理の新たな可能性?CloudWatchの新機能をご紹介
ikumi_ono
1
840
Database イノベーショントークを振り返る/reinvent-2025-database-innovation-talk-recap
emiki
0
220
5分で知るMicrosoft Ignite
taiponrock
PRO
0
390
会社紹介資料 / Sansan Company Profile
sansan33
PRO
11
390k
Jakarta Agentic AI Specification - Status and Future
reza_rahman
0
110
コンテキスト情報を活用し個社最適化されたAI Agentを実現する4つのポイント
kworkdev
PRO
1
1.5k
AIの長期記憶と短期記憶の違いについてAgentCoreを例に深掘ってみた
yakumo
4
400
Featured
See All Featured
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
Producing Creativity
orderedlist
PRO
348
40k
Faster Mobile Websites
deanohume
310
31k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
The Cost Of JavaScript in 2023
addyosmani
55
9.4k
Balancing Empowerment & Direction
lara
5
800
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.2k
Automating Front-end Workflow
addyosmani
1371
200k
Leading Effective Engineering Teams in the AI Era
addyosmani
8
1.3k
How to Ace a Technical Interview
jacobian
281
24k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
KATA
mclloyd
PRO
33
15k
Transcript
第1章 画像認識の概要 2017年6月29日
参考書『画像認識』 • 『画像認識』 • 講談社、機械学習プロフェッショナルシリーズ • 著:原田達也=東京大学大学院情報理工学系研 究科教授 • 3000円(税別)
2
第1章 画像認識の概要 画像認識とは/画像認識の分類/クラス認識の手順/深い構造と浅い構造/物体検出/インスタンス 認識と画像検索/画像認識の認識性能を向上させるには?/数学表記について 第2章 局所特徴 局所特徴とは/検出器/空間フィルタリング/基本的な検出器/ 回転やアフィン変換に頑健な検出器/記述 子/検出器と記述子の組み合わせ 第3章
統計的特徴抽出 統計的特徴抽出とは/主成分分析/白色化/フィッシャー線形判別分析/正準相関分析/偏最小2乗法 第4章 コーディングとプーリング コーディングとプーリングの概要/確率分布を利用したコーディング/局所特徴のコード ワードによる再構築/多様体学習/特徴関数の線形内積によるカーネル関数近似/空間情報の活用 第5章 分類 分類とは/ベイズ決定則/識別関数/一般的な教師付き学習の枠組み/最適化/線形識別関数/確率的識別関数 /局所学習/集団学習/分類結果の評価 第6章 畳み込みニューラルネットワーク 画像認識における深層学習/フィードフォワードニューラルネットワーク/畳み込 みニューラルネットワーク/実装上の工夫/パラメータの最適化/畳み込みニューラルネットワークの例 第7章 物体検出 物体検出とは/物体領域候補の提案/線形分類器を用いた物体検出/集団学習を用いた物体検出/非最大値 の抑制/畳み込みニューラルネットワークを利用した物体検出/物体検出の評価 第8章 インスタンス認識と画像検索 インスタンス認識/画像検索/画像検索の評価 3
内容 • 画像認識とは • クラス認識 • インスタンス認識 • 画像認識の認識性能を向上させるための原則 •
まとめ 4
画像認識とは
画像認識 (image recognition) • 画像に写る内容を理解すること 6 画像認識システム Input Output 安田講堂
7 画像認識の難しさ • 欲しい出力は「東大」? 安田講堂 理学部1号館 人間 入り口 雲 •
「人間」「雲」も認識してほしい? • 理学部1号館の認識には前提知識が必要
8 画像認識の歴史 1970 1980 1990 2000 2010 2020 1966年 人工知能の父
MinskyがMITの学部生に「カメラを計算機に接続し、撮影した物を記述させよ」 という課題を与えた 知識ベース処理 幾何学的処理 1999年 局所特徴「SIFT」 2003年 Bag of Visual Words 特徴を捉えるアルゴリズムの発達 深層学習のブーム到来
物体認識 9 画像認識の分類 画像認識 物体認識 シーン認識 インスタンス認識 クラス認識 インスタンス認識 前田敦子
渡辺麻友 クラス認識 AKB48 シーン認識 ライブで踊るAKB48の前田敦子、 渡辺麻友ら
クラス認識
11 手順 Input Output 「コンテナ船」 分類 = () 画像特徴抽出 サンプリング・記述
1 , 2 , … , コーディング 1 , 2 , … , 統計的特徴抽出 = (Ψ( )) プーリング = ( , … , )
12 サンプリング • 入力画像から代表的な点(特徴点)を取り出すこと 疎なサンプリング 密なサンプリング
13 局所記述 • 各特徴点を何らかの手法で「特徴量」として記述すること Ex. 記述子 • 画素値 • 明るさのヒストグラム
1 , 2 , … ,
14 統計的特徴抽出 • 局所特徴から外乱などによるノイズを除去すること • 「局所特徴=理想+確率的な散らばり」と仮定 • 統計処理で理想に近づけようとする ′ =
Ψ( ) Ex. 主成分分析
15 コーディング • 後の分類に向けて、局所特徴 ′を認識に有効な、ある決まった 次元数の特徴ベクトルに変換する操作 • 基本的に cの次元は′よりも大きくなる =
′ = (Ψ( )) Ex. 確率分布の推定
16 プーリング • 特徴ベクトル群を1本のベクトルにまとめること = ( , … , )
17 分類 • プーリングしたベクトルを各クラスに割り振ること • さまざまな分類器が提案されている ※ シーン認識も、クラス認識とほぼ同様の過程 = ()
18 画像認識におけるdeep learning • deep learning 入 力 画 像
サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 ク ラ ス サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 ……
インスタンス認識
20 手順 画像の登録 クエリ画像の認識 1 , 2 , … ,
データベース 1 , 2 , … , 画像特徴の計算 = Φ(1 , 2 , … , ) インデックス化 = ℎ( ) 画像特徴の計算 = Φ(1 , 2 , … , ) インデックス化 = ℎ( ) 1 , 2 , … , 登録 局所特徴マッチング Output
画像認識の認識性能を向上 させるための原則
22 データ処理定理 • 「データ処理はデータの持つ情報を決して増やさない」 • 同時確率 , , = •
; ≥ ; • 相互情報量 ; = σ∈ σ∈ , log , () • Proof 世界の状況 収集したデータ 処理したデータ
23 データ処理定理が示唆すること • モデルの設計や学習方法も大切だが、性能限界は訓練データで 決まる • 画像認識では、より入力に近い処理の質を改善するべき • 分類器のチューニングも大切だが、より前の段階で工夫をするべき
まとめ
25 まとめ • 画像認識の概要を説明した • データ処理定理を紹介し、 画像認識で大切な心構えを説明した 画像認識 物体認識 シーン認識
インスタンス認識 クラス認識
26 参考書の構成 画像認識 物体認識 シーン認識 インスタンス認識 クラス認識 入 力 画
像 サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 ク ラ ス 2 3 4 5 6 畳み込みNN 応用 7 物体検出 8 インスタンス認識と検索 9 さらなる話題