Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
『画像認識』第1章「画像認識の概要」輪読会資料 / Image Recognition Cha...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Shotaro Ishihara
November 17, 2017
Technology
17k
0
Share
『画像認識』第1章「画像認識の概要」輪読会資料 / Image Recognition Chapter 1
「画像認識」(講談社、機械学習プロフェッショナルシリーズ)の勉強会発表資料_第1章
Shotaro Ishihara
November 17, 2017
More Decks by Shotaro Ishihara
See All by Shotaro Ishihara
[ACL 2026 Demo] Fast-MIA: Efficient and Scalable Membership Inference for LLMs
upura
0
4
Fast-MIA: Efficient and Scalable Membership Inference for LLMs
upura
0
4
JAPAN AI CUP Prediction Tutorial
upura
2
1k
情報技術の社会実装に向けた応用と課題:ニュースメディアの事例から / appmech-jsce 2025
upura
0
360
日本語新聞記事を用いた大規模言語モデルの暗記定量化 / LLMC2025
upura
0
630
Quantifying Memorization in Continual Pre-training with Japanese General or Industry-Specific Corpora
upura
1
100
JOAI2025講評 / joai2025-review
upura
0
1.6k
AI エージェントを活用した研究再現性の自動定量評価 / scisci2025
upura
1
240
JSAI2025 企画セッション「人工知能とコンペティション」/ jsai2025-competition
upura
0
120
Other Decks in Technology
See All in Technology
AI時代に越境し、 組織を変えるQAスキルの正体 / QA Skills for Transforming an Organization
mii3king
5
3.7k
社内エンジニア勉強会の醍醐味と苦しみ/tamadev
nishiuma
0
280
データ定義の混乱と戦う 〜 管理会計と財務会計 〜
wonohe
0
200
「SaaSの次の時代」に重要性を増すステークホルダーマネジメントの要諦 ~解像度を圧倒的に高めPdMの価値を最大化させる方法~
kakehashi
PRO
3
3.7k
「誰一人取り残されない」 AIエージェント時代のプロダクト設計思想 Product Management Summit 2026
mizushimac
1
2.8k
20260428_Product Management Summit_Loglass_JoeHirose
loglassjoe
4
6.8k
Building a Study Buddy AI Agent from Scratch: From Passive Chatbots to Autonomous Systems
itchimonji
0
130
AgentCore×VPCでの設計パターンn選と勘所
har1101
4
380
AI와 협업하는 조직으로의 여정
arawn
0
580
音声言語モデル手法に関する発表の紹介
kzinmr
0
160
フロントエンドの相手が変わった - AIが加わったWebの新しいインターフェース設計
azukiazusa1
31
10k
古今東西SRE
okaru
1
120
Featured
See All Featured
Site-Speed That Sticks
csswizardry
13
1.2k
Navigating Team Friction
lara
192
16k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
430
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
70
39k
Writing Fast Ruby
sferik
630
63k
Design in an AI World
tapps
1
210
VelocityConf: Rendering Performance Case Studies
addyosmani
333
25k
Designing Powerful Visuals for Engaging Learning
tmiket
1
360
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
410
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
61
43k
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
250
Un-Boring Meetings
codingconduct
0
280
Transcript
第1章 画像認識の概要 2017年6月29日
参考書『画像認識』 • 『画像認識』 • 講談社、機械学習プロフェッショナルシリーズ • 著:原田達也=東京大学大学院情報理工学系研 究科教授 • 3000円(税別)
2
第1章 画像認識の概要 画像認識とは/画像認識の分類/クラス認識の手順/深い構造と浅い構造/物体検出/インスタンス 認識と画像検索/画像認識の認識性能を向上させるには?/数学表記について 第2章 局所特徴 局所特徴とは/検出器/空間フィルタリング/基本的な検出器/ 回転やアフィン変換に頑健な検出器/記述 子/検出器と記述子の組み合わせ 第3章
統計的特徴抽出 統計的特徴抽出とは/主成分分析/白色化/フィッシャー線形判別分析/正準相関分析/偏最小2乗法 第4章 コーディングとプーリング コーディングとプーリングの概要/確率分布を利用したコーディング/局所特徴のコード ワードによる再構築/多様体学習/特徴関数の線形内積によるカーネル関数近似/空間情報の活用 第5章 分類 分類とは/ベイズ決定則/識別関数/一般的な教師付き学習の枠組み/最適化/線形識別関数/確率的識別関数 /局所学習/集団学習/分類結果の評価 第6章 畳み込みニューラルネットワーク 画像認識における深層学習/フィードフォワードニューラルネットワーク/畳み込 みニューラルネットワーク/実装上の工夫/パラメータの最適化/畳み込みニューラルネットワークの例 第7章 物体検出 物体検出とは/物体領域候補の提案/線形分類器を用いた物体検出/集団学習を用いた物体検出/非最大値 の抑制/畳み込みニューラルネットワークを利用した物体検出/物体検出の評価 第8章 インスタンス認識と画像検索 インスタンス認識/画像検索/画像検索の評価 3
内容 • 画像認識とは • クラス認識 • インスタンス認識 • 画像認識の認識性能を向上させるための原則 •
まとめ 4
画像認識とは
画像認識 (image recognition) • 画像に写る内容を理解すること 6 画像認識システム Input Output 安田講堂
7 画像認識の難しさ • 欲しい出力は「東大」? 安田講堂 理学部1号館 人間 入り口 雲 •
「人間」「雲」も認識してほしい? • 理学部1号館の認識には前提知識が必要
8 画像認識の歴史 1970 1980 1990 2000 2010 2020 1966年 人工知能の父
MinskyがMITの学部生に「カメラを計算機に接続し、撮影した物を記述させよ」 という課題を与えた 知識ベース処理 幾何学的処理 1999年 局所特徴「SIFT」 2003年 Bag of Visual Words 特徴を捉えるアルゴリズムの発達 深層学習のブーム到来
物体認識 9 画像認識の分類 画像認識 物体認識 シーン認識 インスタンス認識 クラス認識 インスタンス認識 前田敦子
渡辺麻友 クラス認識 AKB48 シーン認識 ライブで踊るAKB48の前田敦子、 渡辺麻友ら
クラス認識
11 手順 Input Output 「コンテナ船」 分類 = () 画像特徴抽出 サンプリング・記述
1 , 2 , … , コーディング 1 , 2 , … , 統計的特徴抽出 = (Ψ( )) プーリング = ( , … , )
12 サンプリング • 入力画像から代表的な点(特徴点)を取り出すこと 疎なサンプリング 密なサンプリング
13 局所記述 • 各特徴点を何らかの手法で「特徴量」として記述すること Ex. 記述子 • 画素値 • 明るさのヒストグラム
1 , 2 , … ,
14 統計的特徴抽出 • 局所特徴から外乱などによるノイズを除去すること • 「局所特徴=理想+確率的な散らばり」と仮定 • 統計処理で理想に近づけようとする ′ =
Ψ( ) Ex. 主成分分析
15 コーディング • 後の分類に向けて、局所特徴 ′を認識に有効な、ある決まった 次元数の特徴ベクトルに変換する操作 • 基本的に cの次元は′よりも大きくなる =
′ = (Ψ( )) Ex. 確率分布の推定
16 プーリング • 特徴ベクトル群を1本のベクトルにまとめること = ( , … , )
17 分類 • プーリングしたベクトルを各クラスに割り振ること • さまざまな分類器が提案されている ※ シーン認識も、クラス認識とほぼ同様の過程 = ()
18 画像認識におけるdeep learning • deep learning 入 力 画 像
サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 ク ラ ス サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 ……
インスタンス認識
20 手順 画像の登録 クエリ画像の認識 1 , 2 , … ,
データベース 1 , 2 , … , 画像特徴の計算 = Φ(1 , 2 , … , ) インデックス化 = ℎ( ) 画像特徴の計算 = Φ(1 , 2 , … , ) インデックス化 = ℎ( ) 1 , 2 , … , 登録 局所特徴マッチング Output
画像認識の認識性能を向上 させるための原則
22 データ処理定理 • 「データ処理はデータの持つ情報を決して増やさない」 • 同時確率 , , = •
; ≥ ; • 相互情報量 ; = σ∈ σ∈ , log , () • Proof 世界の状況 収集したデータ 処理したデータ
23 データ処理定理が示唆すること • モデルの設計や学習方法も大切だが、性能限界は訓練データで 決まる • 画像認識では、より入力に近い処理の質を改善するべき • 分類器のチューニングも大切だが、より前の段階で工夫をするべき
まとめ
25 まとめ • 画像認識の概要を説明した • データ処理定理を紹介し、 画像認識で大切な心構えを説明した 画像認識 物体認識 シーン認識
インスタンス認識 クラス認識
26 参考書の構成 画像認識 物体認識 シーン認識 インスタンス認識 クラス認識 入 力 画
像 サ ン プ リ ン グ と 記 述 統 計 的 特 徴 抽 出 コ ー デ ィ ン グ プ ー リ ン グ 分 類 器 ク ラ ス 2 3 4 5 6 畳み込みNN 応用 7 物体検出 8 インスタンス認識と検索 9 さらなる話題