$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Single Shot Multibox Detector
Search
Takanori
September 12, 2018
0
210
Single Shot Multibox Detector
Description of Sigle Shot Multibox Detector
Takanori
September 12, 2018
Tweet
Share
Featured
See All Featured
Design in an AI World
tapps
0
93
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
64
35k
For a Future-Friendly Web
brad_frost
180
10k
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
28
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
180
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
0
85
Done Done
chrislema
186
16k
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
77
Building Adaptive Systems
keathley
44
2.9k
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
0
89
Why Our Code Smells
bkeepers
PRO
340
57k
The untapped power of vector embeddings
frankvandijk
1
1.5k
Transcript
Single Shot Multibox Detector 2018年9月10日 Convergence Lab. 長谷部 尊則
はじめに 機械学習を用いた一般物体検知のアルゴリズムにSSD(Single Shot Multibox Detector)が存在。 深層学習の技術を用いて多種類の物体を、高速に検知することが可能。 特定の物体を覚えさせ、それを検知することも可能。
画像分類と物体検出の違いについて
画像分類 VGG 16等 television dog cat rat
物体検出 VGG 16 television dog cat rat VGG 16 VGG
16 スライディングウィンドウ方式 認識に時間がかかるという欠点がある。
2段階物体検出 R-CNN, Fast R-CNN, Faster R-CNNは「物体らしい領域の検出」と「どの物体が映って いるかを検出」する2段階の処理からなる。 これらのネットワークでは、リアルタイム処理が難しかった。 CNN 領域抽出のためのCNN
CNN 物体検出のためのCNN
Single Shot Multibox Detector 注目領域を絞り込まない物体検出のための CNNアーキテクチャ 一度の演算でクラス分類と位置検出の両方を行うことができる。 並列に処理できるため、高速で認識が可能。
Single Shot Multibox Detector 演算性能の比較
Single Shot Multibox Detector 入力サイズ : 300 × 300 ベースネットワーク
: VGG16 SSD300からの出力がクラス分類用 conv層と物体位置検出用 conv層に入る
Single Shot Multibox Detector ネットワーク構造は以下のよう。 https://github.com/pierluigiferrari/ssd_keras/blob/master/models/keras_ssd300.py
Single Shot Multibox Detector 1. 画像に目印(Anchor)を複数のスケールで等間隔に設定。 2. 様々なアスペクト比の DefaultBoxを8732個設定。 3.
各DefaultBoxのクラス特徴と位置特徴を SSD300からの出力のConv層で検出 →画像の中の様々なスケール・アスペクト比の物体を検出するように CNNの重みを学習させる。
Non-maximum Suppression処理 SSDでは、多くのDefault Boxを敷き詰めて、それぞれの物体に対するスコアと詳細な位置を計算した。 しかし、それでは、多くの Default Boxが現れてしまう。 そこでNon-maximum Suppressionという処理が出てくる。
Non-maximum Suppression処理 SSD300 mbox_loc mbox_conf Multibox Decoder Non-maximum Suppression スコアが高い物体位置候補を抽出
各カテゴリごとに 物体位置候補の重なり率( IOU)を計算 重なり率が高い物体位置候補は スコアの低い方を除外 detection_out 閾値 実際の画像上の座標に変換 重複する物体位置候補を除外
Loss関数(回帰) Huber Loss
Loss関数(回帰) MSEに比べて外れ値の影響を受けない
Loss関数(分類) Cross Entropy
マルチタスク学習 TASK A TASK B 共有層 task特化層 タスクAが回帰の位置検出 タスクBが分類の種類検出
参考文献 ・【YOLOとSSDを使った】実践物体検出 https://www.udemy.com/yolossd-a/learn/v4/t/lecture/9078698?start=0 ・Huber Loss https://ja.wikipedia.org/wiki/Huber%E6%90%8D%E5%A4%B1 ・Cross Entropy https://ja.wikipedia.org/wiki/%E4%BA%A4%E5%B7%AE%E3%82%A8%E3%83%B3%E3%83%88% E3%83%AD%E3%83%94%E3%83%BC
https://qiita.com/mine820/items/f8a8c03ef1a7b390e372 ・マルチタスク学習 https://github.com/jojonki/arXivNotes/issues/118 ・【機械学習】一般物体検知アルゴリズム SSD : 第1編 https://avinton.com/blog/2018/03/single-shot-multibox-detector-explained1/
参考文献 ・Single Shot Multibox Detection https://arxiv.org/pdf/1512.02325.pdf