Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Multi Scale Recognition with DAG-CNNs
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
tereka114
March 16, 2022
Programming
180
0
Share
Multi Scale Recognition with DAG-CNNs
第32回 コンピュータビジョン勉強会@関東 ICCV2015論文読み回の発表資料です。
Multi Scale Recognition with DAG-CNNs
tereka114
March 16, 2022
More Decks by tereka114
See All by tereka114
トラブルがあったコンペに学ぶデータ分析
tereka114
2
2k
Harnessing Large Language Models for Training-free Video Anomaly Detection
tereka114
1
1.7k
KDD2023学会参加報告
tereka114
2
660
Prompting Large Language Models with Answer Heuristics for Knowledge-based Visual Question Answering
tereka114
0
450
Mobile-Former: Bridging MobileNet and Transformer
tereka114
0
1.2k
DER: Dynamically Expandable Representation for Class Incremental Learning
tereka114
0
260
Jupyter Notebookを納品した話
tereka114
0
540
How to use scikit-image for data augmentation
tereka114
0
310
面倒くさいこと考えたくないあなたへ〜Tpotと機械学習〜
tereka114
0
310
Other Decks in Programming
See All in Programming
When benchmarks go bad - what I learned from measuring performance wrong
hollycummins
0
390
AIベース静的検査器の偽陽性率を抑える工夫3選
orgachem
PRO
4
460
ついに来た!本格的なマルチクラウド時代の Google Cloud
maroon1st
0
460
リセットCSSを1行消したらアクセシビリティが向上した話
pvcresin
4
520
AgentCore Optimizationを始めよう!
licux
3
260
なぜあなたのコードには「コシ」がないのか?〜AI時代に問う、最後まで美味しい設計と戦略〜 #phpconkagawa / phpconkagawa2026
shogogg
0
210
柔軟なPDFレイアウトエディタを支える型システム設計 — Discriminated UnionとConditional Typeの実践
minako__ph
1
180
過去のレビュー知見をSkillsで資産化した話
pkshadeck
PRO
1
2k
空間オーディオの活用
objectiveaudio
0
160
1人1案件のプロダクトエンジニア時代に、"プロセス監督"としてチャレンジしたこと
non0113
0
110
20年以上続くプロダクトでも使い続けられる静的解析ツールを求めて
matsuo_atsushi
0
150
cloudnative conference 2026 flyle
azihsoyn
1
190
Featured
See All Featured
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.4k
Leo the Paperboy
mayatellez
7
1.8k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.9k
How to build a perfect <img>
jonoalderson
1
5.5k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.5k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
2k
Paper Plane
katiecoart
PRO
1
50k
Music & Morning Musume
bryan
47
7.2k
A Tale of Four Properties
chriscoyier
163
24k
Chasing Engaging Ingredients in Design
codingconduct
0
190
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
240
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
55k
Transcript
Multi Scale Recognition with DAG-CNNs 2016年2月6日 山本 大輝(@tereka114)
Self Introduction 1. 山本 大輝 2. Acroquest Technology株式会社(2015.4.1〜) 3. システム系のエンジニア
4. Twitter(@tereka114) 5. CV勉強会 参加2回目です。(発表1回目) 6. Blog:「のんびりしているエンジニアの日記」 1. http://nonbiri-tereka.hatenablog.com/
Outline 1. 論文の概要 2. Convolutional Neural Networkとその後の比較 3. 特徴マップのScaleの比較 4.
DAG-CNNs 5. Experiments 6. Conclusion
Outline 1. 論文の概要 2. Convolutional Neural Networkとその後の比較 3. 特徴マップのScaleの比較 4.
DAG-CNNs 5. Experiments 6. Conclusion
なんでこの論文? 1. CNNって特徴量抽出しているって言われているが、それを 検証していたのが興味深い。 2. DAGはDirected acyclic graph(有向非循環グラフ)です。 1. 最近、複雑な構造なネットワークが多い
2. レイヤーを統合していく考え方が増えてきている。
論文の概要 1. 複数のレイヤーの結果を使うDAG-CNNsを実装、実験した。 2. 複数のレイヤーの結果を使うことにより、high,middle,low- levelな特徴量を活用した。 3. DAG-CNNsにより、MIT67,Scene15,SUN397のエラー率を下 げた。
Outline 1. 論文の概要 2. Convolutional Neural Networkとその後の比較 3. 特徴マップのScaleの比較 4.
DAG-CNNs 5. Experiments 6. Conclusion
Convolutional Neural Networkの比較
Convolutional Neural Networkの比較
1PでわかるCNN LeCun, Y., Bottou, L., Bengio, Y., and Haffner, P.
(1998d). Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11), 2278–2324
従来までの Convolutional Neural Network 1. Single Output CNN 1. 最後のレイヤーのみの情報を使う。
2. 非常にシンプルな構造である。 2. Multi Scale CNN 1. 結合しているのみなので、非常に高次元のデータを生成する。 2. 学習が難しく、過学習が生じやすい。
Outline 1. 論文の概要 2. Convolutional Neural Networkとその後の比較 3. 特徴マップのScaleの比較 4.
DAG-CNNsの解説 5. Experiments 6. Conclusion
レイヤーにおける特徴差分の検証 1. 情報検索を用いた手法で検証し、query画像からの距離 を計算し近い7画像を出力する。 2. 得たレイヤーの出力をSupport Vector Machine(SVM, One-VS-All)で分類した。 3.
各レイヤーの出力で分類を実施し、その際の結果をK x N で可視化し、ソートを実施した。
情報検索を用いた手法 1. 情報検索を実施し、各レイヤーで取得できる出力を元に 検索した。 2. 手順は以下の通り 1. 学習して、出力した各層の出力のL2距離を求めた。 2. 距離の近い上位K(=7)件を抽出する。
情報検索を用いた手法
特徴量のレベルによる差分 クエリ
複数のレイヤーの結果から予測 1. 複数のレイヤーの結果に対して予測し、グラフ化した。 2. 各レイヤーの出力に対してSVMでOne vs Allの手法により、 Kクラスに分類するタスクを実施した。 3. High
Lavelな特徴ほど、良い結果を示している。
各レイヤーの情報を用いた分類結果
複数のレイヤーの結果から予測 1. 各クラスについて、分類を実施した。 2. 分類結果について、可視化を実施し、ヒートマップとした。 その上で各層ごとに最も高い正答率にてソートした。
各層とクラスの正解率のマップ 最も多いクラス
Outline 1. 論文の概要 2. Convolutional Neural Networkとその後の比較 3. 特徴マップのScaleの比較 4.
DAG-CNNs 5. Experiments 6. Conclusion
DAG-CNNs
DAG-CNNsの学習 • 今回は以下の式を最適化する。 入力 教師 誤差関数 Convolutionの重み K=Layer数、x = 学習データ
y = 学習ラベル
DAG-CNNsの学習 • 今回は以下の式を最適化する。 入力 教師 誤差関数 Convolutionの重み K=Layer数、x = 学習データ
y = 学習ラベル BPで解く
DAG-CNNs
DAG-CNNsの学習 Convolution Layerの入力 出力
DAG-CNNsの勾配の計算方法 Chain Rule
Vanishing Gradient Problem 1. 低層レイヤーまでに勾配情報が消えている問題のこと。 2. 通常、深くなっていくと勾配情報が消えていくとされている。 1. 直接つないでいるので低層も問題なく学習できる。
Gradient based learning
Outline 1. 論文の概要 2. Convolutional Neural Networkとその後の比較 3. 特徴マップのScaleの比較 4.
DAG-CNNs 5. Experiments 6. Conclusion
Experiments 1. 分類データセットのAccuracyによる評価を実施した。 1. SUN397 1. 100Kの画像と397カテゴリー、景観画像の分類 2. MIT67 1.
15Kの画像と67カテゴリー、室内画像の分類 3. Scene15 1. 外と中の景観画像
Evaluation
MIT67のClassification Result
Outline 1. 論文の概要 2. Convolutional Neural Networkとその後の比較 3. 特徴マップのScaleの比較 4.
DAG-CNNs 5. Experiments 6. Conclusion
Conclusion 1. Low LevelからHigh Levelまでの特徴について、様々な実 験を用い、検証した。 2. 上記から、ネットワークDAG-CNNsを提唱した。 1. 各層の活性化関数の出力を合計する。
3. 実験より、特にMIT67によるデータ・セットに対し、成果を あげることができた。