Grad-CAMの始まりのお話

Slide 1

Slide 1 text

Grad-CAMの始まりの話 AI勉強会#4 @Eaglys on 2020/10/25 吉田慎太郎 @sht_47

Slide 2

Slide 2 text

Grad-CAMの特徴 ● Grad-CAM(Gradient-weighted Class Activation Mapping, 2016, Ramprasaath) ○ XAIで最も有名なもの(理由はGrad-CAMのページで説明) ○ CAM(2015, Zhou) の弱点を克服し、全てのCNNモデルに対して一般化 ● XAI(Explainable Artificial Intelligence) の目的 (筆者の長期的な視点) 失敗の原因を特定 (モデル << 人間) 予測の根拠を説明し、判定の信頼⬆ (モデル ≒ 人間) 人間がAIに教わる (モデル >> 人間)

Slide 3

Slide 3 text

今回の勉強会で扱う内容 - Grad-CAMのアイデアになった論文たち - - - - Grad-CAMのモデル中身 - 実験結果 - Google Colaboratoryでの実装

Slide 4

Slide 4 text

NIN(Network In Network, 2014 Lin et al) - 偉大な論文 (2つのメインアイデア) 計算量削減のために1x1 Convを導入 ( InceptionNetのアイデアの源、ResNet Botttleneck Block) GAP(Global Average Pooling) を提案 → 最近だとAdaptive Average Pooling ● GAP Structural Regularizerとして機能 ○ Feature MapとCategory間の関係がより自然に ○ 追加のParameterが不要 ○ Spatial TranslationにRobust

Slide 5

Slide 5 text

Object Detectors Emerge In Deep Scene Cnns(2015 Zhou et al) - Scene Recognitionの問題を解く → Object Detector が出現した Objectの正解ラベルを与えていないのに。。。先行研究として、Object Classification問題のCNNで、Object Localizationの出現 Places Database (2014 Zhou et al )

Slide 6

Slide 6 text

CAM(Class Activation Mapping 2015 Zhou et al) … … Final Conv GAP FC k枚 k個 … c個 a a 1 を用いて CAMを生成

Slide 7

Slide 7 text

CAM(Class Activation Mapping) … … Final Conv GAP FC 4096枚 4096個 … 1000個 VGG16 (ImageNet) 7 7

Slide 8

Slide 8 text

CAMの数式と概念図 iとjでSum Kで Sum それぞれのプロセスは独立 Zは最終Feature Mapのサイズ(今回は49)

Slide 9

Slide 9 text

CAMの使用方法(推論時に利用) Iとjで平均 Kで加重平均 (Image Source : Zhou et al 2015) CAM Kで加重平均推論 CAM生成

Slide 10

Slide 10 text

Guided Back-Propagation(2015 Springenberg) - Deconvolutional Network (2011 Zeiler) Max Poolingの反対の操作 - Guided Backprop deconvNetを ReLUのBackPropagationに組み合わせ

Slide 11

Slide 11 text

Guided-Backpropの実験結果 Batch Size : 64 Learning Rate : 0.01 Weight Decay : 0.001 Optimizer : SGD Conv6 Conv9

Slide 12

Slide 12 text

Grad-CAM(2016 Ramprasaath) CAMはGAPに限定 → 一般化( 全てのCNN Architectureで可能) CAM(Corase)とGuided-Backprop(Fined-Grained)を組み合わせ CAMにReLUを挿入(Positiveな影響を与えるもののみ必要) CAM, Grad-CAM共にArchitectural ChangeやRe-Trainが必要ない iとjでSum Kで加重平均 Kで加重平均

Slide 13

Slide 13 text

Grad-CAMの結果1 - Microsoft COCO データセット - Validation Dataset からSample - Ice Creamで誤り

Slide 14

Slide 14 text

Grad-CAMの結果2 VGG@ImageNetにおける間違い集モデルがバイアスを含むかどうか

Slide 15

Slide 15 text

実装 - Pytorch 1.6 https://github.com/sht47/grad-cam-Pytorch1.6 - Tensorflow 2.3 https://github.com/sht47/grad-cam-Tensorflow2.3