Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Graph-Based Global Reasoning Networks

kiyo
August 02, 2019

Graph-Based Global Reasoning Networks

2019年8月2日の #6【画像処理 & 機械学習】論文LT会で発表した内容です。

kiyo

August 02, 2019
Tweet

More Decks by kiyo

Other Decks in Technology

Transcript

  1. Graph-Based
    Global Reasoning
    Networks
    [Chen et al. CVPR 2019]
    #6【画像処理 & 機械学習】論文LT会
    2019年8月2日

    View Slide

  2. 自己紹介
    2
    @hrs1985
    https://qiita.com/hrs1985
    https://kiyo.qrunch.io/
    機械学習エンジニアをしています。最近転職して 7月から東京で働いてます。
    前々職では実験生物学やってました。
    ● 深層生成モデル
    ● 強化学習
    ● 画像処理
    に興味があります。最近はグラフも面白そうだなと思っています。

    View Slide

  3. 論文の概要
    ▪ 大域的な特徴を用いた推論のために coordinate space をinteraction
    space (graph) に落とし込んでグラフ畳み込みを行い、それを元の
    coordinate space に戻すアプローチ
    ▪ 特徴マップから物体同士の関係をグラフに変換してグラフ畳み込みを行う
    Global Reasoning unit (GloRe unit) を提案
    ▪ 画像分類、セグメンテーション、video action recognition タスクに適用
    したら SOTA
    3

    View Slide

  4. CNN の問題点
    4
    局所的な特徴しか取れないため、
    大域的な特徴をとるために畳み込み層がたくさん必要になる。
    例えば 3x3 カーネルの畳み込み層を用いた場合、
    オレンジの物体と青の物体の情報が 1 つのノードに
    集約されるまでには 2 つの層が必要となる
    1 回目の畳み込みで集約される範囲
    2 回目の畳み込みで集約される範囲

    View Slide

  5. 5
    各物体をグラフの各ノードに集約したうえで
    グラフ畳み込みを適用すれば少ない層で大域的な特徴をとれる
    GCN
    Coordinate Space Interaction Space
    特徴マップ➡グラフ

    View Slide

  6. 6
    GCN
    ?
    Coordinate Space Interaction Space
    特徴マップ➡グラフ

    View Slide

  7. Global Reasoning unit (GloRe)
    7

    View Slide

  8. Global Reasoning unit (GloRe)
    8
    Coordinate → Interaction Interaction → Coordinate
    Graph Convolution

    View Slide

  9. Coordinate Space
    ➡ Interaction Space
    9
    x1, x2, x3,...,xj
    v1, v2, v3,...,vi
    B: Coordinate Space の各点 xj と
    Interaction Space のノード vi を
    対応付ける projection map

    View Slide

  10. Global Reasoning unit (GloRe)
    10
    Coordinate → Interaction Interaction → Coordinate
    Graph Convolution

    View Slide

  11. Graph Convolution
    11
    グラフ畳み込みは、
    1. 隣接ノードへの情報の拡散
    2. 各ノードについての情報の更新
    の 2 ステップからなる

    View Slide

  12. Graph Convolution
    12
    完全グラフならば、
    1. 各チャンネルについてのノード方向の 1 次元畳み込み
    2. 各ノードについてのチャンネル方向の 1 次元 畳み込み
    の 2 ステップで Graph Convolution Network を構成できる

    View Slide

  13. Global Reasoning unit (GloRe)
    13
    Coordinate → Interaction Interaction → Coordinate
    Graph Convolution

    View Slide

  14. Interaction Space
    ➡ Coordinate Space
    14
    x1, x2, x3,...,xj
    v1, v2, v3,...,vi
    Interaction Space から Coordinate Space への逆変換
    さきほど Interaction Space への変換に使った B を転置して再利用

    View Slide

  15. Experiments
    15
    ImageNet の Top-1 Accuracy を比較。
    ResNet-50 の 3 ブロック目ないし
    4 ブロック目に GloRe unit 導入で精度向上 (灰色)
    4 ブロック目の GloRe unit 数を増やしていくと
    精度向上 (緑色)

    View Slide

  16. Experiments
    16
    FCN に GloRe unit を導入すると mIoU が向上
    GloRe unit を 2 つ入れたら逆効果?

    View Slide

  17. Experiments
    17
    GloRe unit ありなしでのセグメンテーション結果

    View Slide

  18. Experiments
    18
    GloRe unit ありなしでのセグメンテーション結果

    View Slide

  19. Experiments
    19
    2 枚の猫画像に対する projection map (B) を可視化した図
    左から「猫のヒゲ」「エッジ」「目」「画像全体」に反応している (と著者は言っている )

    View Slide

  20. 関連文献
    20
    ● Wang, Xiaolong, et al. "Non-local neural networks." Proceedings of the
    IEEE Conference on Computer Vision and Pattern Recognition. 2018.
    ● Hu, Jie, Li Shen, and Gang Sun. "Squeeze-and-excitation networks."
    Proceedings of the IEEE conference on computer vision and pattern
    recognition. 2018.
    謝辞
    この資料の7割くらいは
    先週行われたもくもく会で作られました。

    View Slide