論文の概要 ▪ 大域的な特徴を用いた推論のために coordinate space をinteraction space (graph) に落とし込んでグラフ畳み込みを行い、それを元の coordinate space に戻すアプローチ ▪ 特徴マップから物体同士の関係をグラフに変換してグラフ畳み込みを行う Global Reasoning unit (GloRe unit) を提案 ▪ 画像分類、セグメンテーション、video action recognition タスクに適用 したら SOTA 3
Interaction Space ➡ Coordinate Space 14 x1, x2, x3,...,xj v1, v2, v3,...,vi Interaction Space から Coordinate Space への逆変換 さきほど Interaction Space への変換に使った B を転置して再利用
関連文献 20 ● Wang, Xiaolong, et al. "Non-local neural networks." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018. ● Hu, Jie, Li Shen, and Gang Sun. "Squeeze-and-excitation networks." Proceedings of the IEEE conference on computer vision and pattern recognition. 2018. 謝辞 この資料の7割くらいは 先週行われたもくもく会で作られました。