論文紹介 DSRNet: Single Image Reflection Separation via Component Synergy (ICCV 2023)

Slide 1

Slide 1 text

AI 2023.2.9 @tattaka_sun 株式会社ディー・エヌ・エー＋ GO株式会社論文紹介 DSRNet: Single Image Reﬂection Separation via Component Synergy (ICCV 2023)

Slide 2

Slide 2 text

AI 2 ▪ 私生活で水槽写真を撮る時に写り込みに悩まされる ▪ 現在のReﬂection RemovalのSOTA 論文紹介のモチベーション

Slide 3

Slide 3 text

AI 3 ▪ ガラスのような遮蔽物を通して撮影された画像から、透過層Tと反射層Rを分離するタスク ▪ 本論文では透過層Tと反射層RのGTが存在する設定 Reﬂection Removalについて

Slide 4

Slide 4 text

AI 4 関連研究 Single image Multiple image DL based Opt based ● 分離後の画像の勾配にペナルティをつけて滑らかになるような損失関数 [1] ● VGG19を用いたPerceptual loss [2] ● 反射層と透過層の相互関係を重視するような2ストリームのネットワーク構造 [3] ● ブレンディングマップを推定して非線形な反射をシミュレート [4] ● フラッシュon/oﬀ [6] ● 違う位置から撮影 [7] ● 偏光フィルムの条件を変えて撮影 [8] ● 分離後のエッジが滑らかになるよう最適化 [5]

Slide 5

Slide 5 text

AI 5 ▪ Reﬂection Separationの再定式化 ▪ 出力となる透過層と反射層を効率的に抽出できるネットワーク構造 DSRNetのcontributionまとめ

Slide 6

Slide 6 text

AI 6 手法

Slide 7

Slide 7 text

AI 7 シンプルな仮定だと、I = T + Rと表すことが多い (Iは元画像、Tは透過層、Rは反射層)が、実世界の複雑なシチュエーションに対応できないため、様々な変種が存在する ● I = αT + βR ○ 拡散などにより透過成分や反射成分が弱まる可能性があるため線形に足し合わせる ○ 露出オーバーなどに対応できない ● I = W○T + (1 - W)○R ○ ブレンディングマップを導入 ○ 自由度が高くなり、難易度が上がる Reﬂection Separationの再定式化 (1/2)

Slide 8

Slide 8 text

AI 8 この研究では I = T + R + Φ(T, R) で表す (Φは学習可能な関数) Φを十分深くすることで、前ページの定式化を含む色々なパターンを包括することができるまた、残差項として表すことで透過層Tと反射層Rの品質を保つことができる Reﬂection Separationの再定式化 (2/2)

Slide 9

Slide 9 text

AI 9 全体としては学習済みVGGの特徴マップから、DSFNet(stage1)と DSDNet (Stage2)を用いてTとRを生成、生成したTとRを入力とする LRMで残差項Φ(T, R)を生成ネットワーク構造 (1/4) VGG

Slide 10

Slide 10 text

AI 10 ● DSFNet (Dual-stream Semantic-aware Network): Pixel ShuﬄeとMuGI Blockを用いてVGGの特徴マップを拡大していき、inputと合流させる ● MuGI(Mutually-gated Interactive) Block: 2入力を混ぜながら特徴抽出していくアーキテクチャネットワーク構造 (2/4)

Slide 11

Slide 11 text

AI 11 ● DSDNet (Dual-Stream ﬁne-grained Decomposition Network): MuGI BlockとPixelShuﬄeを用いたU-Net likeなネットワーク DSFNetの出力を入力として透過層T・反射層Rを出力する ● LRM (Learnable Residue Module): 透過層Tと反射層Rを入力として、残差項Φ(T, R)を生成するネットワーク構造 (3/4)

Slide 12

Slide 12 text

AI 12 ● SCA (Simpliﬁed Channel Attention): SE Attetionを簡略化したもの ● NAF Block (Nonlinear Activation Free Block): 入力を2分割し、それぞれの積をとる(GLUのActivationなしな Module) Simple GateとSCAを使ったBlock NAFNet (ECCV2022) [9] で提案ネットワーク構造 (4/4)

Slide 13

Slide 13 text

AI 13 ● Pixel Loss: 本論文ではα = 2 ● Perceptual Loss: VGG19を使用損失関数 (1/3)

Slide 14

Slide 14 text

AI 14 ● Exclusion Loss: 透過層と反射層のエッジは重なり合いづらいため、透過層と反射層の相関を抑える損失関数正規化された複数解像度のTとRの勾配の積を計算する Single Image Reﬂection Separation with Perceptual Losses (CVPR2018) で提案損失関数(2/3)

Slide 15

Slide 15 text

AI 15 ● Reconstruction Loss ここまでの損失関数を係数をつけて足し合わせる損失関数(3/3)

Slide 16

Slide 16 text

AI 16 評価

Slide 17

Slide 17 text

AI 17 90のリアルデータとPASCAL VOCから合成された 7643のデータをtrainデータとして用いる合成データの場合、係数γ1 ∈ [0.8, 1.0] , γ2 ∈ [0.4, 1.0]を用いて以下のように合成する使用したデータセット

Slide 18

Slide 18 text

AI 18 様々なtestデータセットに対してSOTA 定量評価

Slide 19

Slide 19 text

AI 19 ● w/ Linear Recons: 残差項がないと大幅に性能down ● w/o Feature Inter: Dual-Stream内で特徴交換なし ● w/ YTMT Inter: ● w/o Feature Enc: DSFNetなし ablation study

Slide 20

Slide 20 text

AI 20 定性評価透過層の推定反射層の推定

Slide 21

Slide 21 text

AI 21 自前の画像でもやってみる (1/3) Input T R Φ(T, R)

Slide 22

Slide 22 text

AI 22 自前の画像でもやってみる (2/3) Input T R Φ(T, R)

Slide 23

Slide 23 text

AI 23 自前の画像でもやってみる (3/4) Input T R Φ(T, R)

Slide 24

Slide 24 text

AI 24 自前の画像でもやってみる (4/4) Input T R Φ(T, R)

Slide 25

Slide 25 text

AI 25 ● 定式化を見直すことで反射分離のSOTAを達成 ● MuGI Blockはシンプルな構造でありながら効果が大きそう ● 元々のモチベーションであった水槽撮影には軽微な写り込みであれば消すことはできそう ○ ガッツリ写り込んでいる場合でも弱めることはできている ● 残差項が露出オーバーな部分や水中で反射している成分をカバーしていることが確認できるまとめ・感想

Slide 26

Slide 26 text

AI 26 [1] https://openaccess.thecvf.com/content_ICCV_2017/papers/Fan_A_Generic_Deep_ICCV_2017_paper.pdf [2] https://openaccess.thecvf.com/content_cvpr_2018/papers/Zhang_Single_Image_Reflection_CVPR_2018_paper.pdf [3] https://proceedings.neurips.cc/paper/2021/file/cf1f78fe923afe05f7597da2be7a3da8-Paper.pdf [4] https://openaccess.thecvf.com/content_CVPR_2019/papers/Wen_Single_Image_Reflection_Removal_Beyond_Lin earity_CVPR_2019_paper.pdf [5] https://ieeexplore.ieee.org/document/1315047 [6] https://www.cs.columbia.edu/cg/pdfs/114-flashReflectionsRaskarSig05.pdf [7] https://openaccess.thecvf.com/content_cvpr_2014/papers/Guo_Robust_Separation_of_2014_CVPR_paper.pdf [8] https://link.springer.com/article/10.1023/A:1007937815113 [9] https://www.ecva.net/papers/eccv_2022/papers_ECCV/papers/136670017.pdf 参考文献