Slide 1

Slide 1 text

第54回 コンピュータビジョン勉強会@関東 The Perception-Distortion Tradeoff Presenter: @s_aiueo32

Slide 2

Slide 2 text

論⽂情報 ü タイトル: The Perception-Distortion Tradeoff ü 著者: Yochai Blau and Tomer Michaeli (Technion) ü 採択状況: CVPR2018 Orals/Spotlights ü 内容 ü メトリックと知覚品質のトレードオフに関して考察 ü (トレードオフを横断するのに) GANはいいぞ

Slide 3

Slide 3 text

Image Restoration ü 画像の劣化(Degradation)を修復し,元の画像を再構成する問題 Super Resolution Inpain0ng Dehazing Denoising debruring

Slide 4

Slide 4 text

Image Restorationのゴール Low Distortion ü GTに近い画像を⽣成できればいい ü 画像間の距離で測る ü MAE, MSE, PSNR, SSIM etc. Good Perceptual Quality ü 「⾃然」な画像を⽣成できればいい ü 単⼀画像を⽤いて計測 ü BRISQUE, NIQE etc. (本論文の主張) 2つのゴールを同時に達成することは不可能 Mr. Intuition 「距離がゼロならそれは自然な画像では?」 無理

Slide 5

Slide 5 text

経験的には結構⾔われてた 滑らかすぎる PSNRが 低 い !

Slide 6

Slide 6 text

他のアルゴリズムでの結果 両立しているモデルは存在しない Better Better 敵 「RMSEがダメなだけでは?」

Slide 7

Slide 7 text

他の指標での結果

Slide 8

Slide 8 text

ここからちょっと算数

Slide 9

Slide 9 text

Image Restoration ∼ # 自然画像 再構成画像 % 劣化画像 '|# ) #|' Algorithm

Slide 10

Slide 10 text

Distortion [Δ(, ) )] SSD, SSIM, MS-SSIM, IFC, VIF, VGG, … ∼ # 自然画像 再構成画像 % 非負性: Δ , ≥ 0 同一律: Δ , = 0

Slide 11

Slide 11 text

Perceptual Quality ∼ # 自然画像 再構成画像 % Real or Fake 7899:77 ∝ =>(#, ) # ) 50% 50% ∼ ) #

Slide 12

Slide 12 text

Perceptual Quality (#, ) # ) TV, KL, Hellinger, @, Renyi, Wasserstein, … ∼ # 自然画像 再構成画像 % 非負性: , ≥ 0 同一律: , = 0 ⟺ = ∼ ) #

Slide 13

Slide 13 text

本論⽂の問題設定 問題 → → ) 尺度の定式化 Distortion: [Δ(, ) )] Perceptual Quality: (# , ) # ) [Δ(, ) )] (#, ) # ) このトレードオフの 存在を証明

Slide 14

Slide 14 text

Low Distortionは?

Slide 15

Slide 15 text

簡単なパラメータ推定の例 ü ノイズ を含んだ観測値 からパラメータ を推定 = + ü は次の確率質量関数に従う確率変数 #() = G H = ±1 K = 0 ü は正規分布に従う ~(0, 1) この設定でMMSEとMAP推定を行う

Slide 16

Slide 16 text

MMSE と MAP推定 ü MMSE ü 推定値は条件付期待値で与えられる % NNOP = = ü ) #QQRS は確率密度 ü MAP推定 ü 事後確率最⼤のパラメータを出⼒ % NTU = argmax[∈{^H,K,H} ( = |) ü 今回の設定だとsign(⋅)と同じ

Slide 17

Slide 17 text

MNISTでMMSE/MAP推定した結果 ü MNISTとBlank画像を混ぜたデータでDenoising 高ノイズレベルで ぼやける 高ノイズレベルでは Blankがほとんど

Slide 18

Slide 18 text

トレードオフについて

Slide 19

Slide 19 text

Tradeoff Function ü Distortionレベルごとの下界を求める関数を定義 = min fg h|i #, ) # . . Δ , ) ≤ ü (, )がに関して凸なら, ()は単調減少&凸関数 (= Tradeoff!!) ü -divergenceはに関して凸 = + の例でのプロット

Slide 20

Slide 20 text

トレードオフを横断 ü ⺠「トレードオフがあるのは分かったけど, 下界に近づきたい」 ü 神「GANを使いましょう」 = min fg h|i #, ) # . . Δ , ) ≤ ℓp:q = ℓrs7tuvtsuq + ℓxry ≈ Δ , ) + (#, ) # ) ⟷

Slide 21

Slide 21 text

実験 ü WGANで ∈ [0, 0.3]を変えながらDenoising ü 理論的な下界に沿って品質をコントロールできることを確認

Slide 22

Slide 22 text

既存のアルゴリズムの評価 ü ⾔葉の定義 ü A dominates B: AがBにDistortionでもPerceptual Qualityでも勝ってる ü A is admissible: Aはどのアルゴリズムにもdominateされてない ü admissibleな⼿法が下界に近い⼿法

Slide 23

Slide 23 text

レート歪との関係 ü 許容歪に対してどれくらい圧縮できるか? ü Perception-Distortion Tradeoffと似た形 = min fg h|h ; ) s. t. Δ , ) ≤ ü レート歪とのPerception-Distortion Tradeoffの違い 1. レート歪は) #|# を考えるけど,こっちは) #|' を考える 2. ; ) はと ) の同時分布に依存するけど, #, ) # は依存しない ü 著者はICML2019にこんな論⽂通している ü “Rethinking Lossy Compression: The Rate-Distortion-Perception Tradeoff”

Slide 24

Slide 24 text

まとめ ü DistortioinとPerceptual Qualityの間にトレードオフがある ü GAN損失の⽐率によってトレードオフ関数を横断できる ü 許容Distortionレベルを決めてから動かすのが良い ü 「最適なアルゴリズム」は応⽤依存 ü 医⽤画像はDistortion志向, 写真はPerceptual Quality志向