Upgrade to Pro — share decks privately, control downloads, hide ads and more …

perception_distortion_tradeoff.pdf

 perception_distortion_tradeoff.pdf

koki madono

May 25, 2020
Tweet

More Decks by koki madono

Other Decks in Research

Transcript

  1. 4 ⼈間の知覚情報に関する損失関数の⼤枠 ⼤きく3種類に分類(perceptual information loss) 1. ⼈間の意⾒ (ex) アンケート、⼈間の意⾒を元に損失関数を設計 2.

    ⾃然画像の統計量との⽐較(No Reference based,NR) (ex) BRISQUE, NIQE, %**7*/& 3. GAN based (分布を最⼩化するアプローチ) (ex) JS divergence, Wasserstein distance, f-divergence • 歪み(distortion)の計測 : Full Reference based(FR, 元画像との⽐較) (ex) MSE, SSIM, MS-SSIM, IFC, VIF, …
  2. 7 発表論⽂ 1. The Perception-Distortion Tradeoff - 元画像と再構成時の確率分布の違いを分析 - ⽬的関数に関係なく、視覚情報と歪みにトレードオフがある

    2. On The Classification-Distortion-Perception Tradeoff - ্ͷݚڀΛࣝผਫ਼౓ͱͷؔ܎ੑʹ֦ு - 3ͭͦΕͧΕͷpairؒʹରͯ͠τϨʔυΦϑ͕͋Δ 3. Rethinking Lossy Compression: The Rate-Distortion-Perception Tradeoff - 1. ͷݚڀΛBit rate ( ѹॖʣٕज़ͱͷؔ܎ੑʹ֦ு - ѹॖ཰ʹΑͬͯɺPerceptual loss͕ػೳ͠ͳ͍৔߹͕͋Γʁ
  3. 9 論⽂概要 タスク : 画像信号復元 / 超解像 提案 : Perceptual

    quality と distortionにトレードオフ (PD-tradeoff) 結論 : - どの評価指標でもPD-tradeoffが存在する - 最近の⼿法はtrade offの⾯でそこまで変化なし - FR, NR両⽅の損失を⽤いることが信頼性のために重要
  4. 12 の性質 ", # " : f-divergence, KL, Renyi divergenceなどのJensenの不等式

    を満たすものを利⽤する. () (= min !! "|$ ", # " ,下の図の)は上の条件で、凸性を持つ. -> ()ʹತੑ͕͋ΔͨΊɺͲͪΒ͔Λ࠷దԽ͢Δͱɺยํͷ஋ͷมԽ͕ ۃ୺ʹͳΔ. (੺࿮ʣ
  5. 14 論⽂の注⽬点 元画像と再構成画像の分布 - (ex) 元画像 X ∈ −1,0,1 と

    劣化画像 = + (0,1) 元画像 () 劣化画像 () 再構成画像 ()
  6. 15 論⽂の注⽬点 元画像と再構成画像の分布 - (ex) 元画像 X ∈ −1,0,1 と

    劣化画像 = + (0,1) 元画像 () 劣化画像 () 再構成画像 () MMSEとMAPで歪みを 最⼩化すると分布が合わない ↓ Perceptual informationと トレードオフな関係があるのでは︖
  7. 16 minimum mean square-error (MMSE) での推定 ..4&の事後確率の期待値 > $$%&: [|

    = ](∑'∈{*+,-,+} # "%&'( > ) - 確率が離散 / 連続値の違い - MMSEによる推定が完全でない ! = $ " , = ±1 # , = 0 ) *!"#$ " = +exp(− 1 2 − ,) ∑-∈{01,3,1} - exp{− 1 2 ( − ),}
  8. 17 maximum-a-posteriori (MAP)での推定 ."1の事後確率の期待値 > $/!: [| = ]( max

    '∈{*+,-,+} ( = |)) - 0を取らないように推定を⾏う - MAPによる推定が完全でない ! = $ " , = ±1 # , = 0 $ !!"# ) = $ 0.5, ) = +1 0.5, ) = −1
  9. 20 実験 既存のdistortionの評価指標とperceptual informationの関係性の検証 (超解像のアルゴリズムにおいて) 超解像のアルゴリズム : ~2018年秋までの有名な⼿法 Distortion :

    3.4& 44*. .444*. *'$ 7*'BOE7(( perceptual information : Ma et alͷख๏Λར༻ 評価時 : 両評価指標においてスコアが優れている場合、優劣を評価 (ex) Aの⼿法よりはBの⼿法が優れている (下図)
  10. 23 結果 異なるDistortionの評価指標でも同じような傾向が出ている. 筆者の考察 (i) 左下のplotがない (ii) 劣化画像の⽐較ができる(FR) / できない(NR)場合両⽅でtradeoff

    (iii) Referenceを⽤いるアプローチのスコアのばらつきがある -> NRとFR、2つのアプローチを併⽤することが必要
  11. Dong Liu, Haochen Zhang, Zhiwei Xiong Neurips 2019 On The

    Classification-Distortion- Perception Tradeoff
  12. 25 論⽂概要 タスク : 画像信号復元 (denoising) 提案 : Perceptual quality

    と distortionに加え, Classificationとのトレー ドオフの分析 結論 : 識別の最適化時には歪みや知覚情報をある程度落としている
  13. 27 具体的な問題設定の理由 1. Perceptual Quality(())とDistortion ()ʹର͢Δ੍໿ - ⽐較対象の画像がある程度認識できるものを仮定 2. 学習済みの識別器を識別評価に⽤いる理由

    - 再構成画像で再学習すると、再構成⽅法によって相関が変化する恐れ - ࠶ߏ੒ը૾Ͱ࠶ֶश͢Δͱɺ৚݅ʹΑͬͯࣝผثֶ͕श͠ͳ͍Մೳੑ - ڧ͍࿪Έ ( high distortion) - ݩը૾͕Θ͔Βͳ͍ʢblind restoration) 相関が ⾃明 Distorted Original 今回確認したい 相関
  14. 31 簡単な設定での例(準備) Toy exampleʼs experimentでの実験 1. ͷ2ΫϥεͷΨ΢εࠞ߹ϞσϧͰͷఆࣜԽ (+ = 0.3,

    : = 0.7, "6 = (−1,1), "6 = (1,1)) 2. ϊΠζը૾ = + 3. Denoisingํ๏ : ઢܗύϥϝʔλ()ʹΑΔdenoising - 3 = • ධՁํ๏ • Distortion (D) : MSE • Perception (P) : KL distance • Classification (C) : ̎Ϋϥεͷࣝผثͱͯ͠Ͱֶशͨ͠΋ͷ 0 = . 0! + / 0"
  15. 33 実験 ⽬的 : 実データでのCDPの関係性の確認 データ : MNIST, Cifar10 タスク

    : Denoising, 超解像 CNN-1, CNN-2 : 異なる構造のCNN CNN-2, CNN-2ʼ : ⼊⼒サイズの違い (28x28, 32x32) 損失 : $%& + 012 + A&
  16. 34 実験 Exp1 ~ 3 : 0,1 からサンプルしたNoiseがMNISTに事前に付与 Exp4 :

    ⼊⼒サイズを1/6 Exp5 : ⼊⼒サイズを1/3 (発表ではExp1,2,4のみ発表)
  17. 39 論⽂概要 タスク : 画像再構成 提案 - Perceptual quality ͱ

    distortionʹՃ͑ɺѹॖ཰ͱͷτϨʔυΦ ϑͷ෼ੳ - τϨʔυΦϑΛ౿·͑ͨଛࣦؔ਺ͷઃܭ 結論 - 圧縮率が⾼い場合, Perceptual qualityͷڧ੍͍໿͕ඞཁ - Perceptual qualityͷΈͷଛࣦؔ਺ͩͱ࠶ߏ੒͕ػೳ͠ͳ͍
  18. 43 実験設定 実験設定 Encoder : (, )の特徴を量⼦化したもの ( 6 (,

    )) ( MNISTを99%で識別する識別器) Decoder : 未学習 Constraint ℎ : gradient penalty 7(*, ) * ) : max8∈ℱ( ℎ − ℎ 6 () ) Δ , c + C(", # " ) 0 9 ① ① ② ② .
  19. 44 実験1 実験設定 歪みの損失(∆(, )) : Mean Squared Error (MSE)

    モデル構造(以下の3つ) プロット数 ( 実験に使ったEncoder-Decoderの数) : 98個 * Quantize : 特徴をbitに変換(2~16)
  20. 46 実験2 実験設定 歪みの損失(∆(, )) : Mean Squared Error (MSE)

    + − (A ) * : 下のDNNの2層⽬(conv, 4x4x20)の特徴量(学習済み) モデル構造 : 前回と同様
  21. 49 追加考察 Discriminatorの各層でPerceptual loss(⻘枠)のみを最⼩化 (a) 1層⽬(Conv layer, 14x14x64) (b) 2૚໨(Conv

    layer, 7x7x128) (c) 4૚໨(FC layer, 4096) -> MSE loss͕ͳ͍৔߹ɺ͔ͳΓ݁Ռ͕ѱԽ(ݪҼʹ͍ͭͯ͸ݴٴͳ͠ʣ 0 9 .
  22. 50 発表論⽂(再掲) 1. The Perception-Distortion Tradeoff - 元画像と再構成時の確率分布の違いを分析 - ⽬的関数に関係なく、視覚情報と歪みにトレードオフがある

    2. On The Classification-Distortion-Perception Tradeoff - ্ͷݚڀΛࣝผਫ਼౓ͱͷؔ܎ੑʹ֦ு - 3ͭͦΕͧΕͷpairؒʹରͯ͠τϨʔυΦϑ͕͋Δ 3. Rethinking Lossy Compression: The Rate-Distortion-Perception Tradeoff - 1. ͷݚڀΛBit rate ( ѹॖʣٕज़ͱͷؔ܎ੑʹ֦ு - ѹॖ཰ʹΑͬͯɺPerceptual loss͕ػೳ͠ͳ͍৔߹͕͋Γʁ