Upgrade to Pro — share decks privately, control downloads, hide ads and more …

photo-realistic-single-image-super-resolution-u...

 photo-realistic-single-image-super-resolution-using-a-generative-adversarial-network

画像の超解像度化に対して、GANをつかったモデルSRGANを提案した論文 photo-realistic-single-image-super-resolution-using-a-generative-adversarial-network の紹介です。

Yamaguchi Takahiro

January 15, 2020
Tweet

More Decks by Yamaguchi Takahiro

Other Decks in Technology

Transcript

  1. Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network https://ieeexplore.ieee.org/document/8099502

    • Twitterの人 • 2017年の論文 Image Super-Resolution (画像の超解像度化) を Photo-Realistic にするやつ
  2. RMSE 最小化ってほんとにいいの? RMSEの最小化は決して写真ぽい (Photo-Realistic な) 画像ではない • RMSE=pixel-wiseなロス • 全体の傾向(texture)は無視されがち

    • upsample factor が大きい(大体4ぐらい)で既存手法では細かいテクスチャが消 されてしまう ex: fig2) • 左から二番目が loss=RMSE のとき。のっぺりしている感じ。
  3. ネットワークのアーキテクチャ 基本的には DCGANと同じ • Discriminator: 判別機 • Generator: 画像作成機 それぞれ以下のポリシーで最適化していく

    • D: 超解像度化で生成した画像と元の画像を判定できる • G: Dにバレないように超解像度画像を生成する
  4. Generator のロス関数 Generatorのロス関数を content Loss と adversarial loss の足しあわせで表現 •

    adversarial loss: Dにバレていないかどうか(いつもどおり) • content loss: 元の画像に近いかどうか ◦ 通常だと content loss は RMSE・がこれは写真ぽくない ◦ この部分をVGGを使った特徴空間で作り直す
  5. 実験条件 • タスク: 元画像を1/4に縮小した画像をもとに戻す (upsample scale = 4) • モデル

    ◦ SRResNet: RMSE + ResNet ◦ SRGAN-VGG_ij: ContentLoss + GAN. VGGで使う層で添字がついてる (大きいほど深い層でRMSEを取る) • 評価指標: RMSE と MOS (Mean Opinion Score) ◦ MOS: 26の人間にそれぞれのモデルの画像を見てもらってクオリティを5段 階評価したもの
  6. 結果 • 指標ごとに異なる傾向 ◦ PSNR: SRResNet > SRGAN ◦ MOS:

    SRGAN > SRResNet • SET14では層が深いほどMOSが良い 結果に
  7. 結果: モデルごとの人の評価 histgram • HR (元画像) の次は SRGAN • RMSE

    で良い画像を人がいい (きれい)と 思うわけではない
  8. 結果: Summary • PSNR: SRResNet / MOS: SRGAN なことがわかる •

    どちらも良くすることは難しい。trade-off な関係 [参考文献1]