Upgrade to Pro — share decks privately, control downloads, hide ads and more …

第5回 3d勉強会 2019/8/31

ilim
August 31, 2019

第5回 3d勉強会 2019/8/31

Towards Scene Understanding:
Unsupervised Monocular Depth Estimation with Semantic-aware Representation

ilim

August 31, 2019
Tweet

Other Decks in Science

Transcript

  1. Towards Scene Understanding: Unsupervised Monocular Depth Estimation with Semantic- aware

    Representation 2019/8/31 第5回 3D勉強会@関東 @ilim
  2. Related work ▪ Unsupervised Monocular Depth Estimation with Left-Right Consistency

    (CVPR2017) 左右のペア画像から視差を利⽤し,⼀貫性を持つようにDepthをend-to-endで学習 4
  3. ネットワーク(Disparity) ▪ , . = , = 0 ▪ =

    7 9 , . : concat : デコーダー 9 : pixel-wised avg pooling 7 : sigmoid function 0 8
  4. ネットワーク(Segmentation) ▪ , @ = , = 1 ▪ =

    C , @ : concat : デコーダー C : pixel-wised softmax 1 9
  5. Loss 求めた視差とsegmentation map から以下のようなlossを計算します ▪ ℒ.EFGH : Depth loss ▪

    ℒ@EI : Segmentation loss ▪ ℒJK@C: Semantic consistency loss ▪ ℒ@NOOGH : smoothness loss の4つの重み付き和 ℒ = ℒ.EFGH + @EIℒ@EI + KJ@CℒJK@C + @NOOGHℒ@NOOGH 11
  6. Loss ▪ Depth loss ℒ.EFGH = J − K→J +

    K − J→K + JK J − K→J + K − J→K 画素値とDisparityの再投影誤差 + .@ U W XY. + Z W X[. Depthにsmoothをかけるloss 12
  7. Loss ▪ Segmentation loss ℒ@EI = ℋ IG, ℋ: pixel-wiseなcross-entropy

    loss IG : SegmentationのGTラベル : Scene Net の Segmentation 出⼒ ▪ Sementic consistency loss ℒJK@C = J − K→J + K − J→K Segmentationの再投影誤差 13
  8. Loss ▪ Smoothness loss ℒ@NOOGH = U ⨂ の境目で1 それ以外で0

    同⼀label領域内でのdepthを平坦化するloss 14
  9. 実験 ▪ KITTI(ステレオ画像) ▪ Cityscapes(単⼀画像, segmentation GTあり) の両⽅をあわせて学習 ⼊⼒サイズは256×512 GTX

    1080で32hかけて学習 ℒJK@C = J − K→J + K − J→K はsemantics, disparityの両⽅に依存するので, ℒ.EFGH , ℒ@EI が収束してきてから有効に 15