Slide 16
Slide 16 text
16
Building Detection Pipeline: U-Net
▪ AOI単位で 5-fold にデータを分割
▪ 各foldで、U-Net (w/ EfficientNet-B3 encoder) を学習
▪
▪ 入力: 3x or 4x の解像度に upsample した RGB 単フレーム
▪ 出力: 3-channel mask (building body, edge, and contact)
footprint_mask = body × (1 - 0.5 × edge) × (1 - contact)
画像は[2]より引用