Slide 21
Slide 21 text
実験設定
・事前学習に使用したデータセットはSkySense V1と全く同じ。
合計 2,150万 のトレーニングサンプル
モダリティ センサ バンド名 バンド数 空間分解能 時系列 サンプル数
HR 光学 (RGB)
高解像度商用光学
(例: WorldView-3/4 等) R, G, B 3 高解像 (HR) 単時刻 (T=1) 21500000
MS (Sentinel-2) Sentinel-2 (MS)
B2,B3,B4,B5,B6,B7,B8,
B8A,B11,B12 10 中解像 時系列 (平均T=10) 21500000
SAR (Sentinel-1) Sentinel-1 (SAR) VV, VH 2 中解像 時系列 (平均T=10) 21500000
・Pre-trainingのパラメータ
項目 設定 補足
初期トークン次元 C 352 バックボーン全体で共通
SwinV2B ウィンドウサイズ(Stage1-2) 8 前半2ステージのみ
Attention ヘッドの Query 次元 32 全ブロックで一貫
MLP 拡張率 ×4 全ブロックで一貫(2層全結合)
プロンプトトークン(Stage3) 各モダリティ 4 後半2ステージのみ挿入
プロンプトトークン(Stage4) 各モダリティ 4 後半2ステージのみ挿入
・Pre-trainingの計算資源
バッチサイズ 1024, 128機のH20で。詳細はAppendix Cに記載