Slide 18
Slide 18 text
EarthDial: データセット
目的
•多モダリティ・多解像度・多時系列のRS画像に対して、汎化する指示追従(QA)能力を大規模学習で付与。
事前学習ソース & 生成
•ソース:SkyScript, SatlasPretrain(S2, S1(SAR), NAIP, Landsat など+ラベル)。
•生成:InternLM-XComposer2でラベル(点/ポリゴン/カテゴリ/位置)からQA指示を自動作成。
•品質管理:①ラベル数<3除外、②輝度/被覆率で雲・低被覆除去、③属性に基づくプロンプト設計。
下流タスク向け指示データ
•10タスク:分類、検出/参照表現/GRD、VQA、キャプション、変化検知、メタン、樹種、LCZ、UHI、災害評価。
•6視覚モダリティ:Optical RGB, SAR, S2, IR, NIR, Hyperspectral。
•2時系列モダリティ:Optical, SAR。
代表的な設計例
•シーン分類:9標準+多ラベル(BigEarthNet)+時系列(FMoW, ≤4枚/系列)、LCZ・樹種(TreeSatAI-TS)。
• 検出/GRD:タグ{refer, identify, grounding}、属性{カテゴリ/色/相対位置/相対サイズ}、bbox=[xmin,ymin,xmax,ymax,θ]。
•VQA/Caption:6 VQA+5 Caption データセット。
•変化検知:3二値CD+MUDS(マスクを参照し各系列5キャプション生成)。
•メタン:STARCOP(HS) → 有無/位置/排出量を質問。
•UHI:S2/L8からLST/NDVIを計算し温度帯分類+原因/緩和策。
•災害:xBD(前後RGB)+QuakeSet(SAR)で被害/地震発生と規模。
トークン例(条件付け)
• センサー/モダリティ/解像度/時系列を明示:[s2 ms 30], [s1 vh 10], [changedet][hr rgb temp 0.5] など。