Slide 10
Slide 10 text
手法
10
EarthSynth
1. データ収集 & EarthSynth-180Kの構築
● 公開データセットを統合:OEM、LoveDA、DeepGlobeなど
● 各画像に対して:
○ セマンティックマスク(m)
○ テキスト説明(t)を自動/半自動で生成
● 180,000件の (画像, マスク, テキスト) トリプレット
2. モデル学習
● Stable Diffusion v1.5をベースに再学習
● 条件付き入力:セマンティックマスク m, テキスト t
● セマンティクス強化
○ CF-Comp(物体と背景の動的合成)
○ Local/Global Lossによる空間制御
Jiancheng Pan et al. (2025),”EarthSynth: Generating Informative Earth Observation with Diffusion Models’, arXiv. より引用