Slide 26
Slide 26 text
● Sentinel-2 実画像で実験
○ Sentinel-2っぽい色みを保ったまま
解像度を上げられる
実験: 定性結果③ 汎化性能・他のtext to 画像生成手法との比較
26
● Text to Image手法との比較
○ GPT-4Vや Stable Diffusionでは生成が破綻。
○ MetaEarth は 解像度制御・レイアウトの
妥当性で優位
“Please generate a 4m/pixel-resolution satellite remote sensing image of an urban scene. The image
includes detailed city infrastructure such as roads, buildings, parks, and waterways with clear visibility of
the urban layout and structure.”
GPT-4V Stable Diffusion
MetaEarth
Ernie