Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Galileo: Learning Global & Local Features of Ma...

Galileo: Learning Global & Local Features of Many Remote Sensing Modalities

本資料はSatAI.challengeのサーベイメンバーと共に作成したものです。
SatAI.challengeは、リモートセンシング技術にAIを適用した論文の調査や、より俯瞰した技術トレンドの調査や国際学会のメタサーベイを行う研究グループです。speakerdeckではSatAI.challenge内での勉強会で使用した資料をWeb上で共有しています。
https://x.com/sataichallenge
紹介する論文は、「Galileo: Learning Global & Local Features of Many Remote Sensing Modalities」です。この研究では、従来のRemote Sensing FMよりも多くの入力データに対応した衛星画像Foundation Modelを構築しています。従来は光学画像のみに対応しているFMが大半でしたが、光学衛星に加えSAR・標高・気象データなど幅広いデータを教師データにすることで幅広いダウンストリームタスクに対応できるようにしました。グローバル特徴とローカル特徴を用い、ラベルを必要としない自己教師あり学習する手法を採用することでリモートセンシングで問題となる数ピクセルの事象から数千ピクセルの事象まで幅広い範囲で利用できるようになりました。その結果11のリモートセンシング系のベンチマークでSoTAを超える性能を達成しました。

Avatar for SatAI.challenge

SatAI.challenge

June 26, 2025
Tweet

More Decks by SatAI.challenge

Other Decks in Research

Transcript

  1. Galileo: Learning Global & Local Features of Many Remote Sensing

    Modalities
 
 二村忠宏
 1 第12回 SatAI.challenge勉強会

  2. Galileo: Learning Global & Local Features of Many Remote Sensing

    Modalities 
 5 • 従来は光学に対応しているものが大半であったが、光学衛星に加えSAR・標高・気象データなど幅広いデータを 教師データにすることで幅広いダウンストリームタスクに対応できるようにした 
 • 基本構造についてはViTを使用しているが、リモートセンシング特有の数ピクセルの問題(例えば船舶関連)から 数千ピクセルの問題(例えば氷河など)に対応するため、グローバル特徴とローカル特徴を同時にラベルを必要 としない自己教師あり学習する手法を採用 
 • 11のリモートセンシング系ベンチマークにおいてSOTAを超える性能を発揮 
 従来のRemote Sensing FMよりも多くの入力データに対応した衛星画像 Foundation Model 
 Gabriel Tseng et al. (2025), “Galileo: Learning Global & Local Features of Many Remote Sensing Modalities”, arXiv:2502.09356 [cs.CV], 2025 より引用
  3. • リモートセンシングデータは光学/SAR/気象/地形/夜間光など多種多様に存在 
 • またスケールについても1px単位の船舶から数千pxを対象とする氷河まで存在する 
 • 加えて時間間隔についても対象とする事象において変化(数日~数年単位) 
 •

    またラベル付きデータについてもグローバルスケールでは乏しい(特に発展途上国など) 
 ◦ 自己教師あり学習により解決を図る必要性 
 
 背景および現状の課題 
 7 Gabriel Tseng et al. (2025), “Galileo: Learning Global & Local Features of Many Remote Sensing Modalities”, arXiv:2502.09356 [cs.CV], 2025 より引用 Sentinel-2撮影の船舶と氷河の例 

  4. • 既存のSoTAモデルの多くは専用設計になっておりマルチモダリティに対応したモデルは少ない 
 ◦ SatMAE、CROMA:単時刻画像・MS/SARに特化 
 ◦ Presto:時系列の分析が可能だが、ピクセル単位の分析に特化 
 ◦

    AnySat:複数モダリティに対応 
 • 入力形状、対象タスク、モダリティごとに異なるモデルが必要な点はかなり非効率 
 • また多くはNDVI、標高、気象データなど従来の現場で有効とされているモダリティが使用できない場合がある 
 従来手法の限界 
 8 Gabriel Tseng et al. (2025), “Galileo: Learning Global & Local Features of Many Remote Sensing Modalities”, arXiv:2502.09356 [cs.CV], 2025 より引用
  5. • Vision Transformer(ViT)ベースのモデル 
 • 対応する入力画像
 ◦ 単画像
 ◦ 画像時系列


    ◦ ピクセル単位の時系列 
 • 対応モダリティ
 ◦ Sentinel-1(SAR)
 ◦ Sentinel-2(MS)
 ◦ NDVI
 ◦ 標高
 ◦ 傾斜
 ◦ 気象(ERA5)
 ◦ 夜間光など
 
 • 多様なリモートセンシングタスク(分類・セグメンテーション・時系列分類)でSoTA性能を発揮 
 Galileoの概要 
 9 Gabriel Tseng et al. (2025), “Galileo: Learning Global & Local Features of Many Remote Sensing Modalities”, arXiv:2502.09356 [cs.CV], 2025 より引用
  6. モデルの主要構成 
 10 • 自己教師あり学習(SSL)により学習(ラベル不要) 
 • Dual SSLを採用
 ◦

    Globalタスク:空間・時間的に広い範囲を対象とし、深層特徴を学習 
 ◦ Localタスク:ランダムにマスクし、浅層特徴を学習(微小物体に対応) 
 • これら2つの予測器で学習し、損失は加重平均 
 • 損失に関してはPatch Discriminationを採用 
 Gabriel Tseng et al. (2025), “Galileo: Learning Global & Local Features of Many Remote Sensing Modalities”, arXiv:2502.09356 [cs.CV], 2025 より引用
  7. Pretrained Data 
 11 Gabriel Tseng et al. (2025), “Galileo:

    Learning Global & Local Features of Many Remote Sensing Modalities”, arXiv:2502.09356 [cs.CV], 2025 より引用 • Sentinel-1(VV, VH)、Sentinel-2 など127,155インスタンス。下図ベースで地球全域から空間的にサンプリング 
 • 画像サイズは96x96パッチ、24か月分、10m解像度にリサンプリング 
 
 • モダリティ
 ◦ 空間×時間:S1-SAR, S2-MS, NDVI 
 ◦ 空間のみ:標高、地形、土地被覆分類 
 ◦ 時間のみ:気象(ERA5), 夜間光 
 ◦ 静的:人口、緯度経度  

  8. 実験結果 
 12 Gabriel Tseng et al. (2025), “Galileo: Learning

    Global & Local Features of Many Remote Sensing Modalities”, arXiv:2502.09356 [cs.CV], 2025 より引用 Image Classification Task 
 Image Segmentation Task 
 Timeseries Classification Task 

  9. Ablations 
 13 Gabriel Tseng et al. (2025), “Galileo: Learning

    Global & Local Features of Many Remote Sensing Modalities”, arXiv:2502.09356 [cs.CV], 2025 より引用
  10. 14 Conclusion 
 • Galileoは従来のリモートセンシングFMよりも多くのモダリティに対応し、損失を工夫することによりリモートセン シングデータを扱ううえで問題となるグローバル性・ローカル性の双方に対応することに成功した 
 • その結果多くのタスクにおいてSoTAを示しており、リモートセンシングFMとして有用であると考えられる。 


    • モダリティ性が上がったことにより、今まではモデルをそれぞれ用意したタスクに対しても一つのモデルで可能 となり利便性が上がっている 
 • モデルなどはGithub( https://github.com/nasaharvest/galileo )にて公開中
 Gabriel Tseng et al. (2025), “Galileo: Learning Global & Local Features of Many Remote Sensing Modalities”, arXiv:2502.09356 [cs.CV], 2025 より引用