Upgrade to Pro — share decks privately, control downloads, hide ads and more …

HoliTracer:Holistic Vectorization of Geographic...

HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery

本資料はSatAI.challengeのサーベイメンバーと共に作成したものです。
SatAI.challengeは、リモートセンシング技術にAIを適用した論文の調査や、
より俯瞰した技術トレンドの調査や国際学会のメタサーベイを行う研究グループです。
speakerdeckではSatAI.challenge内での勉強会で使用した資料をWeb上で共有しています。
https://x.com/sataichallenge
紹介する論文は、「HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery」です。本研究は、大規模衛星画像から地理空間オブジェクトをまるごと(Holisticに)ベクトル化する手法を提案しています。既存のベクトル化手法は、衛星画像を224x224などの小さな画像パッチに分割して処理するため、広域的なコンテキストの損失やパッチの境界ノイズが課題でした。
大域的なコンテキストを踏まえて、地物を整合的にベクトル化するフレームワークにより、10000x10000を超えるサイズの画像中における、建物、水域、道路といった多様なオブジェクトを含む大規模データセットで、既存のSOTA手法を大幅に上回り、精度の高いベクトル化を達成しました。

Avatar for SatAI.challenge

SatAI.challenge

September 30, 2025
Tweet

More Decks by SatAI.challenge

Other Decks in Research

Transcript

  1. HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery

    [ICCV2025]
 河内 大輝
 1 第19回 SatAI.challenge勉強会

  2. 目次 
 2 • 自己紹介スライド
 • 研究の1ページサマリ紹介 
 • 研究の背景(Introduction)

    
 • 提案手法について(Method) 
 • 実験結果(Experiment) 
 • 結論(Conclusion)

  3. 河内 大輝 業務/研究歴など - 大学・大学院:衛星画像対象AIモデルと説明可能性の研究など - 業務 - Computer VisionなどAI技術を使った野球チーム強化

    - GIS x AI Agentアプリの開発(PLATEAUハッカソンから事業化) 好きな分野 :Computer Vision(特にdeep以外)とGeospatialな領域 自己紹介 X: https://x.com/kwchrk_ LinkedIn: linkedin.com/in/hiroki-kawauchi 4
  4. HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery

    
 6 • 既存のベクトル化(ポリゴン化)手法は、衛星画像を224x224などの小さな画像パッチに分割して 
 処理するため、広域的なコンテキストの損失やパッチの境界ノイズが課題。 
 • 大域的なコンテキストを踏まえて、地物を整合的にベクトル化するフレームワークを提案。 
 • 10000x10000を超えるサイズの画像中における、建物、水域、道路といった多様なオブジェクトを含む大規模 データセットで、既存のSOTA手法を大幅に上回り、精度の高いベクトル化を達成。 
 • Code: https://github.com/vvangfaye/HoliTracer 
 大規模衛星画像から地理空間オブジェクトをまるごと(Holisticに)ベクトル化する 
 Wang et al. (2025), “HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery”, ICCV. より引用
  5. • 近年では、解像度数十cm級の衛星画像が扱われることも増え、1つの建物等が数千ピクセルに及ぶことも珍 しくない。
 • 一方で、既存のベクトル化手法は、一般的なComputer Vision手法を援用したものが多く、計算量の制約もあ り、224x224などのピクセル程度の小さな画像(パッチ)しか扱えない。 
 • 解像度を落とさないためには、パッチ分割して処理を行うが、これには2つの課題がある。

    
 ◦ 広域コンテキストの損失 
 ▪ パッチ化により、オブジェクトを正しく認識するために必要な周囲の情報が損失 
 (例:建物の屋上と駐車場を誤認識) 
 ◦ 境界ノイズ
 ▪ パッチの境界でオブジェクトが分断され、不完全で断片的なベクトルデータに 
 背景: Large-size Challenge(大規模衛星画像処理の課題) 
 8 Wang et al. (2025), “HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery”, ICCV. より引用
  6. HoliTracerは、以下のシンプルな3ステップで大規模画像の直接的な推論に挑んだ 
 • ①大域的セグメンテーション : 大域的なコンテクストを踏まえてセグメンテーションマスクを抽出。 • ②ポリゴン再構成 : マスクの輪郭を整形し、後続処理に適したクリーンなポリゴンを生成。

    • ③ポリゴンリファインメントと頂点の特定 : ポリゴン形状を調整し、最終的な頂点を特定しベクトル化。 
 Holitracerの全体像 
 11 Wang et al. (2025), “HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery”, ICCV. より引用
  7. ①Context Attention Net (CAN) 
 • モチベ
 ◦ 大域的なコンテクストを踏まえて推論するための Attentionを導入


    • 仕組み
 ◦ Multi-Scale Image Pyramid 
 ▪ 元の高解像度画像から複数の異なる解像度の 画像を作成し、入力
 ◦ Context Attention:
 ▪ Encoderで各スケールの画像から特徴を抽出 
 ▪ 高解像度・低解像度特徴をAttentionで融合。 
 • ※あくまで、モデルの入出力は512*512 
 ◦ 高解像度の入力をAttention用に入れることで、大域的 なコンテキストを入力している 
 ①大域的セグメンテーション 
 12 Wang et al. (2025), “HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery”, ICCV. より引用
  8. ②ポリゴン再構成 
 13 Wang et al. (2025), “HoliTracer:Holistic Vectorization of

    Geographic Objects from Large-Size Remote Sensing Imagery”, ICCV. より引用 ②Mask Contour Reformer (MCR) 
 • モチベ
 ◦ CANのマスクは頂点の密集などノイズが多い 
 ◦ 頂点密度等を整えたクリーンなポリゴンにして、 
 ③のリファインメントモデルの入力にする 
 • 仕組み
 ◦ 単純化
 ▪ Douglas-Peuckerアルゴリズムで、 
 輪郭の冗長な頂点を削減 
 ◦ 再構成(補間) 
 ▪ 単純化されたポリゴンの辺に沿って、 
 一定間隔で点を再配置(補間) 
 • GTのポリゴンにも補間を適用 することで、形状の学習がしや すいようにする

  9. ②ポリゴン再構成 
 14 Wang et al. (2025), “HoliTracer:Holistic Vectorization of

    Geographic Objects from Large-Size Remote Sensing Imagery”, ICCV. より引用 ②Mask Contour Reformer (MCR) 
 • モチベ
 ◦ CANのマスクは頂点の密集などノイズが多い 
 ◦ 頂点密度等を整えたクリーンなポリゴンにして、 
 ③のリファインメントモデルの入力にする 
 • 仕組み
 ◦ 単純化
 ▪ Douglas-Peuckerアルゴリズムで、 
 輪郭の冗長な頂点を削減 
 ◦ 再構成(補間) 
 ▪ 単純化されたポリゴンの辺に沿って、 
 一定間隔で点を再配置(補間) 
 • GTのポリゴンにも補間を適用 することで、形状の学習がしや すいようにする

  10. ③Polygon Sequence Tracer (PST) 
 • モチベ
 ◦ ②MCRで推論されたポリゴンの洗練 


    ◦ 最終的な頂点の特定 
 • 仕組み(Transformerベースの系列処理) 
 ◦ 各頂点に対して、以下の2つのタスクを同時に 実行。
 ◦ オフセット回帰 
 ▪ 頂点の位置をより正確な位置に微調整 
 ◦ 頂点分類: 
 ▪ その点がポリゴンの「角」(真の頂点)で あるか、「辺の途中」か分類 
 • 特徴: 頂点間の角度情報も特徴量・損失として利用 することで、角の検出精度を向上 
 
 ③ポリゴンリファインメントと頂点の特定 
 15 Wang et al. (2025), “HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery”, ICCV. より引用
  11. • データセット: 3種類の大規模・高解像度データセットを使用。 
 ◦ WHU-building: 建物抽出 (解像度0.075m) 
 ◦

    GLH-water: 水域抽出 (解像度0.3m) 
 ◦ VHR-road: 道路抽出 (本研究で新規構築、解像度0.2m) 
 ▪ 各サンプルは10,000 x 10,000ピクセル超。 
 • 比較手法 
 ◦ 既存のパッチベースのSOTA手法 (FFL, HiSup, DeepSnake, UniVecなど) 
 • 評価指標 
 ◦ Vector metrics (PoLiS, CIoU): ポリゴン形状の類似度。 
 ◦ Instance metrics (AP): オブジェクト単位の検出・セグメンテーション精度。 
 ◦ Semantic metrics (IoU, F1): ピクセル単位のセグメンテーション精度。 
 
 • 手法はシンプルだが、実験を丁寧にAblation Studyを含めて行い、githubも公開している 👏
 実験設定 
 17 Wang et al. (2025), “HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery”, ICCV. より引用
  12. • Holitoracer (Ours)は、地物を問わず大域的に整合的でGTに近い滑らかなポリゴン推論ができていそう 
 定性結果 
 18 Wang et al.

    (2025), “HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery”, ICCV. より引用
  13. • 精度:定量指標においても、画像全体を対象とした指標において、SOTAを大幅に更新 
 定量結果 
 19 Wang et al. (2025),

    “HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery”, ICCV. より引用
  14. • 計算コスト
 ◦ 学習:NVIDIA 24GB以上の GPUが必要とのこと(著者実験は4x40GB NVIDIA A100 GPUs) 


    ◦ 推論:1枚(10000 x 10000程度?)・2GB・500s 
 ▪ 40,000 × 50,000 ピクセルまでは、64GB CPU RAMで扱えることを確認 
 ▪ GPUベースの並列化処理により高速化の実装も行っている(詳しくはgithub参照) 
 定量結果 
 20 Wang et al. (2025), “HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery”, ICCV. より引用
  15. • 論文の一番大事なところだが、①大域的セグメンテーションの影響はそこまで大きくない 
 ◦ Contextが1=元の解像度のみに比べて1-2ポイント上昇はしている 
 ◦ ただ、他の既存手法と差がついているのは、後段の②MCRや③PSTによるポリゴン整形部分 
 •

    つまり、大域的な画像特徴を入れることではなく、大域的な単位でポリゴンを整えることが実質的な精度向上 に寄与
 Ablation Study 
 21 Wang et al. (2025), “HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery”, ICCV. より引用
  16. HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery

    
 24 • 既存のベクトル化(ポリゴン化)手法は、衛星画像を224x224などの小さな画像パッチに分割して 
 処理するため、広域的なコンテキストの損失やパッチの境界ノイズが課題。 
 • 大域的なコンテキストを踏まえて、地物を整合的にベクトル化するフレームワークを提案。 
 • 10000x10000を超えるサイズの画像中における、建物、水域、道路といった多様なオブジェクトを含む大規模 データセットで、既存のSOTA手法を大幅に上回り、精度の高いベクトル化を達成。 
 • Code: https://github.com/vvangfaye/HoliTracer 
 大規模衛星画像から地理空間オブジェクトをまるごと(Holisticに)ベクトル化する 
 Wang et al. (2025), “HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery”, ICCV. より引用