本資料はSatAI.challengeのサーベイメンバーと共に作成したものです。
SatAI.challengeは、リモートセンシング技術にAIを適用した論文の調査や、
より俯瞰した技術トレンドの調査や国際学会のメタサーベイを行う研究グループです。
speakerdeckではSatAI.challenge内での勉強会で使用した資料をWeb上で共有しています。
https://x.com/sataichallenge
紹介する論文は、「EarthDial: Turning Multi-sensory Earth Observations to Interactive Dialogues」です。
本研究は、RGB・SAR・NIR・IR・時系列・可変解像度など“多モダリティ”の
地球観測画像を、対話での説明・分類・検出・グラウンディング・変化把握まで
一つでこなすEO特化VLMです。
11.11M指示データで段階学習し(AHR+Data Fusion)、44下流タスクで
汎用/分野特化VLMを安定して上回り、EOタスク自動化の新標準を目指してます。