Slide 5
Slide 5 text
Composed image retrieval for remote sensing
5
● 膨大にある衛星画像を検索する上で画像検索の技術が重要になるが、画像検索分野では、画像-画像の検
索、text-画像の検索などの単一モダリティの限界があった
● そこで、CLIP (Contrastive Language-Image Pre-Training)のモデルを活用することでトレーニングせずにテキスト
と画像を使った手法を提案
● また、PatternComと呼ばれる評価用データセットを提案している
● このデータセットにはクラスのcolor, context, density, existence, quantity, shape, size or textureの属性をユー
ザーがラベルづけしていて、属性に基づいて画像検索を可能にしている
画像とテキストを用いて衛星画像を検索する組み合わせ画像検索タスク・手法を導入
Bill Psomas et al. (2024), “Composed image retrieval for remote sensing”, arXiv. より引用