Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ICCV2025論文紹介:SAM2Long
Search
hinako0123
December 13, 2025
0
110
ICCV2025論文紹介:SAM2Long
hinako0123
December 13, 2025
Tweet
Share
More Decks by hinako0123
See All by hinako0123
ICCV2025論文紹介:FlowEdit
hinako0123
0
81
ICCV2025現地参加報告
hinako0123
0
110
ECCV2024現地参加報告
hinako0123
0
17
CVPR2025現地参加報告
hinako0123
0
99
CVPR2025論文紹介:動画像分類
hinako0123
0
75
CVPR2025論文紹介:Segmentation
hinako0123
0
170
ECCV2024論文紹介:Vision & Language
hinako0123
0
140
ECCV2024論文紹介:Continual learning, Object detection
hinako0123
0
170
ECCV2024論文紹介:SAM
hinako0123
0
160
Featured
See All Featured
Exploring anti-patterns in Rails
aemeredith
2
220
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
590
Darren the Foodie - Storyboard
khoart
PRO
0
2k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
200
Highjacked: Video Game Concept Design
rkendrick25
PRO
0
260
Paper Plane (Part 1)
katiecoart
PRO
0
2.6k
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
0
1.8k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
27
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
The Pragmatic Product Professional
lauravandoore
37
7.1k
Transcript
第63回名古屋CV・PRML勉強会 ICCV2025論文読み 名城大学 堀田研M2 光岡日菜子
自己紹介 光岡日菜子 • 名城大学 堀田研究室M2 • 名古屋CV・PRML勉強会幹事(2024/4~) 趣味:イラスト/ MT車 研究:Action
Segmentation/ SemSeg 2 @ramentabetai__1 @nagoyacv conpass HP
今回の発表内容 3 ICCV2025で発表されたSAM2関連の論文について • 「SAM」とタイトルにある本会議採択論文は15件ほど • CVPR2025以降SAM2ベースの論文も増加傾向 MedSAM2 DAM4SAM(CVPR2025)
SAMWISE(CVPR2025)
SAM2(ICLR2025) 4 2024年7月29日発表 Segment Anything Model(ICCV2023) からの変化 •
動画に対応 • Image EncoderにHiera(ICML2023)を利用→精度と処理速度の向上 • Memory Attentionなどの過去の情報を利用する機構の追加
SAM2の課題 5 特殊なドメインへの適応 • 自然画像による事前学習の影響 物体が混雑している場合の誤追跡 • 外観が似ている物体, 一定期間の遮蔽がある場合難しくなる
エラーの蓄積 • Memory Bankによる影響 • 一度誤った情報が保存されると後続の予測も汚染されていく https://arxiv.org/pdf/2411.11922より引用
本日紹介する論文 6 ド キ ュ メ ン ト SAM2Long: Enhancing
SAM 2 for Long Video Segmentation with a Training-Free Memory Tree Shuangrui Ding, Rui Qian, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Yuwei Guo, Dahua Lin, Jiaqi Wang
概要 7 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree タスク:Video Object Segmentation (VOS) 学習不要, SAM2が保存する過去の情報の選び方を変える SAM2がエラーを蓄積させてしまう課題に対処 ド キ ュ メ ン ト
研究背景 8 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree SAM2のMask Decoderは現在のフレームについて3つの予測マスクを生成 → 3つのうちIoUスコアの最も高いマスクが最終出力となりメモリとして使用される 一度でも最終出力の選定を誤ると修正できない ド キ ュ メ ン ト 対象物体が 見えるかどうか
提案手法 9 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree P個の経路を用意し各フレームに対し経路毎に3つのマスクを出力 ド キ ュ メ ン ト 経路① 経路②
提案手法 10 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree 各経路において累計スコアSが上位P個の経路のマスクをメモリとして採用→繰り返し ド キ ュ メ ン ト
提案手法 11 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree Occlusionスコアが閾値を下回る場合=物体が見えていない状態のためミスしやすい → 位置や形状が異なるマスクをあえて採用 ミスが伝播していくのを防ぐ ド キ ュ メ ン ト
提案手法 12 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree 全フレームを処理し終えた後, 最も累計スコアSが高い経路のマスクの履歴を最終出力とする → 長期的な品質を重視するため長時間動画に強い ド キ ュ メ ン ト
実験結果 13 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree 主要ベンチマークにおいてSAM2よりも高精度 長時間の動画への耐性も向上 ド キ ュ メ ン ト J:Jaccard係数(領域精度), F:F score(輪郭の精度)
実験結果 14 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree 物体の遮蔽・重なりに強い ド キ ュ メ ン ト
まとめ 16 SAM2Longを紹介 • 学習不要でSAM2のVOS性能を強化 • 長時間の動画や物体の重なりに強い 先月SAM3が登場
• 基盤モデル系の研究は新モデルが出るとまたそれを追う形になりがち • 新しいモデルにも使える汎用的な機構の方が生き残りやすいか • ECCV2026あたりからSAM3ベースの手法が出てきそう