Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ICCV2025論文紹介:SAM2Long
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
hinako0123
December 13, 2025
0
130
ICCV2025論文紹介:SAM2Long
hinako0123
December 13, 2025
Tweet
Share
More Decks by hinako0123
See All by hinako0123
ICCV2025論文紹介:FlowEdit
hinako0123
0
93
ICCV2025現地参加報告
hinako0123
0
120
ECCV2024現地参加報告
hinako0123
0
17
CVPR2025現地参加報告
hinako0123
0
110
CVPR2025論文紹介:動画像分類
hinako0123
0
78
CVPR2025論文紹介:Segmentation
hinako0123
0
180
ECCV2024論文紹介:Vision & Language
hinako0123
0
150
ECCV2024論文紹介:Continual learning, Object detection
hinako0123
0
180
ECCV2024論文紹介:SAM
hinako0123
0
160
Featured
See All Featured
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
280
Balancing Empowerment & Direction
lara
5
900
Ethics towards AI in product and experience design
skipperchong
2
200
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
66
37k
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
58
50k
Automating Front-end Workflow
addyosmani
1371
200k
How to build a perfect <img>
jonoalderson
1
4.9k
Designing for Timeless Needs
cassininazir
0
130
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
77
The Invisible Side of Design
smashingmag
302
51k
How GitHub (no longer) Works
holman
316
140k
New Earth Scene 8
popppiees
1
1.5k
Transcript
第63回名古屋CV・PRML勉強会 ICCV2025論文読み 名城大学 堀田研M2 光岡日菜子
自己紹介 光岡日菜子 • 名城大学 堀田研究室M2 • 名古屋CV・PRML勉強会幹事(2024/4~) 趣味:イラスト/ MT車 研究:Action
Segmentation/ SemSeg 2 @ramentabetai__1 @nagoyacv conpass HP
今回の発表内容 3 ICCV2025で発表されたSAM2関連の論文について • 「SAM」とタイトルにある本会議採択論文は15件ほど • CVPR2025以降SAM2ベースの論文も増加傾向 MedSAM2 DAM4SAM(CVPR2025)
SAMWISE(CVPR2025)
SAM2(ICLR2025) 4 2024年7月29日発表 Segment Anything Model(ICCV2023) からの変化 •
動画に対応 • Image EncoderにHiera(ICML2023)を利用→精度と処理速度の向上 • Memory Attentionなどの過去の情報を利用する機構の追加
SAM2の課題 5 特殊なドメインへの適応 • 自然画像による事前学習の影響 物体が混雑している場合の誤追跡 • 外観が似ている物体, 一定期間の遮蔽がある場合難しくなる
エラーの蓄積 • Memory Bankによる影響 • 一度誤った情報が保存されると後続の予測も汚染されていく https://arxiv.org/pdf/2411.11922より引用
本日紹介する論文 6 ド キ ュ メ ン ト SAM2Long: Enhancing
SAM 2 for Long Video Segmentation with a Training-Free Memory Tree Shuangrui Ding, Rui Qian, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Yuwei Guo, Dahua Lin, Jiaqi Wang
概要 7 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree タスク:Video Object Segmentation (VOS) 学習不要, SAM2が保存する過去の情報の選び方を変える SAM2がエラーを蓄積させてしまう課題に対処 ド キ ュ メ ン ト
研究背景 8 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree SAM2のMask Decoderは現在のフレームについて3つの予測マスクを生成 → 3つのうちIoUスコアの最も高いマスクが最終出力となりメモリとして使用される 一度でも最終出力の選定を誤ると修正できない ド キ ュ メ ン ト 対象物体が 見えるかどうか
提案手法 9 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree P個の経路を用意し各フレームに対し経路毎に3つのマスクを出力 ド キ ュ メ ン ト 経路① 経路②
提案手法 10 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree 各経路において累計スコアSが上位P個の経路のマスクをメモリとして採用→繰り返し ド キ ュ メ ン ト
提案手法 11 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree Occlusionスコアが閾値を下回る場合=物体が見えていない状態のためミスしやすい → 位置や形状が異なるマスクをあえて採用 ミスが伝播していくのを防ぐ ド キ ュ メ ン ト
提案手法 12 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree 全フレームを処理し終えた後, 最も累計スコアSが高い経路のマスクの履歴を最終出力とする → 長期的な品質を重視するため長時間動画に強い ド キ ュ メ ン ト
実験結果 13 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree 主要ベンチマークにおいてSAM2よりも高精度 長時間の動画への耐性も向上 ド キ ュ メ ン ト J:Jaccard係数(領域精度), F:F score(輪郭の精度)
実験結果 14 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree 物体の遮蔽・重なりに強い ド キ ュ メ ン ト
まとめ 16 SAM2Longを紹介 • 学習不要でSAM2のVOS性能を強化 • 長時間の動画や物体の重なりに強い 先月SAM3が登場
• 基盤モデル系の研究は新モデルが出るとまたそれを追う形になりがち • 新しいモデルにも使える汎用的な機構の方が生き残りやすいか • ECCV2026あたりからSAM3ベースの手法が出てきそう