Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ICCV2025論文紹介:SAM2Long
Search
hinako0123
December 13, 2025
180
0
Share
ICCV2025論文紹介:SAM2Long
hinako0123
December 13, 2025
More Decks by hinako0123
See All by hinako0123
ICCV2025論文紹介:FlowEdit
hinako0123
0
150
ICCV2025現地参加報告
hinako0123
0
170
ECCV2024現地参加報告
hinako0123
0
27
CVPR2025現地参加報告
hinako0123
0
130
CVPR2025論文紹介:動画像分類
hinako0123
0
100
CVPR2025論文紹介:Segmentation
hinako0123
0
190
ECCV2024論文紹介:Vision & Language
hinako0123
0
160
ECCV2024論文紹介:Continual learning, Object detection
hinako0123
0
190
ECCV2024論文紹介:SAM
hinako0123
0
170
Featured
See All Featured
A better future with KSS
kneath
240
18k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
199
73k
Rails Girls Zürich Keynote
gr2m
96
14k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
120
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
The browser strikes back
jonoalderson
0
1k
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
1
310
Crafting Experiences
bethany
1
140
Design in an AI World
tapps
1
210
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.9k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
9k
What does AI have to do with Human Rights?
axbom
PRO
1
2.1k
Transcript
第63回名古屋CV・PRML勉強会 ICCV2025論文読み 名城大学 堀田研M2 光岡日菜子
自己紹介 光岡日菜子 • 名城大学 堀田研究室M2 • 名古屋CV・PRML勉強会幹事(2024/4~) 趣味:イラスト/ MT車 研究:Action
Segmentation/ SemSeg 2 @ramentabetai__1 @nagoyacv conpass HP
今回の発表内容 3 ICCV2025で発表されたSAM2関連の論文について • 「SAM」とタイトルにある本会議採択論文は15件ほど • CVPR2025以降SAM2ベースの論文も増加傾向 MedSAM2 DAM4SAM(CVPR2025)
SAMWISE(CVPR2025)
SAM2(ICLR2025) 4 2024年7月29日発表 Segment Anything Model(ICCV2023) からの変化 •
動画に対応 • Image EncoderにHiera(ICML2023)を利用→精度と処理速度の向上 • Memory Attentionなどの過去の情報を利用する機構の追加
SAM2の課題 5 特殊なドメインへの適応 • 自然画像による事前学習の影響 物体が混雑している場合の誤追跡 • 外観が似ている物体, 一定期間の遮蔽がある場合難しくなる
エラーの蓄積 • Memory Bankによる影響 • 一度誤った情報が保存されると後続の予測も汚染されていく https://arxiv.org/pdf/2411.11922より引用
本日紹介する論文 6 ド キ ュ メ ン ト SAM2Long: Enhancing
SAM 2 for Long Video Segmentation with a Training-Free Memory Tree Shuangrui Ding, Rui Qian, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Yuwei Guo, Dahua Lin, Jiaqi Wang
概要 7 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree タスク:Video Object Segmentation (VOS) 学習不要, SAM2が保存する過去の情報の選び方を変える SAM2がエラーを蓄積させてしまう課題に対処 ド キ ュ メ ン ト
研究背景 8 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree SAM2のMask Decoderは現在のフレームについて3つの予測マスクを生成 → 3つのうちIoUスコアの最も高いマスクが最終出力となりメモリとして使用される 一度でも最終出力の選定を誤ると修正できない ド キ ュ メ ン ト 対象物体が 見えるかどうか
提案手法 9 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree P個の経路を用意し各フレームに対し経路毎に3つのマスクを出力 ド キ ュ メ ン ト 経路① 経路②
提案手法 10 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree 各経路において累計スコアSが上位P個の経路のマスクをメモリとして採用→繰り返し ド キ ュ メ ン ト
提案手法 11 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree Occlusionスコアが閾値を下回る場合=物体が見えていない状態のためミスしやすい → 位置や形状が異なるマスクをあえて採用 ミスが伝播していくのを防ぐ ド キ ュ メ ン ト
提案手法 12 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree 全フレームを処理し終えた後, 最も累計スコアSが高い経路のマスクの履歴を最終出力とする → 長期的な品質を重視するため長時間動画に強い ド キ ュ メ ン ト
実験結果 13 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree 主要ベンチマークにおいてSAM2よりも高精度 長時間の動画への耐性も向上 ド キ ュ メ ン ト J:Jaccard係数(領域精度), F:F score(輪郭の精度)
実験結果 14 SAM2Long: Enhancing SAM 2 for Long Video Segmentation
with a Training-Free Memory Tree 物体の遮蔽・重なりに強い ド キ ュ メ ン ト
まとめ 16 SAM2Longを紹介 • 学習不要でSAM2のVOS性能を強化 • 長時間の動画や物体の重なりに強い 先月SAM3が登場
• 基盤モデル系の研究は新モデルが出るとまたそれを追う形になりがち • 新しいモデルにも使える汎用的な機構の方が生き残りやすいか • ECCV2026あたりからSAM3ベースの手法が出てきそう