Slide 17
Slide 17 text
AI 17
CoTracker, CoTracker3 (ECCV’24, arxiv)
▪ CoTracker
▪ MLP-MixerをTransformerに置き換え
▪ 追跡点間でのattentionにより追跡点同士の関係性を考慮
▪ 追跡点の情報を少数のトークン (プロキシートラック) に集約することにより計算量を削減
▪ 全追跡点からプロキシートラックへattentionは行うが逆方向へのattentionは行わない
▪ 補助的なクエリポイントを追加することで性能向上を確認
▪ CoTracker3
▪ 合成画像とともに擬似ラベルを付与した実画像でも学習
▪ 合成画像で学習させた既存モデルをアンサンブルして教師モデルとして使用
▪ 学習に用いる実画像データの増加でどこまで性能向上するか確認
追跡点数 フレーム数
プロクシー
トラック数