Lock in $30 Savings on PRO—Offer Ends Soon! ⏳

ICCV2025論文紹介:FlowEdit

Avatar for hinako0123 hinako0123
December 14, 2025
43

 ICCV2025論文紹介:FlowEdit

Avatar for hinako0123

hinako0123

December 14, 2025
Tweet

Transcript

  1. ICCV2025 Best student paper FlowEdit: Inversion-Free Text-Based Editing Using Pre-Trained

    Flow Models 中京大学 工学研究科 橋本研究室 村上 尚生 CV勉強会 Dec. 13, 2025 Vladimir Kulikov, Matan Kleiner, Inbar Huberman-Spiegelglas, Tomer Michaeli
  2.  Diffusion / Flow モデルを用いたT2I画像編集の主流  Editing by inversion 1.

    ソース画像をノイズ空間に変換(inversion) 2. ターゲットテキストをもとにノイズ空間からターゲット画像を生成 研究背景  問題点 1. ノイズ空間を経由するため画像構造が 壊れやすい 2. モデル依存な解決策しか提案されてい ない(モデルの内部表現利用など)
  3.  従来: ノイズ空間の経由したパスで構成 1. 𝑍𝑍0 𝑠𝑠𝑠𝑠𝑠𝑠 ソース画像 → 𝑍𝑍1 𝑠𝑠𝑠𝑠𝑠𝑠

    ノイズ 2. 𝑍𝑍1 𝑡𝑡𝑡𝑡𝑡𝑡 ノイズ = 𝑍𝑍1 𝑠𝑠𝑠𝑠𝑠𝑠 ノイズ 3. 𝑍𝑍1 𝑡𝑡𝑡𝑡𝑡𝑡 ノイズ → 𝑍𝑍0 𝑡𝑡𝑡𝑡𝑡𝑡 ターゲット画像 着想: Editing by inversion の再解釈  再解釈: ソースからターゲットへの直接パス  𝑍𝑍𝑡𝑡 𝑖𝑖𝑖𝑖𝑖𝑖 = 𝑍𝑍0 𝑠𝑠𝑠𝑠𝑠𝑠 + 𝑍𝑍𝑡𝑡 𝑡𝑡𝑡𝑡𝑡𝑡 − 𝑍𝑍𝑡𝑡 𝑠𝑠𝑠𝑠𝑠𝑠  直接パスはODEの解になる. 1. 𝑑𝑑𝑍𝑍𝑡𝑡 𝑖𝑖𝑖𝑖𝑖𝑖 = 𝑉𝑉𝑡𝑡 ∆ 𝑍𝑍𝑡𝑡 𝑠𝑠𝑠𝑠𝑠𝑠, 𝑍𝑍𝑡𝑡 𝑡𝑡𝑡𝑡𝑡𝑡 𝑑𝑑𝑑𝑑 2. 𝑑𝑑𝑑𝑑𝑡𝑡 𝑖𝑖𝑖𝑖𝑖𝑖 = 𝑉𝑉𝑡𝑡 ∆ 𝑍𝑍𝑡𝑡 𝑠𝑠𝑠𝑠𝑠𝑠, 𝑍𝑍𝑡𝑡 𝑖𝑖𝑖𝑖𝑖𝑖 + 𝑍𝑍𝑡𝑡 𝑠𝑠𝑠𝑠𝑠𝑠 − 𝑍𝑍0 𝑠𝑠𝑠𝑠𝑠𝑠 𝑑𝑑𝑑𝑑  tが大きいほど画像粗い差分を捉える  tが小さいほど画像の細かい差分を捉 える  再解釈ではノイズ空間を経由しない
  4.  FlowEditとは  Inversion-free / Model-agnosticな画像編集手法  Source→Target 分布を 直接ODEで輸送

     ガウシアンノイズ分布を経由しないため,輸送コストが小さく,画像構造の保存性が高い  Stable Diffusion 3 や FLUX に適用した場合,SoTA編集品質を達成  Limitation  画像構造を極力壊さないという設計思想のため大規模な画像編集が苦手  背景の全面変更(右図参照)  対象のポーズ変更  カメラ視点の大きな移動など 結論