Slide 5
Slide 5 text
STEP 1: Parameter Autoencoder
オリジナルのStable Diffusionのように潜在空間を学習
Stable Diffusion = 画像 の潜在空間
p-diff = パラメータ の潜在空間
入力を再構成する普通のAutoencoder
データ 学習
モデルパラメータのサブセットを使う
➢ ゼロから学習して、最後のエポックを保存
➢ 学習済みモデルのサブセットをファインチューン
𝑆 = 𝑠1
, … , 𝑠𝑘
, … , 𝑠𝐾
各𝑆 を平坦化して1dベクトル𝑉𝐾×𝐷 = 𝑣1
, … , 𝑣𝑘
, … , 𝑣𝐾
に
このを𝑉入出力としてオートエンコーダを学習
サブセットパラメータの大きさ
➢ 入力側の𝑉と潜在空間𝑍にはランダムノイズでデータ拡張
𝜉𝑉
𝜉𝑍
𝑍
𝑉
𝑣𝑘
≔ 𝑘番目のモデルのパラメータ
K個のモデルがある場合
[Rombach+, “High-Resolution Image Synthesis with Latent Diffusion Models”, CVPR, 2022]