Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
diffusion model, part 3.6, probability flow ODE
Search
Ryo Misawa
April 18, 2023
Science
0
1.3k
diffusion model, part 3.6, probability flow ODE
岡野原さんの「拡散モデル データ生成技術の数理」3.6章 確率フローODE
Ryo Misawa
April 18, 2023
Tweet
Share
More Decks by Ryo Misawa
See All by Ryo Misawa
TextPruner による大規模言語モデルの軽量化 / Large language model pruning using TextPruner
misawann
0
1.2k
Other Decks in Science
See All in Science
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
130
化学におけるAI・シミュレーション活用のトレンドと 汎用原子レベルシミュレーター: Matlantisを使った素材開発
matlantis
0
410
How were Quaternion discovered
kinakomoti321
2
1.2k
白金鉱業Meetup Vol.15 DMLによる条件付処置効果の推定_sotaroIZUMI_20240919
brainpadpr
2
660
Cross-Media Information Spaces and Architectures (CISA)
signer
PRO
3
30k
Reconciling Accuracy, Cost, and Latency of Inference Serving Systems
pjamshidi
0
110
メール送信サーバの集約における透過型SMTP プロキシの定量評価 / Quantitative Evaluation of Transparent SMTP Proxy in Email Sending Server Aggregation
linyows
0
600
理論計算機科学における 数学の応用: 擬似ランダムネス
nobushimi
1
400
ベイズ最適化をゼロから
brainpadpr
2
1k
WeMeet Group - 採用資料
wemeet
0
4.3k
多次元展開法を用いた 多値バイクラスタリング モデルの提案
kosugitti
0
220
マクロ経済学の視点で、財政健全化は必要か
ryo18cm
2
120
Featured
See All Featured
Bootstrapping a Software Product
garrettdimon
PRO
305
110k
Become a Pro
speakerdeck
PRO
26
5.1k
How to Think Like a Performance Engineer
csswizardry
22
1.3k
Statistics for Hackers
jakevdp
797
220k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
44
9.4k
Raft: Consensus for Rubyists
vanstee
137
6.8k
Making the Leap to Tech Lead
cromwellryan
133
9.1k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.3k
Product Roadmaps are Hard
iamctodd
PRO
50
11k
The Art of Programming - Codeland 2020
erikaheidi
53
13k
Designing on Purpose - Digital PM Summit 2013
jponch
117
7.1k
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.6k
Transcript
確率フロー ODE 拡散モデル データ生成技術の数理 3.6章 三澤遼 1
Outline 1. 確率フロー ODE とは 2. 確率フロー ODE と SDE
の周辺尤度が一致することの証明 3. 確率フロー ODE の尤度計算 4. シグナルとノイズで表される確率フロー ODE 2
任意の SDE は ODE に変換可能 伊藤型の確率微分方程式 : Wiener 過程 これは決定的な過程である
ODE に変換することができる 確率フロー ODE とは 3
1. 順過程,逆過程ともに同じ方程式に従って決定的に遷移 SDE では拡散過程と逆拡散過程が異なる方程式に従っていた SDE では確率的に遷移していた 2. データ分布と事前分布が 1 対
1 対応 決定的な過程であるため 3. 確率的要素が少なく少量ステップで収束 一方,SDE に加えられるノイズと MCMC 法は離散化誤差を改善 確率フロー ODE にノイズを加えることで品質改善できる SDE との比較 4
伊藤過程における Focker-Planck 方程式 確率分布 の従う方程式(Stratonovich 積では別の形を取る) 1 次元の場合 次元の場合 として,
確率フロー ODE と SDE の周辺尤度が一致することの証明 5
より と思い(伊藤ルール), の1次以下だけ残すと (伊藤公式) 一方, なので 蛇足: Focker-Planck 方程式(1次元)の導出 6
任意の について成立するので, 多次元の Focker-Planck 方程式も同様. 蛇足: Focker-Planck 方程式(1次元)の導出 7
右辺第2項を で括り,整理すれば良い. 確率フロー ODE と SDE の周辺尤度が一致することの証明 8
よって,右辺は となる.括弧の中身が になっている. が に依存しない場合は右辺第2項は消える. 確率フロー ODE と SDE の周辺尤度が一致することの証明
9
の場合, 尤度は, と計算される (Chen et al., 2018). 確率フロー ODE の尤度計算
10
定理 (Instantaneous Change of Variables) 常微分方程式 に従う確率変数の確率分布について が成立.両辺を で積分すると所望の式が得られる. 注意:
定理では確率変数の時間変化を追跡 Focker-Plank 方程式: 固定位置での確率分布 Focker-Planck 方程式では,右辺の 依存性が消えず計算が困難. -> で置き換え依存性消去.代償として 次元の ODE に帰着. 結果は等価. 確率フロー ODE の尤度計算: Instantaneous Change of Variable 11
両辺を で割って定理を得る. 以下の ODE に帰着. を追跡するために状態が 次元増加. 確率フロー ODE の尤度計算:
定理の証明 12
は Skilling-Hutchinson 推定で効率的に計算できる 行列 を陽に計算して対角和を求めるのは非効率. 例えば,標準基底 との積 により の 番目の列が得られる.
回繰り返し を計算(非効率). Skilling (1989) と Hutchinson (1989) は同時期に対角和の推定量を提案. 確率変数 が を満たすとする.このとき が条件から容易に従う. を条件を満たす確率変数とすると,Skilling-Hutchinson 推定量は 確率フロー ODE の尤度計算: Skilling-Hutchinson 推定 13
は不偏推定量.つまり 確率変数には Rademacher ベクトルや正規分布上のベクトルが用いられる. Hutchinson のトレース推定量: ガウストレース推定量: 本ケースでは は誤差逆伝播法により,ヤコビアンを陽に表さず効率的に 計算可能
(VJP: Vector-Jacobian Products) 確率フロー ODE の尤度計算: Skilling-Hutchinson 推定 14
SBM や DDPM の確率フロー ODE 確率フロー ODE は として だったので
微積分学の基本定理から シグナルとノイズで表される確率フロー ODE 15
分散発散型 SDE(SBM など)では, なので, シグナルとノイズで表される確率フロー ODE 16
参考文献 1. 岡野原大輔,拡散モデル データ生成技術の数理. 2. 沙川貴大,上田正仁,量子測定と量子制御. 3. Sebastian Nowozin, Thoughts
on Trace Estimation in Deep Learning. 参考文献 17