Slide 1

Slide 1 text

拡散モデルの 原理紹介 2023/5/31 AS部 山家一樹

Slide 2

Slide 2 text

話す ■ 拡散モデルの原理(大筋のみ) – なるべく式を交えつつ、しかし要点だけ紹介 話さない ■ 拡散モデルの実装方法 ■ 拡散モデルの応用例 ■ 拡散モデルの理論の最先端 (参考文献)拡散モデル

Slide 3

Slide 3 text

アジェンダ ■ 生成モデルとは ■ 拡散モデル(DDPM) – 拡散過程と逆拡散過程 – ①分布の表現 – ②学習方法 – ③サンプリング方法

Slide 4

Slide 4 text

生成モデルとは 対象ドメインのデータ(分布𝒑(𝒙) に従うと想定)をサンプルするモデルの総称。 ※どんなデータでもベクトルとして扱うことになるので 𝑥 ∈ ℝ𝑑 とする。本資料では、確率密度関数を 分布と表現しています。 各生成モデルを理解するのに下記3つの観点を押さえることが重要(と思っている) ① 分布の表現方法 – ドメインデータの分布 𝑝(𝒙)(未知)をうまく表現するための分布族:𝒑𝜽 (𝒙) (θはパラメータ) ② 学習方法 – 「良い𝜃」の定義とそれを求めるアルゴリズム ③ データのサンプル方法 ※入力に対する条件付き分布を考えることもある(例:テキストから画像を生成) その場合は条件付き確率 𝒑(𝒙|𝑪) と 𝒑𝜽 (𝒙|𝑪) を考えればよい( 𝑪は入力 )。

Slide 5

Slide 5 text

拡散モデル(DDPM)とは Denoising Diffusion Probabilistic Models(DDPM) ■ 生成モデルの1つ ■ 2つの確率過程(マルコフ過程)を考えるのが特徴 https://arxiv.org/pdf/2006.11239.pdf より引用 逆拡散過程 拡散過程 完全なノイズ:正規分布 データ分布:𝑝(𝑥0 ) ※簡単のため1次元として表示していますが、 実際のデータは高次元です。 ① 分布の表現方法 ② 学習方法 ③ データのサンプル方法 の説明の前に少し準備を…

Slide 6

Slide 6 text

Step.1 下記の初期分布に従い、データを生成: 𝑥0 Step.2 時刻𝑡 = 1から𝑇まで以下の変換を繰り返す: 拡散過程 以下のような確率過程を考える 𝒙𝟎 の情報はノイズに埋もれていく → 最終出力𝒙𝑻 の分布は初期値にほぼ依らない 前時刻の 値を縮小 ノイズを付与 𝜖𝑡 :標準正規分布に従うノイズ、𝛼𝑡 , 𝛽𝑡 :0から1の間の実数(詳細は省略) 対象ドメインデータの従う分布に相当 分布: 拡散過程

Slide 7

Slide 7 text

Step.1 下記の初期分布に従い、データを生成: 𝑥𝑇 Step.2 時刻𝑡 = 𝑇から1まで以下の変換を繰り返す: 逆拡散過程 以下のような確率過程を考える(拡散過程を逆転させるイメージ) 𝜖𝑡 :標準正規分布に従うノイズ、𝛼𝑡 , 𝛽𝑡 :0から1の間の実数(詳細は省略) 縮小した分を 割り戻し 加えられた ノイズを推定 ※𝜃は学習させるパラメータ 分布: ※拡散過程の各ステップの変換式(再掲) 標準正規分布 逆拡散過程

Slide 8

Slide 8 text

拡散モデル(DDPM) 拡散モデルでは前のページで導入した確率過程を以下の場面で利用する ■ ①分布の表現 ← 逆拡散過程 ■ ②学習 ← 拡散過程、逆拡散過程 ■ ③サンプリング ← 逆拡散過程

Slide 9

Slide 9 text

①分布の表現 ドメインデータの真の分布 𝑝(𝒙)はわからない。 拡散モデルでは、逆拡散過程の最終出力𝑥0 が従う分布によって、 対象ドメインデータの分布を表現しようとする。 ここだけ着目

Slide 10

Slide 10 text

②学習 最尤推定によって𝜃を決定したい。つまり、負の対数尤度 を最小にする𝜃を求めたい。 しかし… は多くの積分を含み、計算が大変 → 工夫が必要 学習データ:

Slide 11

Slide 11 text

②学習(変分下限) ※毎回SUMを書くのは煩わしいので、以下データは1点とする。 logが積分の中に入った → 積を和に形に分解できる 負の対数尤度の代わりに これを最小にする𝜃を求める 大幅に計算をカットして… 𝑥0 に加えられたノイズをうまく推定できているほど小さい

Slide 12

Slide 12 text

③サンプリング ②学習で得られた𝜃*を使った逆拡散過程によって、データを抽出する。 Step.1 標準正規分布に従い、初期値を抽出: 𝑥𝑇 Step.2 時刻𝑡 = 𝑇から1まで以下の変換を繰り返す: Step.3 𝑥0 を出力

Slide 13

Slide 13 text

サマリ ■ 拡散モデルは生成モデルの一種 – 2つの確率過程(拡散・逆拡散過程)を考えるのが特徴 ■ 逆拡散過程で対象ドメインデータの分布を表現 ■ 学習は最尤推定により実施 – 対数尤度はなく変分下限を最小にするθ ■ 逆拡散過程に従ってサンプリングすることでデータを生成

Slide 14

Slide 14 text

Appendix 条件付き確率に言及した説明

Slide 15

Slide 15 text

Step.1 下記の初期分布に従い、データを生成: 𝑥0 Step.2 時刻𝑡 = 1から𝑇まで以下を繰り返す: 拡散過程 以下のような確率過程を考える 𝒙𝟎 の情報はノイズに埋もれていく → 最終出力𝒙𝑻 の分布は初期値に依らない 前時刻の 値を縮小 ノイズを付与 𝜖𝑡 :標準正規分布に従うノイズ、𝛼𝑡 , 𝛽𝑡 :0から1の間の実数 ただし、 は平均𝑎、分散共分散行列Σの正規分布の確率密 度関数。 条件付き確率 データの従う分布 マルコフ性 分布:

Slide 16

Slide 16 text

Step.1 下記の初期分布に従い、データを生成: 𝑥𝑇 Step.2 時刻𝑡 = 𝑇から1まで以下を繰り返す: 逆拡散過程 以下のような確率過程を考える(拡散過程を逆転させるイメージ) 𝜖𝑡 :標準正規分布に従うノイズ、𝛼𝑡 , 𝛽𝑡 :0から1の間の実数 直接書くと長いので とおいた。 条件付き確率 縮小した分を 割り戻し 加えられた ノイズを推定 ※𝜃は学習させるパラメータ マルコフ性 分布:

Slide 17

Slide 17 text

①分布の表現 逆拡散過程の最終出力𝑥0 の分布によって、データの分布を表現する。 ここだけ着目

Slide 18

Slide 18 text

株式会社ブレインパッド 106-0032 東京都港区六本木三丁目1番1号 六本木ティーキューブ TEL:03-6721-7002 FAX:03-6721-7010 www.brainpad.co.jp [email protected] 本資料は、未刊行文書として日本及び各国の著作権法に基づき保護されております。本資料には、株式会社ブレインパッド所有の特定情報が含まれており、これら情報に基づく本資料の内容は、貴社以外の第三者に開示されること、また、本資料を評価する以外の目的で、その 一部または全文を複製、使用、公開することは、禁止されています。また、株式会社ブレインパッドによる書面での許可なく、それら情報の一部または全文を使用または公開することは、いかなる場合も禁じられております。 ©BrainPad Inc. Strictly Confidential