PRML Sec11.3-11.6 (Japanese)

PRML 輪読 11.3-11.6

11.3 Gibbs Sampling

概要 • 複数の非観測変数（潜在変数，パラメータ） zについて，p(z)を推論する比較的単純な近似アルゴリズム • ある変数についてサンプリングを行うとき，他の変数を固定して考える • Metropolis-Hastingsの特別な場合と見なすことができる（つまり， MCMCの枠組み） •
当然，釣り合い条件とエルゴード性を満たす

アルゴリズムの説明 • 三変数z_1,z_2,z_3の場合，各ステップでは，一つの変数だけを更新する．この時，値は以下のような確率式に基づいてサンプリングする．

棄却なしのMetropolis-Hastings • ある1変数z_kを扱い，他の変数z\kは固定していると考える．このとき， zからz*への遷移確率qは， • このとき，　　　　　　であることに注意して， Metropilis-Hastingsの受理確率(11.44)は，よって，Metropolis-Hastingsステップは常に受理される（棄却されないので効率的）．

ランダムウォーク的振る舞い • ギブスサンプリングは，変数間に強い相関関係がある場合，全ての空間を満遍なく探索するのに非常に時間がかかる • 要するに，ランダムウォークの振る舞いを示してしまう •
ギブスサンプリングでは，真の分布をどれくらい近似できているかは分からないランダムウォークを避けるために過剰緩和が試みられる

過剰緩和 Over-relaxation • y移動を方向付けすることで，ランダムウォークを避ける試み • 条件付き分布がガウス分布である問題に対して適用可能 • 特定の変数z_iの条件付き分布はある平均 μと分散σを持つ．z_i’を以下の式に置き換える． •
α＝0なら通常のギブスサンプリング， α＜0なら，平均と反対方向へバイアスがかかるため，そのような方向へサンプリングを誘導していく • 非ガウス分布への拡張→順序付き過剰緩和

ギブスサンプリングの適用可能性 • 条件付き分布p(z_k|z\k)からサンプルが容易に抽出可能かどうか，がギブスサンプリングが使えるかどうかの判断基準になる． • ある変数と依存関係にある変数群（マルコフブランケット）で条件付けされた条件付き確率分布が求まるか否か •
Co-parentの変数も依存関係があることに注意する • 複数の変数を同時に動かさないといけない場合（強い相関がある）には，あまり効果的なアルゴリズムではない • 変分ベイズが使えるモデルには有効

ギブスサンプリングの改良 • ブロック化ギブスサンプリング ◦ 完全に全ての非観測変数をバラバラに更新していくのではなく，複数のグループに分けて，グループ内の変数は同時に更新する方法 ◦ 同時にサンプリングされるため，より真の分布に近いサンプルが得られることが期待できる • 崩壊型ギブスサンプリング（周辺化ギブスサンプリング）
◦ いくつかの変数について，周辺化によりモデルから除去してからギブスサンプリングを行う方法 ◦ サンプルすべき変数の数が減るためより高速化が見込まれる

11.4 Slice Sampling

Metropolis-Hastingsの問題点 • Metropolis-Hastingsは，常に同じステップサイズを採用する．ステップサイズが実際の分布に対して小さすぎると，ランダムウォーク的な振る舞いが強くなり，空間の探索に時間がかかる．一方，大きすぎると棄却率が高くなり効率が悪くなる．ステップサイズを分布に対して適応的なサンプリングアルゴリズムを考えたい

アルゴリズムの説明 1. zの値に対応するp(z)を求め，0<u<p(z)から一様にuをサンプリングする 2. uを固定し，{z:p(z)>u}で定義されるスライスからzを一様にサンプリングする

定式化 • 上記のアルゴリズムは，以下の分布から一様にサンプリングしたことに相当する • zの周辺分布は以下の式で与えられるので， uの値を無視することでp(z)からサンプリングできる

スライスを妥協する • 実際には，スライスから直接サンプリングすることは困難なことが多い • よって，以下の右図のように， z近傍の幅を適応的にすることで妥協する 1. z(r)を含む幅wの領域を設定し，各端点がスライスの中に入るかどうかテストする 2.
両方の端点がスライス外まで出るまで拡張し，一様サンプリングする 3. サンプルがスライスからはみ出た場合，そこを新たな端点とし，再度サンプリングする 4. スライス内に入っていたらそれを新たな z(r)とする

ここから難易度がかなり上がります 🌶🌶🌶🌶

11.5 Hybrid Monte Carlo

Metropolis-Hastingsの問題点 • Metropolis-Hastingsは，常に同じステップサイズを採用する．ステップサイズが実際の分布に対して小さすぎると，ランダムウォーク的な振る舞いが強くなり，空間の探索に時間がかかる．一方，大きすぎると棄却率が高くなり効率が悪くなる．棄却率を低く保ったまま，システムの状態に大きな変化を起こす（遠く離れた場所からのサンプリング）方法を考えたい

Metropolis-Hastingsにおける理想的遷移 • MH法では，以下の式にそって，受理するかを決定していた． • 仮に提案分布が対称だと仮定すると， q関数は消去でき，p(z)のみの式になる．究極的には， p(z*)=p(z)となるようなz*を見つけることが出来れば棄却率を 0に出来る． •
そこで，物理学的な保存則を用いて， p(z*)=p(z)となるようなz*を見つけていくことを考える． • 利用される保存則がハミルトニアン（エネルギー保存の一般化式） • （ハミルトニアン）＝（運動/力学エネルギー）＋（位置 /ポテンシャルエネルギー）

確定的な遷移 • MHは提案分布に基づく確率的遷移を行っていたが， HMCはハミルトニアンに基づく確定的な遷移を行う • 変数zに対して，関数g_iを確率p_iで選び，z*=g(z)として遷移するマルコフ連鎖を考える • 各関数gについて逆関数が存在しヤコピアンが非ゼロと仮定する •
この時，遷移確率p(z*|z)は，以下のように表現できる（ Jはヤコピアン） • さらに，受理関数Aが組み込まれる場合，

確定的な遷移 • 詳細つりあい式における遷移確率 Tにp(z*|z)を代入する • この式を受理関数Aについて整理すると，棄却率0にするためには， ①p(z*)とp(z)が等しい ②分子が等しい(zとz*が対称) ③分母(ヤコピアン)が1
が十分条件

ハミルトニアンモンテカルロ • PRMLではハイブリッドモンテカルロと紹介されているが，一般にはハミルトニアンモンテカルロとして知られている • ハミルトン力学と，Metropolisアルゴリズムを組み合わせた手法で，それにより，ハミルトン力学のサンプリング（離散化）に伴って生じるバイアスを取り除くことができる • アルゴリズムとしては，運動量変数 rの確率的な更新（モンテカルロ）と，リープフロッグアルゴリズムによ
るハミルトン力学系の更新を交互に行うマルコフ連鎖 • 計算誤差を考えない場合，全てのサンプルは受理されるハミルトン力学系の説明，運動量変数の導入，リープフロッグの説明をしていきます

ハミルトン力学系の性質①　エネルギー保存 • 物体の運動は，物体の位置変数（状態変数） zと，運動量変数rの時間的な遷移として記述できる．このとき，zとrには以下の関係が成り立つ． • また，p(z)は，ポテンシャルエネルギー E(z)を用いると，以下のような式として表現出来る．

ハミルトン力学系の性質①　エネルギー保存 • 運動エネルギーを以下のように定義すると，系の全エネルギーはポテンシャルエネルギーと運動エネルギーの和となる． • Hをハミルトン関数とよぶ．時間発展し， zやrが変化しても，ハミルトン関数の値は一定である

ハミルトン力学系の性質②　位相空間の体積保存 • 位置変数zと運動量変数rの結合空間を位相空間と呼ぶ • 変数(z,r)の空間内の領域をハミルトン力学の方程式にしたがって時間発展させたとき，その形は変化するが，体積は変化しない • 途中の議論を省略すると，ハミルトン力学に従うある遷移関数 gのヤコピアンは1になるということ
• 闇が深い

確定的遷移はエルゴード性を満たさない • ハミルトニアンが成り立つ位相空間上での同時分布を以下のように示すことが出来る • ハミルトン力学においては， Hの値が不変であるから，p(z,r)は不変となる • p(z,r)は不変だが，zとrは変化するので，ランダムウォークを避け， zに大きな変化をつけることができる •
しかし，Hの値がずっと一定であると，エルゴード性を満たさないため，サンプリング手法としては不適切． • そこで，運動量変数rについて確率的に更新する

HMCのサンプリングイメージ • ハミルトニアンを満たすようにサンプリングを行うことと，運動量変数を更新して，別のハミルトニアンに移動していくことを繰り返す • ハミルトニアンを使うことで詳細釣り合い条件を満たす • 運動量変数を更新することでエルゴード性を満た
す

リープフロッグ法 • 計算機では，ハミルトン力学に基づいた厳密な遷移（シミュレーション）ができないため，近似を行う必要がある • 近似手法としてオイラー法が考えられるが，オイラー法は誤差が大きい．より誤差の小さいリープフロッグ法を用いる．リープフロッグ法（交互更新）オイラー法（同時更新）

受理確率 • リープフロッグ法によって求められた z*，r*について，以下の確率で受理される • 第二項は，計算誤差がない場合には， 1になるため，ほとんどの場合で受理される

11.6 Estimating the Partition Function

モデル比較 • サンプリングを考える上では，確率分布の関数形（カーネル）だけを考えるので十分であったが，正規化定数Zはモデルエビデンス（モデルが与えられたときの観測データの確率）を表す． • 正規化定数Zは分配関数とも呼ばれ，ベイズモデル比較に使えるが，直接計算することは困難な場合がある． →分配関数の比率を計算することを考える

アプローチ①　重点サンプリングの利用 • 重点サンプリングで得られたサンプルデータ zを用いる • 重点サンプリングの分布p_Gが分布p_Eに近い場合に有効で，複雑なモデルには有効でない

アプローチ② • 重点サンプリングの分布に，マルコフ連鎖から得たサンプルを利用する • この式を(11.72)に代入する

まとめ

まとめ • ギブスサンプリング ◦ 複数の非観測変数の確率分布について推論する手法の一つ ◦ 各変数を順番に更新していくアルゴリズム ◦ 変数間の相関が強く，同時に動かす必要がある場合にはダメかも •
スライスサンプリング ◦ ステップサイズを適応的にした MH法という感じ ◦ シンプルで良いのではないでしょうか • ハミルトニアンモンテカルロ ◦ スライスサンプリングで満足できなかった人が作った，ステップサイズをめちゃ大きくできる手法 ◦ ハミルトニアンに基づく確定的な遷移と，確率的な遷移を組み合わせた ◦ バケモノみたいなアルゴリズム，すごい，適用範囲広い • 正規化項はモデル選択に使える

参考 - ベイズ推論による機械学習入門 - データ解析のための統計モデリング入門 - 基礎からのベイズ統計学：ハミルトニアンモンテカルロ法による実践的入門 - 【統計学】ハミルトニアンモンテカルロ法をアニメーションで可視化して理解する。 -
ハミルトニアンモンテカルロ法 - https://takun-physics.net/2702/ - http://watanabe-www.math.dis.titech.ac.jp/~kohashi/document/bayes_51.pdf - https://www.slideshare.net/tsubosaka/prml11-4

おわり！

PRML Sec11.3-11.6 (Japanese)

PRML Sec11.3-11.6 (Japanese)

ymnk

More Decks by ymnk

Other Decks in Technology

Featured

Transcript

PRML 輪読 11.3-11.6

11.3 Gibbs Sampling

アルゴリズムの説明 • 三変数z_1,z_2,z_3の場合，各ステップでは，一つの変数だけを更新する．この時，値は以下のような確率式に基づいてサンプリングする．

ランダムウォーク的振る舞い • ギブスサンプリングは，変数間に強い相関関係がある場合，全ての空間を満遍なく探索するのに非常に時間がかかる • 要するに，ランダムウォークの振る舞いを示してしまう •

11.4 Slice Sampling

アルゴリズムの説明 1. zの値に対応するp(z)を求め，0<u<p(z)から一様にuをサンプリングする 2. uを固定し，{z:p(z)>u}で定義されるスライスからzを一様にサンプリングする

定式化 • 上記のアルゴリズムは，以下の分布から一様にサンプリングしたことに相当する • zの周辺分布は以下の式で与えられるので， uの値を無視することでp(z)からサンプリングできる

ここから難易度がかなり上がります 🌶🌶🌶🌶

11.5 Hybrid Monte Carlo

確定的な遷移 • 詳細つりあい式における遷移確率 Tにp(z|z)を代入する • この式を受理関数Aについて整理すると，棄却率0にするためには， ①p(z)とp(z)が等しい ②分子が等しい(zとz*が対称) ③分母(ヤコピアン)が1

受理確率 • リープフロッグ法によって求められた z，rについて，以下の確率で受理される • 第二項は，計算誤差がない場合には， 1になるため，ほとんどの場合で受理される

11.6 Estimating the Partition Function

アプローチ①　重点サンプリングの利用 • 重点サンプリングで得られたサンプルデータ zを用いる • 重点サンプリングの分布p_Gが分布p_Eに近い場合に有効で，複雑なモデルには有効でない

アプローチ② • 重点サンプリングの分布に，マルコフ連鎖から得たサンプルを利用する • この式を(11.72)に代入する

まとめ

まとめ • ギブスサンプリング ◦ 複数の非観測変数の確率分布について推論する手法の一つ ◦ 各変数を順番に更新していくアルゴリズム ◦ 変数間の相関が強く，同時に動かす必要がある場合にはダメかも •

おわり！