MCMCのR-hatは分散分析である

MCMCのR-hatは分散分析である森翔汰@moricup

Introduction • MCMCのR-hatを知っている人は、これが大きいと結果の再現性が低いと言えることをご存じでしょう。 • しかし、なぜ再現性が低いと言えるか知る人は少ない印象です。 • 今夜、これを数式で解き明かします！

MCMCとはデータの分布を事前分布を初期分布とするマルコフ鎖(MC)を用いたモンテカルロ法(MC)に基づく事後分布によって当てはめすることである決め打ちの事前分布は左に寄っているが

MCMCとはデータの分布を事前分布を初期分布とするマルコフ鎖(MC)を用いたモンテカルロ法(MC)に基づく事後分布によって当てはめすることである決め打ちの事前分布は左に寄っているがデータに合わせた
右寄りの事後分布で当てはまった

MCMCの再現性が低い例データの分布は二山事前分布も二山に設定

MCMCの再現性が低い例データの分布は二山事前分布も二山に設定マルコフ鎖ごとに結果がバラつく

分布のお気持ちデータの分布は二山どっちの山に fitしようかな右の気分いや、左かもやっぱり右で

MCMCの再現性を検証したい • 各マルコフ鎖の事後分布の差が大きいかを確認したい • 各群の差を確認したいようなもの • まるで分散分析 • 実際の統計モデルは複雑
• 可視化には限度がある • そこで R-hat による定量評価 • ベイズ推論ライブラリにも実装されている

R-hatの定義 • 𝑛: マルコフ鎖あたりのサンプル数 • 𝐵: マルコフ鎖間分散(Between) • 𝑊: マルコフ鎖内分散(Within)
෠ 𝑅 = 𝑛 − 1 𝑛 𝑊 + 1 𝑛 𝐵 𝑊

R-hatの解釈 ෠ 𝑅 = 𝑛 − 1 𝑛 𝑊 +
1 𝑛 𝐵 𝑊 = 𝑛 − 1 𝑛 + 1 𝑛 𝐵 𝑊

R-hatの解釈 ෠ 𝑅 = 𝑛 − 1 𝑛 𝑊 +
1 𝑛 𝐵 𝑊 = 𝑛 − 1 𝑛 + 1 𝑛 𝐵 𝑊 𝐵 𝑊 = マルコフ鎖間分散マルコフ鎖内分散 ≈ 群間変動群内変動 = 𝐹値つまり、 ෠ 𝑅が大きいことと、𝐹値が大きいことは同じ！分散分析

まとめ • 分散分析ではF値が大きいと、群に優意差有りと考える • 同じようにMCMCではR-hatが大きいと、マルコフ鎖に有意差有りと考えられる →結果の再現性を検証できそう！ ෠ 𝑅 =
1.0 再現性有るかな？ ෠ 𝑅 = 42.2 再現性低いと言える！

まとめ • 分散分析ではF値が大きいと、群に優意差有りと考える • 同じようにMCMCではR-hatが大きいと、マルコフ鎖に有意差有りと考えられる →結果の再現性を検証できそう！ ෠ 𝑅 =
1.0 再現性有るかな？ ෠ 𝑅 = 42.2 再現性低いと言える！ MCMCのR-hatは、やっぱり分散分析だ！

MCMCのR-hatは分散分析である

MCMCのR-hatは分散分析である

Shota Mori

Other Decks in Science

Featured

Transcript