Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MCMCのR-hatは分散分析である
Search
Shota Mori
June 20, 2025
Science
0
550
MCMCのR-hatは分散分析である
Shota Mori
June 20, 2025
Tweet
Share
Other Decks in Science
See All in Science
Kaggle: NeurIPS - Open Polymer Prediction 2025 コンペ 反省会
calpis10000
0
320
風の力で振れ幅が大きくなる振り子!? 〜タコマナローズ橋はなぜ落ちたのか〜
syotasasaki593876
1
190
People who frequently use ChatGPT for writing tasks are accurate and robust detectors of AI-generated text
rudorudo11
0
170
Lean4による汎化誤差評価の形式化
milano0017
1
400
知能とはなにかーヒトとAIのあいだー
tagtag
PRO
0
170
KH Coderチュートリアル(スライド版)
koichih
1
56k
SpatialRDDパッケージによる空間回帰不連続デザイン
saltcooky12
0
120
白金鉱業Meetup_Vol.20 効果検証ことはじめ / Introduction to Impact Evaluation
brainpadpr
2
1.5k
AIによる科学の加速: 各領域での革新と共創の未来
masayamoriofficial
0
350
ド文系だった私が、 KaggleのNCAAコンペでソロ金取れるまで
wakamatsu_takumu
2
1.8k
データベース04: SQL (1/3) 単純質問 & 集約演算
trycycle
PRO
0
1.1k
機械学習 - K近傍法 & 機械学習のお作法
trycycle
PRO
0
1.3k
Featured
See All Featured
Faster Mobile Websites
deanohume
310
31k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
300
First, design no harm
axbom
PRO
1
1.1k
Rebuilding a faster, lazier Slack
samanthasiow
85
9.3k
The Language of Interfaces
destraynor
162
26k
Thoughts on Productivity
jonyablonski
73
5k
Stop Working from a Prison Cell
hatefulcrawdad
273
21k
Code Review Best Practice
trishagee
74
19k
End of SEO as We Know It (SMX Advanced Version)
ipullrank
2
3.8k
The Spectacular Lies of Maps
axbom
PRO
1
410
A designer walks into a library…
pauljervisheath
210
24k
Why Our Code Smells
bkeepers
PRO
340
58k
Transcript
MCMCのR-hatは 分散分析である 森翔汰@moricup
Introduction • MCMCのR-hatを知っている人は、これが大きいと 結果の再現性が低いと言えることをご存じでしょう。 • しかし、なぜ再現性が低いと言えるか知る人は少ない印象です。 • 今夜、これを数式で解き明かします!
MCMCとは データの分布を 事前分布を初期分布とする マルコフ鎖(MC)を用いた モンテカルロ法(MC)に基づく 事後分布によって当てはめ することである 決め打ちの事前分布は 左に寄っているが
MCMCとは データの分布を 事前分布を初期分布とする マルコフ鎖(MC)を用いた モンテカルロ法(MC)に基づく 事後分布によって当てはめ することである 決め打ちの事前分布は 左に寄っているが データに合わせた
右寄りの事後分布で 当てはまった
MCMCの再現性が低い例 データの分布は二山 事前分布も二山に設定
MCMCの再現性が低い例 データの分布は二山 事前分布も二山に設定 マルコフ鎖ごとに結果がバラつく
分布のお気持ち データの分布は二山 どっちの山に fitしようかな 右の気分 いや、左かも やっぱり 右で
MCMCの再現性を検証したい • 各マルコフ鎖の事後分布の差が 大きいかを確認したい • 各群の差を確認したいようなもの • まるで分散分析 • 実際の統計モデルは複雑
• 可視化には限度がある • そこで R-hat による定量評価 • ベイズ推論ライブラリにも実装されている
R-hatの定義 • 𝑛: マルコフ鎖あたりのサンプル数 • 𝐵: マルコフ鎖間分散(Between) • 𝑊: マルコフ鎖内分散(Within)
𝑅 = 𝑛 − 1 𝑛 𝑊 + 1 𝑛 𝐵 𝑊
R-hatの解釈 𝑅 = 𝑛 − 1 𝑛 𝑊 +
1 𝑛 𝐵 𝑊 = 𝑛 − 1 𝑛 + 1 𝑛 𝐵 𝑊
R-hatの解釈 𝑅 = 𝑛 − 1 𝑛 𝑊 +
1 𝑛 𝐵 𝑊 = 𝑛 − 1 𝑛 + 1 𝑛 𝐵 𝑊 𝐵 𝑊 = マルコフ鎖間分散 マルコフ鎖内分散 ≈ 群間変動 群内変動 = 𝐹値 つまり、 𝑅が大きいことと、𝐹値が大きいことは同じ! 分散分析
まとめ • 分散分析ではF値が大きいと、群に優意差有りと考える • 同じようにMCMCではR-hatが大きいと、 マルコフ鎖に有意差有りと考えられる →結果の再現性を検証できそう! 𝑅 =
1.0 再現性有るかな? 𝑅 = 42.2 再現性低いと言える!
まとめ • 分散分析ではF値が大きいと、群に優意差有りと考える • 同じようにMCMCではR-hatが大きいと、 マルコフ鎖に有意差有りと考えられる →結果の再現性を検証できそう! 𝑅 =
1.0 再現性有るかな? 𝑅 = 42.2 再現性低いと言える! MCMCのR-hatは、やっぱり分散分析だ!