Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MCMCのR-hatは分散分析である
Search
Shota Mori
June 20, 2025
Science
0
440
MCMCのR-hatは分散分析である
Shota Mori
June 20, 2025
Tweet
Share
Other Decks in Science
See All in Science
アナログ計算機『計算尺』を愛でる Midosuji Tech #4/Analog Computing Device Slide Rule now and then
quiver
1
250
Explanatory material
yuki1986
0
400
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
150
データベース02: データベースの概念
trycycle
PRO
2
890
機械学習 - K近傍法 & 機械学習のお作法
trycycle
PRO
0
1.2k
SciPyDataJapan 2025
schwalbe10
0
260
地質研究者が苦労しながら運用する情報公開システムの実例
naito2000
0
260
データベース11: 正規化(1/2) - 望ましくない関係スキーマ
trycycle
PRO
0
940
研究って何だっけ / What is Research?
ks91
PRO
1
110
My Favourite Book in 2024: Get Rid of Your Japanese Accent
lagenorhynque
1
110
安心・効率的な医療現場の実現へ ~オンプレAI & ノーコードワークフローで進める業務改革~
siyoo
0
320
ランサムウェア対策にも考慮したVMware、Hyper-V、Azure、AWS間のリアルタイムレプリケーション「Zerto」を徹底解説
climbteam
0
110
Featured
See All Featured
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
800
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
252
21k
Visualization
eitanlees
148
16k
Fireside Chat
paigeccino
39
3.6k
Scaling GitHub
holman
463
140k
Rails Girls Zürich Keynote
gr2m
95
14k
Optimizing for Happiness
mojombo
379
70k
Site-Speed That Sticks
csswizardry
10
810
How to Think Like a Performance Engineer
csswizardry
26
1.9k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
358
30k
Statistics for Hackers
jakevdp
799
220k
It's Worth the Effort
3n
187
28k
Transcript
MCMCのR-hatは 分散分析である 森翔汰@moricup
Introduction • MCMCのR-hatを知っている人は、これが大きいと 結果の再現性が低いと言えることをご存じでしょう。 • しかし、なぜ再現性が低いと言えるか知る人は少ない印象です。 • 今夜、これを数式で解き明かします!
MCMCとは データの分布を 事前分布を初期分布とする マルコフ鎖(MC)を用いた モンテカルロ法(MC)に基づく 事後分布によって当てはめ することである 決め打ちの事前分布は 左に寄っているが
MCMCとは データの分布を 事前分布を初期分布とする マルコフ鎖(MC)を用いた モンテカルロ法(MC)に基づく 事後分布によって当てはめ することである 決め打ちの事前分布は 左に寄っているが データに合わせた
右寄りの事後分布で 当てはまった
MCMCの再現性が低い例 データの分布は二山 事前分布も二山に設定
MCMCの再現性が低い例 データの分布は二山 事前分布も二山に設定 マルコフ鎖ごとに結果がバラつく
分布のお気持ち データの分布は二山 どっちの山に fitしようかな 右の気分 いや、左かも やっぱり 右で
MCMCの再現性を検証したい • 各マルコフ鎖の事後分布の差が 大きいかを確認したい • 各群の差を確認したいようなもの • まるで分散分析 • 実際の統計モデルは複雑
• 可視化には限度がある • そこで R-hat による定量評価 • ベイズ推論ライブラリにも実装されている
R-hatの定義 • 𝑛: マルコフ鎖あたりのサンプル数 • 𝐵: マルコフ鎖間分散(Between) • 𝑊: マルコフ鎖内分散(Within)
𝑅 = 𝑛 − 1 𝑛 𝑊 + 1 𝑛 𝐵 𝑊
R-hatの解釈 𝑅 = 𝑛 − 1 𝑛 𝑊 +
1 𝑛 𝐵 𝑊 = 𝑛 − 1 𝑛 + 1 𝑛 𝐵 𝑊
R-hatの解釈 𝑅 = 𝑛 − 1 𝑛 𝑊 +
1 𝑛 𝐵 𝑊 = 𝑛 − 1 𝑛 + 1 𝑛 𝐵 𝑊 𝐵 𝑊 = マルコフ鎖間分散 マルコフ鎖内分散 ≈ 群間変動 群内変動 = 𝐹値 つまり、 𝑅が大きいことと、𝐹値が大きいことは同じ! 分散分析
まとめ • 分散分析ではF値が大きいと、群に優意差有りと考える • 同じようにMCMCではR-hatが大きいと、 マルコフ鎖に有意差有りと考えられる →結果の再現性を検証できそう! 𝑅 =
1.0 再現性有るかな? 𝑅 = 42.2 再現性低いと言える!
まとめ • 分散分析ではF値が大きいと、群に優意差有りと考える • 同じようにMCMCではR-hatが大きいと、 マルコフ鎖に有意差有りと考えられる →結果の再現性を検証できそう! 𝑅 =
1.0 再現性有るかな? 𝑅 = 42.2 再現性低いと言える! MCMCのR-hatは、やっぱり分散分析だ!