Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MCMCのR-hatは分散分析である
Search
Shota Mori
June 20, 2025
Science
0
380
MCMCのR-hatは分散分析である
Shota Mori
June 20, 2025
Tweet
Share
Other Decks in Science
See All in Science
Valuable Lessons Learned on Kaggle’s ARC AGI LLM Challenge (PyDataGlobal 2024)
ianozsvald
0
390
生成AIと学ぶPythonデータ分析再入門-Pythonによるクラスタリング・可視化をサクサク実施-
datascientistsociety
PRO
4
1.6k
データベース04: SQL (1/3) 単純質問 & 集約演算
trycycle
PRO
0
870
データベース06: SQL (3/3) 副問い合わせ
trycycle
PRO
1
550
Explanatory material
yuki1986
0
330
01_篠原弘道_SIPガバニングボード座長_ポスコロSIPへの期待.pdf
sip3ristex
0
540
Factorized Diffusion: Perceptual Illusions by Noise Decomposition
tomoaki0705
0
390
安心・効率的な医療現場の実現へ ~オンプレAI & ノーコードワークフローで進める業務改革~
siyoo
0
250
テンソル分解による糖尿病の組織特異的遺伝子発現の統合解析を用いた関連疾患の予測
tagtag
2
190
機械学習 - 決定木からはじめる機械学習
trycycle
PRO
0
990
Introd_Img_Process_2_Frequ
hachama
0
560
2025-06-11-ai_belgium
sofievl
1
130
Featured
See All Featured
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
29
9.6k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Become a Pro
speakerdeck
PRO
29
5.4k
Making Projects Easy
brettharned
116
6.3k
Designing Experiences People Love
moore
142
24k
Why You Should Never Use an ORM
jnunemaker
PRO
58
9.4k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3.1k
Done Done
chrislema
184
16k
Navigating Team Friction
lara
187
15k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
46
9.6k
Code Reviewing Like a Champion
maltzj
524
40k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Transcript
MCMCのR-hatは 分散分析である 森翔汰@moricup
Introduction • MCMCのR-hatを知っている人は、これが大きいと 結果の再現性が低いと言えることをご存じでしょう。 • しかし、なぜ再現性が低いと言えるか知る人は少ない印象です。 • 今夜、これを数式で解き明かします!
MCMCとは データの分布を 事前分布を初期分布とする マルコフ鎖(MC)を用いた モンテカルロ法(MC)に基づく 事後分布によって当てはめ することである 決め打ちの事前分布は 左に寄っているが
MCMCとは データの分布を 事前分布を初期分布とする マルコフ鎖(MC)を用いた モンテカルロ法(MC)に基づく 事後分布によって当てはめ することである 決め打ちの事前分布は 左に寄っているが データに合わせた
右寄りの事後分布で 当てはまった
MCMCの再現性が低い例 データの分布は二山 事前分布も二山に設定
MCMCの再現性が低い例 データの分布は二山 事前分布も二山に設定 マルコフ鎖ごとに結果がバラつく
分布のお気持ち データの分布は二山 どっちの山に fitしようかな 右の気分 いや、左かも やっぱり 右で
MCMCの再現性を検証したい • 各マルコフ鎖の事後分布の差が 大きいかを確認したい • 各群の差を確認したいようなもの • まるで分散分析 • 実際の統計モデルは複雑
• 可視化には限度がある • そこで R-hat による定量評価 • ベイズ推論ライブラリにも実装されている
R-hatの定義 • 𝑛: マルコフ鎖あたりのサンプル数 • 𝐵: マルコフ鎖間分散(Between) • 𝑊: マルコフ鎖内分散(Within)
𝑅 = 𝑛 − 1 𝑛 𝑊 + 1 𝑛 𝐵 𝑊
R-hatの解釈 𝑅 = 𝑛 − 1 𝑛 𝑊 +
1 𝑛 𝐵 𝑊 = 𝑛 − 1 𝑛 + 1 𝑛 𝐵 𝑊
R-hatの解釈 𝑅 = 𝑛 − 1 𝑛 𝑊 +
1 𝑛 𝐵 𝑊 = 𝑛 − 1 𝑛 + 1 𝑛 𝐵 𝑊 𝐵 𝑊 = マルコフ鎖間分散 マルコフ鎖内分散 ≈ 群間変動 群内変動 = 𝐹値 つまり、 𝑅が大きいことと、𝐹値が大きいことは同じ! 分散分析
まとめ • 分散分析ではF値が大きいと、群に優意差有りと考える • 同じようにMCMCではR-hatが大きいと、 マルコフ鎖に有意差有りと考えられる →結果の再現性を検証できそう! 𝑅 =
1.0 再現性有るかな? 𝑅 = 42.2 再現性低いと言える!
まとめ • 分散分析ではF値が大きいと、群に優意差有りと考える • 同じようにMCMCではR-hatが大きいと、 マルコフ鎖に有意差有りと考えられる →結果の再現性を検証できそう! 𝑅 =
1.0 再現性有るかな? 𝑅 = 42.2 再現性低いと言える! MCMCのR-hatは、やっぱり分散分析だ!