Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MCMCのR-hatは分散分析である
Search
Shota Mori
June 20, 2025
Science
0
490
MCMCのR-hatは分散分析である
Shota Mori
June 20, 2025
Tweet
Share
Other Decks in Science
See All in Science
生成検索エンジン最適化に関する研究の紹介
ynakano
2
1.4k
データベース04: SQL (1/3) 単純質問 & 集約演算
trycycle
PRO
0
1k
データベース15: ビッグデータ時代のデータベース
trycycle
PRO
0
380
Masseyのレーティングを用いたフォーミュラレースドライバーの実績評価手法の開発 / Development of a Performance Evaluation Method for Formula Race Drivers Using Massey Ratings
konakalab
0
210
機械学習 - 授業概要
trycycle
PRO
0
260
AIに仕事を奪われる 最初の医師たちへ
ikora128
0
990
mOrganic™ Holdings, LLC.
hyperlocalnetwork
0
130
データベース14: B+木 & ハッシュ索引
trycycle
PRO
0
500
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
190
地質研究者が苦労しながら運用する情報公開システムの実例
naito2000
0
300
生成AIと学ぶPythonデータ分析再入門-Pythonによるクラスタリング・可視化をサクサク実施-
datascientistsociety
PRO
4
1.8k
テンソル分解による糖尿病の組織特異的遺伝子発現の統合解析を用いた関連疾患の予測
tagtag
2
300
Featured
See All Featured
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
2.9k
Writing Fast Ruby
sferik
630
62k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.2k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
10
910
Mobile First: as difficult as doing things right
swwweet
225
10k
GitHub's CSS Performance
jonrohan
1032
470k
Become a Pro
speakerdeck
PRO
29
5.6k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
The World Runs on Bad Software
bkeepers
PRO
72
11k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
37
2.6k
How GitHub (no longer) Works
holman
315
140k
Transcript
MCMCのR-hatは 分散分析である 森翔汰@moricup
Introduction • MCMCのR-hatを知っている人は、これが大きいと 結果の再現性が低いと言えることをご存じでしょう。 • しかし、なぜ再現性が低いと言えるか知る人は少ない印象です。 • 今夜、これを数式で解き明かします!
MCMCとは データの分布を 事前分布を初期分布とする マルコフ鎖(MC)を用いた モンテカルロ法(MC)に基づく 事後分布によって当てはめ することである 決め打ちの事前分布は 左に寄っているが
MCMCとは データの分布を 事前分布を初期分布とする マルコフ鎖(MC)を用いた モンテカルロ法(MC)に基づく 事後分布によって当てはめ することである 決め打ちの事前分布は 左に寄っているが データに合わせた
右寄りの事後分布で 当てはまった
MCMCの再現性が低い例 データの分布は二山 事前分布も二山に設定
MCMCの再現性が低い例 データの分布は二山 事前分布も二山に設定 マルコフ鎖ごとに結果がバラつく
分布のお気持ち データの分布は二山 どっちの山に fitしようかな 右の気分 いや、左かも やっぱり 右で
MCMCの再現性を検証したい • 各マルコフ鎖の事後分布の差が 大きいかを確認したい • 各群の差を確認したいようなもの • まるで分散分析 • 実際の統計モデルは複雑
• 可視化には限度がある • そこで R-hat による定量評価 • ベイズ推論ライブラリにも実装されている
R-hatの定義 • 𝑛: マルコフ鎖あたりのサンプル数 • 𝐵: マルコフ鎖間分散(Between) • 𝑊: マルコフ鎖内分散(Within)
𝑅 = 𝑛 − 1 𝑛 𝑊 + 1 𝑛 𝐵 𝑊
R-hatの解釈 𝑅 = 𝑛 − 1 𝑛 𝑊 +
1 𝑛 𝐵 𝑊 = 𝑛 − 1 𝑛 + 1 𝑛 𝐵 𝑊
R-hatの解釈 𝑅 = 𝑛 − 1 𝑛 𝑊 +
1 𝑛 𝐵 𝑊 = 𝑛 − 1 𝑛 + 1 𝑛 𝐵 𝑊 𝐵 𝑊 = マルコフ鎖間分散 マルコフ鎖内分散 ≈ 群間変動 群内変動 = 𝐹値 つまり、 𝑅が大きいことと、𝐹値が大きいことは同じ! 分散分析
まとめ • 分散分析ではF値が大きいと、群に優意差有りと考える • 同じようにMCMCではR-hatが大きいと、 マルコフ鎖に有意差有りと考えられる →結果の再現性を検証できそう! 𝑅 =
1.0 再現性有るかな? 𝑅 = 42.2 再現性低いと言える!
まとめ • 分散分析ではF値が大きいと、群に優意差有りと考える • 同じようにMCMCではR-hatが大きいと、 マルコフ鎖に有意差有りと考えられる →結果の再現性を検証できそう! 𝑅 =
1.0 再現性有るかな? 𝑅 = 42.2 再現性低いと言える! MCMCのR-hatは、やっぱり分散分析だ!