ベイズ統計学入門〜頻度主義からベイズ主義へ〜

上野彰大大阪府堺市生まれ・育ち東京大学大学院農学生命科学研究科卒 YOJO Technologies取締役・エンジニア責任者自己紹介 Twitter：@ueeeeniki

• この勉強会のモチベーションとゴール • 統計学入門〜統計学・統計モデリングとは何か？〜 • 頻度主義統計学入門〜頻度主義的考え方〜 • ベイズ統計学入門
〜ベイズ主義と頻度主義との違い〜アジェンダ

参考・オススメ文献 • 頻度主義統計学 ◦ 心理統計学の基礎 • ベイズ主義統計学 ◦ 基礎からのベイズ統計 ◦
データ解析のための統計モデリング入門 ――一般化線形モデル・階層ベイズモデル・ MCMC • ベイズ主義機械学習 ◦ ベイズ推論による機械学習入門 ◦ しくみがわかるベイズ統計と機械学習 • 統計学の歴史・哲学 ◦ 異端の統計学ベイズ ◦ 統計学を哲学する

推奨する前提知識 • 下記については補足をするが、ある程度の知識があることが望ましい ◦ 頻度主義統計学の基礎知識（母集団の推定、検定など用語を知っていている程度） ◦ ベイズの定理など、ベイズ統計学の超初歩的な知識 ◦ 高校程度の数学知識
• 仮に詳細が理解できない箇所があったとしても、議論の大枠を理解することは可能です

この勉強会のモチベーションとゴール

統計学史上最大の論争頻度主義統計学ベイズ統計学 VS

ベイズの定理ベイズ統計学とは、ベイズの定理を統計学的推測に応用した統計学古典的な統計学である頻度主義統計学とは、 ①何に確率を適用しているのか、 ② どのように推論を行うのかが異なる事前確率事後確率尤度トーマス・ベイズ
（ 1701 - 1761年）

闇に葬られた統計学 • ベイズの法則を巡る闘いは、19世紀後半の現代統計学の確立から21世紀初めまでの150年に渡って続いた血塗られた闘争 • ベイズ統計学は、長く統計学の主流だった頻度主義統計学者たちによって弾圧されてきた（「頻度主義にあらずんば統計学にあらず」） • この論争の中で人類が向き合ったのは、「人は証拠をどのように分析し、新たな情報が手に入ったときにどう考えを変え、不確かな状況下でいかに合理的な決定を下す
のか」という問題（『異端の統計学ベイズ』）参考：『統計初心者がベイズ統計学に入門するまでの勉強法』（私記事）

頻度主義者によるベイズ主義批判「逆確率の理論（ベイズの理論）はある誤謬の上に立脚するものであって、完全に葬り去らなければならない」「誤り、おそらくは、数学界がこれほどまで深く関わってしまったただ一つの誤りだ」（ロナルド.A.フィッシャー）「逆確率の法則（ベイズの定理）は・・・死んだ。これらの法則は人目につかないところにきちんと埋葬されるべきものであって、そのミイラを教科書や試験用紙に残すべきではない。」（ジョージ・クリスタル）参考：『統計初心者がベイズ統計学に入門するまでの勉強法』（私記事）

頻度主義への批判とベイズ主義の台頭 • 20世紀までの統計学の主流は頻度主義だったが、現代では統計学の著名学術誌の過半数はベイズ主義の立場を取っているとも言われている（『基礎からのベイズ統計学』） • 頻度主義統計学の最も便利なツールである「統計学的仮説検定」の「p値」「有意性」が批判にさらされており、ベイズ統計学が見直されてきた ◦ 科学的な結論やビジネス・政策上の決定は、「
p値が特定の閾値を超えたかどうか」だけに基づいて行われるべきではない（『 The ASA Statement on p-Values: Context, Process, and Purpose』） • 頻度主義は論理が回りくどく、本質を理解するのが非常に難しい（個人の感想）参考：『統計初心者がベイズ統計学に入門するまでの勉強法』（私記事）

• 一方で、どちらが正しい主義かという問いに意味はなく、好きな主義と好きな方法を使うことができる（『統計学入門「主義」を心配するみなさまに』） ◦ 必要なときに必要な方の考え方を使えばいい（『「頻度論」の学者と「ベイズ論」の学者が対談したら』）統計学の主義論争についての注釈

• 頻度主義統計学であろうと、ベイズ統計学であろうと変わらない「統計学的な考え方」の本質を理解できる • 頻度主義とベイズ主義では、推測という行為の不確実性をどこに閉じ込めるのかが異なるということを理解できる ◦ ベイズ主義では、推測しようとしているパラメータそのものに「不確実性を持たせる＝確率的に扱う」ことによって、不確実な状況下での推測を不確実なまま扱うことを可能にしている •
頻度主義の論理体系の回りくどさと、それに対するベイズ主義の論理体系のシンプルさを体感し、なぜここまでベイズ主義が持て囃されるようになったのかを理解できるこの勉強会のゴール

記述統計学頻度主義統計学ベイズ統計学推測しない推測
する統計学の分類得られたデータの統計的性質を分析・可視化することでデータの特徴を捉える得られたデータのみから、そのデータが発生したした背後のシステムを推測する推測統計学

統計学の分類（推測統計学を狭義に捉える場合もある）記述統計学頻度主義統計学ベイズ統計学推測しない推
測する得られたデータの統計的性質を分析・可視化することでデータの特徴を捉える得られたデータのみから、そのデータが発生したした背後のシステムを推測する推測統計学

する統計学の分類（今回はこちらの定義を採用）統計学の本丸推測統計学得られたデータの統計的性質を分析・可視化することでデータの特徴を捉える得られたデータのみから、そのデータが発生したした背後のシステムを推測する

統計学入門〜統計学・統計モデリングとは何か？〜

統計学とは何か？ • データの背後に潜む規則や構造を抽出する（モデリングする）ことによって、現象の理解や未知の現象に対する予測を行う

統計学とは何か？ • データの背後に潜む規則や構造を抽出する（モデリングする）ことによって、現象の理解や未知の現象に対する予測を行う規則や構造を抽出 ②未知の現象に対する予測を行う統計モデリング & パラメータの推定 ①
現象を理解する • 確率分布を用いてデータの背後に潜む規則や構造を抽出する（= 統計モデリングとパラメータの推定を行う）ことによって、現象の理解や未知の現象に対する予測を行う

データを抽出母集団標本頻度主義

「真の」確率モデル正規分布データを抽出母集団標本頻度主義 μ σ2 ① 母集団の分布が正規分布なのでは
ないかと仮定する

「真の」確率モデル正規分布データを抽出母集団標本頻度主義 μ σ2 統計モデリング ①’
母集団から確率的に発生したと見なす ① 母集団の分布が正規分布なのではないかと仮定する S2

ないかと仮定する推定された確率モデル正規分布 μ* σ*2 統計モデリング ①’ 母集団から確率的に発生したと見なす ② 標本統計量（標本平均と標本分散）から母集団の確率モデル＝母集団分布のパラメータ（母平均と母分散）を推定 S2

ないかと仮定する推定された確率モデル正規分布 μ* σ*2 完全に一致はしない統計モデリング ①’ 母集団から確率的に発生したと見なす S2 ② 標本統計量（標本平均と標本分散）から母集団の確率モデル＝母集団分布のパラメータ（母平均と母分散）を推定

「真の」確率モデル正規分布推定された確率モデル正規分布母集団予測完全に一
致はしない頻度主義 μ* σ*2 μ σ2 ③ データを予測＝確率的に発生させる

• （①）「今観測された事象（サンプル）は、背後にある確率モデルから確率的に発生したと考える枠組み」＝「統計モデリング」を導入し、 • （②）その上で、背後にある確率モデルのパラメータをリーズナブルに推定する方法を明らかにし、 • （③）パラメータを推測した確率モデルを元に、新たな事象の「確率的な予測を行う」＝「予測分布を生成する」統計学とは何をしてくれる学問なのか？
確率モデル ①サンプリング ③予測 ②推定データD 未来のデータD’

する統計学の分類推測統計学

記述統計学ベイズ統計学推測しない推測す
る統計学の分類統計的推定仮説検定頻度主義統計学推測統計学

点推定区間推定記述統計学ベイズ統計学推測しない推
測する統計学の分類仮説検定頻度主義統計学統計的推定推測統計学まずはここを中心に

頻度主義統計学入門〜頻度主義的考え方〜

• 統計的推測の課題は、「標本統計量の値をもとに、母数についてできるだけ正確な推測をすること」（『心理統計学の基礎』）頻度主義統計学の目的データを抽出母集団標本母数（本当に知りたいもの）（標本から計算できるもの）
標本統計量母平均母分散母相関係数母比率など標本平均標本分散標本相関係数標本比率など推定頻度主義点推定

今得られたサンプルの標本平均データを抽出母集団標本母平均μ 標本平均頻度主義点推定問: たまたま得られたサンプルの標本平均
から母平均μをどのように推測するべきか？標本統計量から母数を推測する方法

データを抽出母集団標本母平均μ 標本平均頻度主義点推定の値そのままでμを推測するのが直感的問: たまたま得られたサンプルの標本平均
から母平均μをどのように推測するべきか？標本統計量から母数を推測する方法今得られたサンプルの標本平均

データを抽出母集団標本母平均μ 標本平均頻度主義点推定の値そのままでμを推測するのが直感的なぜそのような推測が妥当なのかを数学的に説明できるか？
問: たまたま得られたサンプルの標本平均から母平均μをどのように推測するべきか？標本統計量から母数を推測する方法今得られたサンプルの標本平均

データを抽出母集団標本標本平均標本標本・・・標本平均
標本平均母平均μ 頻度主義点推定標本統計量から母数を推測する方法問: たまたま得られたサンプルの標本平均から母平均μをどのように推測するべきか？今得られたサンプルの標本平均は、たまたまそのサンプルが選ばれたことに依存する、一種の偶然の産物（『心理統計学の基礎』）

標本平均母平均μ 頻度主義点推定標本統計量から母数を推測する方法問: たまたま得られたサンプルの標本平均から母平均μをどのように推測するべきか？標本統計量の値はサンプルごとに変動する今得られたサンプルの標本平均は、たまたまそのサンプルが選ばれたことに依存する、一種の偶然の産物（『心理統計学の基礎』）

標本平均母平均μ 頻度主義点推定標本統計量から母数を推測する方法問: たまたま得られたサンプルの標本平均から母平均μをどのように推測するべきか？サンプル間でどのように標本統計量が変動するのか？今得られたサンプルの標本平均は、たまたまそのサンプルが選ばれたことに依存する、一種の偶然の産物（『心理統計学の基礎』）

標本平均母平均μ 頻度主義点推定標本統計量から母数を推測する方法問: たまたま得られたサンプルの標本平均から母平均μをどのように推測するべきか？サンプル間でどのように標本統計量が変動するのか？今得られたサンプルの標本平均は、たまたまそのサンプルが選ばれたことに依存する、一種の偶然の産物（『心理統計学の基礎』）どのように推定するのがリーズナブルか？

母集団が任意の分布の場合の標本平均の分布母集団「真の」確率モデル μ 母平均μ 母分散σ2

母集団「真の」確率モデルデータを抽出 n個標本 μ 母集団が任意の分布の場合の標本平均の分布母平均μ 母分散σ2

標本母集団「真の」確率モデル確率的に発生しているデータを抽出 n個 μ 母集団が任意の分布の場合の標本平均の分布母平均μ 母分散σ2

母集団「真の」確率モデルデータを抽出 n個標本標本標本・・・
標本の値の分布 N回試行 μ 母集団が任意の分布の場合の標本平均の分布母平均μ 母分散σ2

標本の値の分布標本の値の分布 μ 母集団が任意の分布の場合の標本平均の分布母平均μ 母分散σ2

標本の値の分布標本の値の分布標本平均標本平均の分布 μ 母集団が任意の分布の場合の標本平均の分布母平均μ 母分散σ2

標本の値の分布標本の値の分布標本平均全くの別物 μ 母集団が任意の分布の場合の標本平均の分布標本平均の分布母平均μ 母分散σ2

標本の値の分布標本の値の分布標本平均全くの別物一致する μ 母集団が任意の分布の場合の標本平均の分布標本平均の分布母平均μ 母分散σ2

標本の値の分布標本の値の分布標本平均全くの別物一致する μ たまに母平均から大きくハズレてしまうこともあるが平均的には母平均に近い値をとる母集団が任意の分布の場合の標本平均の分布標本平均の分布母平均μ 母分散σ2

標本の値の分布標本の値の分布標本平均全くの別物 μ たまに母平均から大きくハズレてしまうこともあるが平均的には母平均に近い値をとる今得られたサンプル母集団が任意の分布の場合の標本平均の分布標本平均の分布一致する母平均μ 母分散σ2

標本の値の分布標本の値の分布標本平均全くの別物たまに母平均から大きくハズレてしまうこともあるが平均的には母平均に近い値をとる今得られたサンプル母集団が任意の分布の場合の標本平均の分布標本平均の分布一致する母平均μ 母分散σ2 μ そのままの値で推定する

標本の値の分布標本の値の分布標本平均全くの別物 μ 今得られたサンプル母集団が任意の分布の場合の標本平均の分布標本平均の分布一致する標本平均のように、期待値が推定したい母数に一致する標本統計量を母数の不偏推定量と呼ぶ母平均μ 母分散σ2 そのままの値で推定する

標本の値の分布標本の値の分布標本平均全くの別物 μ 今得られたサンプル母集団が任意の分布の場合の標本平均の分布標本平均の分布一致する標本平均のように、期待値が推定したい母数に一致する標本統計量を母数の不偏推定量と呼ぶそのままの値で推定する（不偏推定）母平均μ 母分散σ2

母集団「真の」確率モデル母平均μ 母分散σ2 データを抽出 n個標本標本標本・
・・標本の値の分布標本の値の分布 μ σ2 母集団が任意の分布の場合の標本分散

・・標本の値の分布標本の値の分布 μ σ2 標本分散標本分散の分布母集団が任意の分布の場合の標本分散

・・標本の値の分布標本の値の分布 μ σ2 標本分散標本分散の分布一致しない母集団が任意の分布の場合の標本分散

・・標本の値の分布標本の値の分布 μ σ2 標本分散標本分散の分布一致しない標本分散は母分散の不偏推定量ではない母集団が任意の分布の場合の標本分散

・・標本の値の分布標本の値の分布 μ σ2 母集団が任意の分布の場合の不偏分散

・・標本の値の分布標本の値の分布 μ σ2 不偏分散不偏分散の分布母集団が任意の分布の場合の不偏分散

・・標本の値の分布標本の値の分布 μ σ2 不偏分散不偏分散の分布一致する母集団が任意の分布の場合の不偏分散

・・標本の値の分布標本の値の分布 μ σ2 不偏分散不偏分散の分布不偏分散は母分散の不偏推定量になっている一致する母集団が任意の分布の場合の不偏分散

母集団「真の」確率モデル母平均μ 母分散σ2 データを抽出 n個標本標本の値の分布標本の値
の分布 μ σ2 不偏分散不偏分散の分布不偏分散は母分散の不偏推定量になっている一致する標本標本・・・母集団が任意の分布の場合の不偏分散

母集団「真の」確率モデル母平均μ 母分散σ2 データを抽出 n個標本標本の値の分布標本の値
の分布 μ 母集団が任意の分布の場合の不偏分散 σ2 不偏分散不偏分散の分布不偏分散は母分散の不偏推定量になっている一致する標本標本・・・そのままの値で推定する（不偏推定）

頻度主義統計学の推測に対する考え方まとめ • 「母集団を真の確率分布を持つデータ発生装置とみなし、真の確率分布から一個一個のデータが発生してサンプルが構成されるという見方」＝「頻度主義的統計モデリング」を導入した ◦ サンプルは確率的に変動すると見なす一方で、母集団と母数は実際に観測可能かどうかに関わらず一意に決まるものと考える •
このような統計モデリングを導入した上で、標本統計量の性質を導くことで、標本統計量から母数を推定するリーズナブルな推定方法（不偏推定や最尤推定法等）を提示する ◦ 標本統計量から母数を推定する方法を提示するのに、先に母数と標本統計量の数学的な関係性を熟知しておかなければならない

測する統計学の分類仮説検定頻度主義統計学統計的推定推測統計学ここを中心に見てきた

頻度主義が批判されているポイント • 論理体系が回りくどくて分かりにくい（でしょ？） • そもそも一意に定まる母集団なんてものが存在するの？パラメータも一意の値を取るものなの？ ◦ サニーレタスの母集団って何？未来永劫サニーレタスは生まれ続けるけど？ ◦ 研究中の〇〇という肥料を与えたサニーレタスの母集団って何？
• パラメータについての仮説・命題がどの程度正しそうかを確率的に表すことはできない ◦ 「例：平均身長が170cm以上である確率、A群の平均の重さよりもB群の平均の重さの方が大きい確率」といった確率を表すことはできない

〜ベイズ主義と頻度主義との違い〜 • ベイズ統計学における学習手法アジェンダ

ベイズ統計学入門〜ベイズ主義と頻度主義との違い〜

条件付き確率の考え方全事象全事象：α大学の学生事象R：髪が長い学生事象A：男子学生事象B：女子学生事象R 事象A 事象B

条件付き確率の考え方全事象事象R 事象A 事象B 積事象の確率男子学生でかつ髪が長い確率

条件付き確率の考え方全事象事象R 事象A 事象B 積事象の確率 R 男子学生の中で髪が長い人である確率男子学生である確率
条件付き確率 ✕ 事象A ✕ ✕ 男子学生でかつ髪が長い確率

全事象事象R 事象A 事象B 積事象の確率 R R ✕ 事象R 髪が長い人の中で
男子学生である確率髪が長い確率条件付き確率事象R 男子学生でかつ髪が長い確率

条件付き確率の考え方

ベイズの定理の導出

ベイズの定理の導出 R R ✕ ✕

ベイズの定理とベイズ推論 Rという事象を観察したとする

AとBのどちらから出てきたのかは分からない Rという事象を観察したとするベイズの定理とベイズ推論

AとBのどちらから出てきたのかは分からないそのRが Aから出てきたのか or Bから出てきたのかを推測する Rという事象を観察したとするベイズの定理とベイズ推論？

AとBのどちらから出てきたのかは分からないそのRが Aから出てきたのか or Bから出てきたのかを推測する事後確率（事象観測後の事象の背景仮説の確率）？
Rという事象を観察したとするベイズの定理とベイズ推論

Rという事象を観察したとするそもそもA or Bのどちらかである確率ベイズの定理とベイズ推論

Rという事象を観察したとするそもそもA or Bのどちらかである確率そもそもAが発生しやすいのか、Bが発生しやすいのかに事後確率は比例するベイズの定理とベイズ推論

Rという事象を観察したとするそもそもA or Bのどちらかである確率 Rの観測の前後でAが発生しやすいのか Bが発生しやすいのかが変化すると言えるベイズの定理とベイズ推論

Rという事象を観察したとするそもそもA or Bのどちらかである確率事前確率（事象観測前の事象の背景仮説の確率）ベイズの定理とベイズ推論 Rの観測の前後でAが発生しやすいのか Bが発生しやすいのかが変化すると言える

Rという事象を観察したとする A or Bのどちらかの仮説が正しいとした場合にRが発生し得る確率ベイズの定理とベイズ推論

Rという事象を観察したとする背景からの事象の発生しやすさに背景の事後確率は比例する A or Bのどちらかの仮説が正しいとした場合にRが発生し得る確率ベイズの定理とベイズ推論

Rという事象を観察したとする A or Bのどちらかの仮説が正しいとした場合にRが発生し得る確率尤度（背景仮説選択後の事象の尤もらしさの程度）ベイズの定理とベイズ推論背景からの事象の発生しやすさに背景の事後確率は比例する

全事象ベイズの定理とベイズ推論

全事象 ∝ ∝ ✕ ✕ ベイズの定理とベイズ推論

全事象 ∝ ∝ 事象Rを観測した時、仮説AとBのどちらがどの程度背景だった可能性があるのか ✕ ✕ そもそもA
or Bの仮説のどちらがどの程度起こりやすいかベイズの定理とベイズ推論 A or Bの仮説が選択されたときにRがどの程度発生しやすいか

全事象 ∝ ∝ 事象Rを観測した時、仮説AとBのどちらがどの程度背景だった可能性があるのか ✕ ✕ そもそもA
or Bの仮説のどちらがどの程度起こりやすいかベイズの定理とベイズ推論：仮説AとBの確率の程度には関係がないので、実質意味を持たない A or Bの仮説が選択されたときにRがどの程度発生しやすいか

あり得る背景仮説ごとの事後確率の比を決めるのは、尤度✕事前確率であるが、で割っておくことによって、すべての背景仮説の事後確率の和が1になるベイズの定理とベイズ推論すべての背景仮説の事後確率の和を1にする働きをすることから、を正規化定数、基準化定数、規格化定数などと呼ぶ

壺B 壺A 壺A 壺A 壺B ベイズ推論による事後確率の計算例暗い部屋

壺B 壺A 壺A 壺A 壺B ベイズ推論による事後確率の計算例暗い部屋問題観測されたデータのみを元にどちらの仮説（壺はAだったのかBだったのか）
が正しそうかを推測する壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色だった、ボールを取り出した壺はAとBのどちらだったのだろうか

ベイズ推論による事後確率の計算例全仮説事象R 仮説A 仮説B 問題壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色だった、ボールを取り出した壺はAとBのどちらだったのだろうか

ベイズ推論による事後確率の計算例全仮説事象R 仮説A 仮説B 問題正規化定数壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色だった、ボールを取り出した壺はAとBのどちらだったのだろうか

ベイズ推論による事後確率の計算例全仮説事象R 仮説A 仮説B 問題正規化定数事後確率壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色だった、
ボールを取り出した壺はAとBのどちらだったのだろうか

ベイズ推論による事後確率の計算例全仮説事象R 仮説A 仮説B 問題正規化定数＜ボールを取り出した壺はAだったのではないかと考える方が確からしそうだ
事後確率壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色だった、ボールを取り出した壺はAとBのどちらだったのだろうか

壺B 壺B 壺A 暗い部屋ベイズ推論による事後確率の計算例問題観測されたデータのみを元にどちらの仮説（壺はAだったのかBだったのか）が正しそうかを推測するどちら（壺A
or B）の仮説をどの程度支持するべきか壺B 壺A 壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色だった、ボールを取り出した壺はAとBのどちらだったのだろうか

壺B 壺A 壺B 壺B 壺A 暗い部屋ベイズの定理と事前確率壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色だった、ボールを取り出した壺はAとBのどちらだったのだろうか
問題事後確率を計算できない状況では事前確率も分からないはず事前確率が分からない状況でどちら（壺A or B）の仮説をどの程度支持するべきかを決められるのか？

ベイズの定理と事前確率全仮説事象R 事象R 仮説A 仮説B ＜＜

ベイズの定理と事前確率全仮説事象R 事象R 仮説A 仮説B ＜＜大小が逆転する

ベイズ主義における確率の主観的解釈 • 事前確率が分かっていて、何度もボールを取り出し、その度に取り出した壺の答え合わせができるのであれば、ボールを取り出したのが実際に壺A、壺Bであった確率は、P(A|R)、P(B|R)に近づいていく • 観測によって事前確率を決められない場合には、事前確率の決め方によって推論結果が大きく変わってしまうにも関わらず、事前確率を主観的に決めざるを得ない ◦ データ分析における科学的客観性を本質的・根本的に脅かす
• ベイズ主義では、確率を「仮説に対する信念の度合い」として解釈することで、事前確率を客観的に決められない場合であっても、ベイズの定理によって事後確率を求め、推論を行うことができるとする ◦ 「仮説に対する信念の度合い」として扱う確率を主観確率という

主観確率と客観確率 • ベイズ主義は、確率を「仮説に対する信念の度合い」＝「主観確率」としてを扱うことを許すが、頻度主義は、確率を「客観的な頻度（何分の何起こるか）」＝「客観確率」としてしか扱わない • 下記のような一期一会な事象は、同じ状況で試行を繰り返す思考実験ができず、客観確率を考えることはできないが、主観確率では表現することができる ◦
「あなたがAさんと1ヶ月以内にお付き合いできる確率」 ◦ 「この容疑者がBさん殺害の真犯人である確率」 ◦ 「火星に知的生命体がかつて生息していた確率」

逆確率の理論は誤謬の上に立脚するものであって、完全に葬り去られなければならない観測上の根拠が前もって存在するような場合を除くと、逆確率の方法では、既知の標本が取り出された母集団に関する推論を、確率的に表現することはできないのであるフィッシャーによるベイズ推論批判とその例外ロナルド.A.フィッシャー（1890
- 1962年）

逆確率の理論は誤謬の上に立脚するものであって、完全に葬り去られなければならない観測上の根拠が前もって存在するような場合を除くと、逆確率の方法では、既知の標本が取り出された母集団に関する推論を、確率的に表現することはできないのであるフィッシャーによるベイズ推論批判とその例外ロナルド.A.フィッシャー（1890
- 1962年）事前確率に観測上の根拠が存在する場合には、ベイズ推論（逆確率の方法）を認めているとも言える

頻度主義者によるベイズ主義批判 • 頻度主義が批判するベイズ主義のポイントは、① 確率を「仮説に対する信念の度合い」＝主観確率として解釈すること、② 事前確率を主観的に決めること • 事前確率に客観的頻度＝客観確率を用いることができる場合は、頻度主義者もベイズの定理による事後確率の推論を認めざるを得ず、実際、何度もボールを取り出し、その度に取り出した壺の答え合わせができるのであれ
ば、ボールを取り出したのが壺A、壺Bであった確率は、P(A|R)、P(B|R)に近づいていくはずであるというように事後確率を頻度で解釈する • 一方で、確率推論や統計学的推論において、事前確率に客観的根拠が存在することは決して多くはないので、頻度主義では推論対象についての仮説・命題を確率的に表す＝事前・事後確率を考えるようなことはしない ◦ 「例：ボールを取り出した壺がAだった確率、〇〇の平均身長が 170cm以上である確率、A群の平均の重さよりもB群の平均の重さの方が大きい確率」といった推論対象についての確率を表すことはできない

事前確率の主観性に対する批判へのベイズ主義者の応答 • 考慮している仮説について事前に情報がない場合、そのどれもが同程度あり得そうであると考え、全仮説に同じ確率を割りあてる「理由不十分の原則」を適用する ◦ 例えば、マゼラン星雲に知的生物がいる確率は見当もつかないので 1/2に設定してもいいのか ◦ 理由不十分の原則によって等確率を選択することは、情報不足な状況下において必ずしもフェアな対処ではない（『基礎からのベイズ統計学』）
• 探求の初期に主観的な相違があったとしても、データさえ十分に取ることができれば、実際上の問題にはならないとベイズ主義者は主張する（『統計学を哲学する』） ◦ 実際には限られたデータから推論したい場面が多い • 主観確率の不合理性・危険性は、今でも本質的には解決されてない。それどころか、ベイズ統計学を専門としている学者の間でさえ主観確率の扱いに関する決定的な立場はまだない（『基礎からのベイズ統計学』）

壺B 壺B 壺A 暗い部屋ベイズ更新による事後確率の計算例問題壺B 壺A 壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色だった、ボールを戻し、もう一度同じ壺からボールを取り出すとそのボールも赤色だった
ボールを取り出した壺はAとBのどちらだったのだろうか

壺B 壺B 壺A 暗い部屋ベイズ更新による事後確率の計算例問題ひとかたまりの事象として見る壺B 壺A 壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色
だった、ボールを戻し、もう一度同じ壺からボールを取り出すとそのボールも赤色だったボールを取り出した壺はAとBのどちらだったのだろうか

ベイズ更新による事後確率の計算例全仮説事象R 1 ,R 2 仮説A 仮説B 問題正規化定数
壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色だった、ボールを戻し、もう一度同じ壺からボールを取り出すとそのボールも赤色だったボールを取り出した壺はAとBのどちらだったのだろうか

事後確率壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色だった、ボールを戻し、もう一度同じ壺からボールを取り出すとそのボールも赤色だったボールを取り出した壺はAとBのどちらだったのだろうか

事後確率＜赤ボール1つの場合とは逆に、赤ボール2つだった場合は取り出した壺はBだったのではないかと考える方が確からしい壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色だった、ボールを戻し、もう一度同じ壺からボールを取り出すとそのボールも赤色だったボールを取り出した壺はAとBのどちらだったのだろうか

壺B 壺B 壺A 暗い部屋ベイズ更新による事後確率の計算例壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色だった、ボールを戻し、もう一度同じ壺からボールを取り出すとそのボールも赤色だったボールを取り出した壺はAとBのどちらだったのだろうか問題
事象1の後に事象2が起こったと考える壺B 壺A

ベイズ更新による事後確率の計算例全仮説

ベイズ更新による事後確率の計算例全仮説 R 1 とR 2 は壺が選ばれた後は独立 R 1 が選ばれた後にR
2 が選ばれる確率

ベイズ更新による事後確率の計算例全仮説ベイズの定理 R 1 を観測後の壺Aの事後確率

ベイズ更新による事後確率の計算例全仮説

ベイズ更新による事後確率の計算例全仮説ベイズの定理の形をしている

ベイズ更新による事後確率の計算例全仮説 1回目R 2 を観測し、2回目R 2 を観測後の壺Aの事後確率を求めるベイズの定理 2回目壺Aから赤ボールを取り出す尤度 1回目R
1 が起こった後に2回目R 2 が起こる確率事象R 1 を観測後の壺Aの事後確率＝事象R 1 を観測後に同じ壺Aから事象R 2 を観測する際の事前確率事象R 1 が与えられた時の事後確率を新たな事象 R 2 の事前確率にすることができる “Today’s posterior is tomorrow’s prior”(Lindley, D.V.(2002))

ベイズ更新による事後確率の計算例全仮説 1回目R 2 を観測し、2回目R 2 を観測後の壺Aの事後確率を求めるベイズの定理 2回目壺Aから赤ボールを取り出す尤度 1回目R
1 が起こった後に2回目R 2 が起こる確率ベイズ推論とは、仮説に対する事前確率をデータによって更新（ベイズ更新）して事後確率を推論すること＝データによって仮説に対する信念をベイズ更新して推論すること事象R 1 を観測後の壺Aの事後確率＝事象R 1 を観測後に同じ壺Aから事象R 2 を観測する際の事前確率事象R 1 が与えられた時の事後確率を新たな事象 R 2 の事前確率にすることができる “Today’s posterior is tomorrow’s prior”(Lindley, D.V.(2002))

壺B 壺B 壺A 暗い部屋ベイズ更新による事後確率の計算例壺が見えない暗い部屋に入って、壺の中のボールを 10個取り出ししたところ、そのうち9個のボールは赤色だった、毎回ボールは壺に戻すとすると、ボールを取り出した壺はAとBのどちらだったのだろうか問題
壺B 壺A 10個中9個赤ボール事前確率は無情報としP(A)=P(B)=1/2とする（理由不十分の原則）

ベイズ更新による事後確率の計算例全仮説事象 R 1 ,R 2 ,…,R 10 仮説A
仮説B 問題正規化定数壺が見えない暗い部屋に入って、壺の中のボールを 10個取り出ししたところ、そのうち9個のボールは赤色だった、毎回ボールは壺に戻すとすると、ボールを取り出した壺はAとBのどちらだったのだろうか

仮説B 問題正規化定数 33倍事後確率壺が見えない暗い部屋に入って、壺の中のボールを 10個取り出ししたところ、そのうち9個のボールは赤色だった、毎回ボールは壺に戻すとすると、ボールを取り出した壺はAとBのどちらだったのだろうか

壺B 壺B 壺A 暗い部屋ベイズ更新による事後確率の計算例壺が見えない暗い部屋に入って、壺の中のボールを 10個取り出ししたところ、そのうち4個のボールは赤色だった、毎回ボールは壺に戻すとすると、ボールを取り出した壺はAとBのどちらだったのだろうか問題
壺B 壺A 10個中4個赤ボール事前確率は無情報としP(A)=P(B)=1/2とする（理由不十分の原則）

仮説B 問題正規化定数事後確率 94倍壺が見えない暗い部屋に入って、壺の中のボールを 10個取り出ししたところ、そのうち4個のボールは赤色だった、毎回ボールは壺に戻すとすると、ボールを取り出した壺はAとBのどちらだったのだろうか

近年までベイズ主義が実用的でないとされてきた理由 • 考慮している仮説について事前に情報がない場合、そのどれもが同程度あり得そうであると考え、全仮説に同じ確率を割りあてる「理由不十分の原則」を取る ◦ 例えば、マゼラン星雲に知的生物がいる確率は見当もつかないので 1/2に設定してもいいのか ◦ 理由不十分の原則によって等確率を選択することは、情報不足な状況下において必ずしもフェアな対処ではない（『基礎からのベイズ統計学』）
• 探求の初期に主観的な相違があったとしても、データさえ十分に取ることができれば、実際上の問題にはならないとベイズ主義者は主張する（『統計学を哲学する』） ◦ 実際には限られたデータから推論したい場面が多い • 主観確率の不合理性・危険性は、今でも本質的には解決されてない。それどころか、ベイズ統計学を専門としている学者の間でさえ主観確率の扱いに関する決定的な立場はまだない（『基礎からのベイズ統計学』）

ベイズ推論まとめ • ベイズ主義では、観測されたデータにを元に仮説の事後確率をベイズ更新していくことで帰納推論を行う • ベイズ主義では、確率を「仮説に対する信念の度合い」として解釈することで、事前確率を客観的に決められない場合であっても、ベイズの定理によって事後確率を求め、推論を行うことができるとする • 主観確率の不合理性・危険性は、今でも本質的には解決されてない。それどころ
か、ベイズ統計学を専門としている学者の間でさえ主観確率の扱いに関する決定的な立場はまだない（『基礎からのベイズ統計学』）ため、主観確率の問題点を理解した上で使用することが望ましい

ベイズ主義統計学の萌芽確率モデルデータD 未来のデータD’ ①サンプリング ②推定 • 統計学とは、得られたデータのみから、そのデータが発生した背景の仮説を推測するための学問であった ③予測

ベイズ主義統計学の萌芽確率モデルデータD 未来のデータD’ ①サンプリング ②推定 • 統計学とは、得られたデータのみから、そのデータが発生した背景の仮説を推測するための学問であった正規分布
μ σ2 推定対象 ③予測

ベイズ主義統計学の萌芽 ①サンプリング ③予測 ②推定 • 統計学とは、得られたデータのみから、そのデータが発生した背景の仮説を推測するための学問であった • データを元に推測対象であるパラメータの事後確率を推測しようと考えることで、ベイズ主義を統計学に持ち込むことができる
◦ パラメータの事後確率を考えるということは、パラメータの事後確率分布＝事後分布を考えるということ正規分布 μ σ2 μ 1 μ 2 μ 3 μ 4 P(μ 1 |D) P(μ 2 |D) P(μ 3 |D) P(μ 4 |D) 推定対象 σ 1 σ 2 σ 3 σ 4 P(σ 1 |D) P(σ 2 |D) P(σ 3 |D) P(σ 4 |D) 確率モデルデータD 未来のデータD’ μ事後確率 σ事後確率

ベイズ主義統計学の萌芽 ①サンプリング ③予測 ②推定 • 統計学とは、得られたデータのみから、そのデータが発生した背景の仮説を推測するための学問であった • データを元に推測対象であるパラメータの事後確率を推測しようと考えることで、ベイズ主義を統計学に持ち込むことができる
◦ パラメータの事後確率を考えるということは、パラメータの事後確率分布＝事後分布を考えるということ正規分布 μ σ2 μ 1 μ 2 μ 3 μ 4 P(μ 1 |D) P(μ 2 |D) P(μ 3 |D) 推定対象 σ 1 σ 2 σ 3 σ 4 P(σ 1 |D) P(σ 2 |D) P(σ 3 |D) P(σ 4 |D) 確率モデルデータD 未来のデータD’ μ事後分布 σ事後分布 P(μ 4 |D)

ベイズ推論の確率分布への適応データDが発生した背後の確率モデルのパラメータθがある事前確率分布p(θ)に従うと仮定する。Dの尤度関数をp(D|θ)とするとき、パラメータθの事後分布p(θ|D)はベイズの定理により与えられるパラメータデータ事前分布尤度関数事後分布
事後確率尤度事前確率

ベイズ推論の確率分布への適応データDが発生した背後の確率モデルのパラメータθがある事前確率分布p(θ)に従うと仮定する。Dの尤度関数をp(D|θ)とするとき、パラメータθの事後分布p(θ|D)はベイズの定理により与えられるパラメータデータ事前分布尤度関数事後分布
μ 1 μ 2 μ 3 μ 4 P(μ 1 ) P(μ 2 ) P(μ 3 ) P(μ 4 ) μ 1 μ 2 μ 3 μ 4 P(μ 1 |D) P(μ 2 |D) P(μ 3 |D) P(μ 4 |D)

正規化定数の周辺化とベイズの定理 θ：パラメータ、D：データを求めるために、事後確率の時と同様、尤度✕事前確率の和で表す背景仮説θが連続値であり、和を求める操作は積分となり、下記の式で表される

正規化定数の周辺化とベイズの定理 θ：パラメータ、D：データを求めるために、事後確率の時と同様、尤度✕事前確率の和で表す背景仮説θが連続値であり、和を求める操作は積分となり、下記の式で表される周辺化

正規化定数の周辺化とベイズの定理 θ：パラメータ、D：データ尤度関数事前分布モデルエビデンス周辺尤度正規化定数事後分布ベイズの定理に代入すると、次の等式を導くことができる実際、事後分布の和＝積分を求めると

事後分布を求めるためには、正規化定数を求める必要があるが、一般的に正規化定数を解析的に解くことは不可能そこで、事後分布の求め方という性質を利用し、マルコフ連鎖モンテカルロ法（MCMC）や変分推論法を用いて事後分布の近似計算を行うことが一般的である。 θ：パラメータ、D：データ

「真の」確率モデル正規分布データを抽出標本 μ σ2 ベイズ主義

「真の」確率モデル正規分布データを抽出標本 μ σ2 ベイズ主義 ① 背後の確率モデルが正規分布なのではないかと仮定し、
事前分布p(θ)を設定する統計モデリング ①’ 母集団から確率的に発生したと見なす μ事前分布 σ事前分布

「真の」確率モデル正規分布データを抽出標本 μ σ2 ② 標本から尤度関数p(D|θ)を計算して背後のモデルのパラメータ（ここでは平均μと標準偏差σ）の事後分布p(θ|D)を推定ベイズ主義
統計モデリング ①’ 母集団から確率的に発生したと見なす ① 背後の確率モデルが正規分布なのではないかと仮定し、事前分布p(θ)を設定する μ事前分布 σ事前分布

「真の」確率モデル正規分布データを抽出標本 μ σ2 μ事後分布 σ事後分布 μ事前分布 σ事前分布
ベイズ主義統計モデリング ①’ 母集団から確率的に発生したと見なす ① 背後の確率モデルが正規分布なのではないかと仮定し、事前分布p(θ)を設定する ② 標本から尤度関数p(D|θ)を計算して背後のモデルのパラメータ（ここでは平均μと標準偏差σ）の事後分布p(θ|D)を推定

事後分布による点推定ベイズ統計学でも事後分布からパラメータを点推定することは可能事後分布 MAP EAP • 事後中央値MED MED • 事後確率最大値MAP
• 事後期待値EAP

• （①）「今観測された事象（サンプル）は、背後にある確率モデルから確率的に発生したと考える枠組み」＝「統計モデリング」を導入し、 • （②）その上で、背後にある確率モデルのパラメータをリーズナブルに推定する方法を明らかにし、の事後分布をベイズ推論で推定し • （③）パラメータを推定した確率モデルを元に、新たな事象の「確率的な予測を行う」＝「予測分布を生成する」ベイズ主義に基づく統計学の枠組み
ベイズ主義は、統計モデリングをし、ベイズの定理を適用さえすればパラメータの推定が可能であり、頻度主義の不偏推定のようなややこしい理論は必要ない

ベイズ主義の事後予測分布尤度事後予測分布事後分布

θ D’ θ＝0.32 0.12 ✕ p(θ|D)＝0.24 尤度ベイズ主義の事後予測分布事後予測分布事後分布

θ D’ θ D’ θ＝0.32 θ＝0.33 θ D’ 0.12 θ＝0.85
0.85 ✕ ✕ ✕ ・・・・・・ p(θ|D)＝0.24 p(θ|D)＝0.58 p(θ|D)＝1.8 事後分布尤度ベイズ主義の事後予測分布事後予測分布

θ θ θ＝0.32 θ＝0.33 θ 0.12 θ＝0.85 D’ 0.85 ✕
✕ ✕ ・・・・・・すべてのθについて足し合わせる（積分する） D’ D’ D’ p(θ|D)＝0.24 p(θ|D)＝0.58 p(θ|D)＝1.8 尤度ベイズ主義の事後予測分布事後予測分布事後分布

• 頻度主義でもベイズ主義でも、背後にどのような確率モデルを想定するかは分析者の主観であるという点は同じで、かつ、一般的に同じような事象には同じ確率分布を想定する ◦ 当然、分析者のモデリングがリーズナブルであるかは査定されるべき • ベイズ主義では、母集団という言葉は使わない ◦ ベイズ主義でも、サンプルは母集団から発生したもので、母集団のパラメータが「確率変
数である」＝「確率分布を持つ」という説明もあるが、パラメータが確率分布を持つ時点で母集団が一意な存在として定まっていないので、頻度主義的な意味での母集団ではない • 背後にある規則性を確率論で定式化し、今得られたデータはその規則性からたまたま発生したものであると考えることは同じベイズ主義と頻度主義による統計モデリングの同異点

対象の事象の性質に基づく確率モデルの当てはめ • 日本の中学生の男子の身長・体重 • ある肥料を与えたサニーレタスの重さ正規分布 1.0 0.5 0 θ
1−θ 1 0 ベルヌーイ分布二項分布 θ • コインをn回投げたときの裏表 • くじをn回引いて当たるか外れるか • フリースローをn回投げて入るか入らないか • 天気予報をn回行なって晴れたかどうか例えば、コイン投げであれば、コインが立つという第3の可能性を捨象している例えば、中学生男子の身長は、どこまでも大きい / 小さい値を取ることはないということを捨象している

ベイズ統計学と事前分布の決め方 • できる限り主観を排するため、定義域の大きい一様分布や分散が非常に大きい正規分布などのできる限り事後分布に影響を与えない無情報事前分布を用いることが多い • 共役事前分布という事後分布を計算しやすくするような事前分布を置くことも多い ◦ 尤度関数に対して、事後分布と同じ種類の分布になるように設計された事前分布のこと
参考：豊田秀樹. 『基礎からのベイズ統計学』尤度関数共役事前分布事後分布

フリースローをθの確率で入れることができるSさんが、今10回フリースローを行うとする例えば、10回中6回入る確率は二項分布によるモデリング 10 C 6 θ6(1−θ)4 出典：『SLAM DUNK』

フリースローをθの確率で入れることができるSさんが、今10回フリースローを行うとする例えば、10回中6回入る確率は二項分布によるモデリング回数x 10 9 8 7 6
5 4 3 2 1 0 二項分布Bin(x|10,θ)＝ 10 C x θx(1−θ)n−x 出典：『SLAM DUNK』 10 C 6 θ6(1−θ)4 θ=0.7

ベータ事前分布をもつ二項分布モデリングの事後分布尤度関数が二項分布の場合の共役事前分布はベータ事前分布である事後分布

ベータ事前分布をもつ二項分布モデリングの事後分布尤度関数が二項分布の場合の共役事前分布はベータ事前分布である事後分布正規化定数

ベータ事前分布をもつ二項分布モデリングの事後分布尤度関数が二項分布の場合の共役事前分布はベータ事前分布である事後分布正規化定数事後分布事後分布もベータ分布になり、パラメータはと

ベータ事前分布をもつ二項分布モデリングの事後分布ベータ事前分布を持つ二項分布のパラメータθの事後分布事前分布事前分布事後分布事後分布 n=10, x=6 事前分布Beta(θ|1,1) 事前分布Beta(θ|2,2)
θ θ 0 0.2 0.4 0.6 0.8 1.0 0 0.2 0.4 0.6 0.8 1.0

その他の事後分布の計算方法 • 次回の私の勉強会で丁寧に扱います、、、

事前分布に主観性に対する批判へのベイズ主義者の反論 • ベイズ更新を繰り返していけば、どのような事前分布から出発しても最終的には一つの形へと収束していく ◦ データ数が増えるにつ連れ、事前分布の影響は徐々に薄まっていく • 探求の初期に主観的な相違があったとしても、データさえ十分に取ることができれば、実際上の問題にはならないとベイズ主義者は主張する（『統計学を哲学する』）

ベイズ主義と頻度主義の考え方の違いまとめ • 頻度主義は、パラメータについての主観的確率を認めず、データが観測されようとされまいと、パラメータが一意に定まる前提に立つ ◦ パラメータは観測されないため（頻度を語れない）、パラメータについての仮説・命題がどの程度正しそうかを確率的に表すことはできない ◦ パラメータが一意に定まるという前提の元、今得られたサンプルがどの程度揺らぐのかを考え、せいぜいリーズナブルな推定法を提示する
• ベイズ主義では、推測しようとしているパラメータに対する主観確率を認めることで、「不確実性を持たせる＝確率的に扱う」ことによって、不確かな状況での推測を不確かなまま扱うことを可能にしている ◦ 推測などというどこまで行ったって不確かなものは不確かなものとして扱いましょうというある意味素直な発想 ◦ その結果、パラメータについての仮説・命題がどの程度を正しそうかを確率で表すことができる（例：平均身長が170cm以上である確率、A群の平均の重さよりも B群の平均の重さの方が大きい確率）

ベイズ主義と頻度主義の考え方の違いまとめ • 今得られたデータが、背後にある規則性からたまたま発生したものであるという前提は同じで、その偶然性をどこで吸収しようとしているのかの違い ◦ ベイズ主義は、パラメータを主観確率論で扱うことによって、データの偶然性をパラメータ側の確率で吸収しようという割り切ったスタンスを取る ▪ 「今たまたま得られたデータのみから、背後のモデルのパラメータを一意に決め切ることなど到底無理。できるのはせいぜい確率分布の更新のみ。」「パラメータを不確実なものとして
扱っているんだから、データの偶然性はその中に含めることができている。」 • 頻度主義の確率もベイズ主義の確率も確率の公理を満たしてることは同じだが、何に確率を適用しているのかが違う ◦ つまり、「何を確率的に扱うべきか？」というスタンスが違う

ベイズ主義における2群の平均値差の推測 • 頻度主義統計学における統計的仮説検定のp値とは、「帰無仮説が正しいと仮定する時、手元のデータ以上に甚だしい状況が生じる確率」というもってまわったような分かりにくい確率（『基礎からのベイズ統計学』） • ベイズ主義においては、頻度主義における統計的仮説検定の代わりに、2群（もしくは複数群）の平均値に差がある確率を直接的に推測することが可能になる ◦ これがベイズ主義統計学を使用する場合の大きな利点の一つである

ベイズ主義データを抽出 Aの標本データを抽出 Bの標本 μ A σ A 2
μ B σ B 2 確率モデルA 確率モデルB A：弱い光を当てて育てた植物の重さ B：強い光を当てて育てた植物の重さ

ベイズ主義データを抽出 Aの標本データを抽出 Bの標本 μ A σ A 2
μ B σ B 2 μ A 事後分布 μ B 事後分布確率モデルA 確率モデルB A：弱い光を当てて育てた植物の重さ B：強い光を当てて育てた植物の重さ

μ B 事後分布ベイズ主義 μ A 事後分布 μ 1A μ
1B μ 2A μ 2B μ nA μ nB ・・・・・・比較比較比較 μ iB の方が大きい確率を直接計算できる

ベイズ統計学の有用性 • ベイズ統計学では、統計モデリングをして、ベイズの推論をすることで、パラメータについての仮説・命題がどの程度を正しそうかを確率で表すことができる ◦ 例：平均身長が170cm以上である確率、A群の平均の重さよりも B群の平均の重さの方が大きい確率 ◦ 頻度主義の不偏推定や仮説検定のようなややこしい推測方法に関する理論は必要なく、推測に必
要なのはベイズ定理のみ • なぜ、フィッシャーたちがこれほどまでに有用なベイズの定理を受け入れられなかったのかと言われれば、主観確率を認めなかったこと、特にどのように事前分布を決めるべきかという問題にこだわり過ぎたからだろう ◦ 事後分布の考え方そのものは批判しているわけではなく、一定受け入れているので、事前分布がどうしても気に入らなかったんだろう

まとめ

• そもそも、観察・実験・調査を用いた経験主義的な科学の限界は、（全体から見た時に）一部の標本での結果しか得られないこと ◦ 例えば、薬の臨床試験では、限られた人間でしか実験できず、「誰がやっても」「他の人間でも」「将来に渡って」同様の効果を得られるかどうかは極論分からない＝科学の本質である、客観性・普遍性・再現性は本質的には担保され得ない •
だからこそ、確率論的にデータの背後に潜む規則や構造を推察することで、帰納的推論を可能にするために統計学という学問は存在している • 統計学は、科学的手法を確率論的に正当化することで、19世紀後半〜20世紀以降の科学の発展を支えてきた「縁の下の力持ち的学問」＝近代科学を科学たらしめてきた ◦ 現代統計学の金字塔となったR.A.Fisherの著書の名は『研究者のための統計的方法』 ◦ 例えば、実験心理学の父ヴィルヘルム・ヴントは、心理学に実験と統計学的分析を導入することで、それまでの哲学的な心理学とは異なる実証的な心理学という境地を拓いたなぜ統計学が必要とされるのか？ ?

だからこそ、確率論的にデータの背後に潜む規則や構造を推察することで、帰納的推論を可能にするために統計学という学問は存在している • 統計学は、科学的手法を確率論的に正当化することで、19世紀後半〜20世紀以降の科学の発展を支えてきた「縁の下の力持ち的学問」＝近代科学を科学たらしめてきた ◦ 現代統計学の金字塔となったR.A.Fisherの著書の名は『研究者のための統計的方法』 ◦ 例えば、実験心理学の父ヴィルヘルム・ヴントは、心理学に実験と統計学的分析を導入することで、それまでの哲学的な心理学とは異なる実証的な心理学という境地を拓いたなぜ統計学が必要とされるのか？

だからこそ、「観察されたデータに数学を応用」し、帰納的推論を可能にするために統計学という学問は存在している • 統計学は、科学的手法を確率論的に正当化することで、19世紀後半〜20世紀以降の科学の発展を支えてきた「縁の下の力持ち的学問」＝近代科学を科学たらしめてきた ◦ 現代統計学の金字塔となったR.A.Fisherの著書の名は『研究者のための統計的方法』 ◦ 例えば、実験心理学の父ヴィルヘルム・ヴントは、心理学に実験と統計学的分析を導入することで、それまでの哲学的な心理学とは異なる実証的な心理学という境地を拓いたなぜ統計学が必要とされるのか？

「我々はどのようにして真なる知識を獲得できるのか？」なぜ統計学が必要とされるのか？

「我々はどのようにして真なる知識を獲得できるのか？」なぜ統計学が必要とされるのか？というソクラテスの時代から続く哲学的問題に人類は、

「我々はどのようにして真なる知識を獲得できるのか？」なぜ統計学が必要とされるのか？というソクラテスの時代から続く哲学的問題に人類は、「適切な統計処理によって結論が証明※されているのであれば、正しいだろう、科学的知識と認めてよいだろう」という共通認識を得ることで、心の安寧を得て、科学的進歩に邁進することができるようになった

• 帰納推論が、「知っていることを元手に知らないことを推測する」という非演繹的推論である以上、疑いの余地のない論理的な推論を行うことは不可能 ◦ 統計学にできるのは、あくまで推論を正当化しようする試みでしかない • 帰納推論を「どのように正当化することが正しいのか」＝「どのように正当化すべきか」という問いが決着することはおそらく永遠にない ◦ 自分の行なっている正当化手法が哲学的問題を孕むことに自覚的になり、展開している議論が真理
促進的かに厳しい批判の目を向け続ける必要がある • 統計学は帰納推論に確率論的思考の枠組みを与えたことで、帰納推論の正当化のための議論を簡単にした一方で、本質的な危うさに無自覚にした最後に〜統計学に関する哲学的諸注意

Appendix

母集団が正規分布の場合の標本分布母集団「真の」確率モデル正規分布xxxxxx μ σ2 母平均μ

母集団が正規分布の場合の標本分布データを抽出 n個母集団標本 μ σ2 母平均μ 「真の」確率モデル正規分布xxxxxx

母集団が正規分布の場合の標本分布データを抽出 n個母集団標本 μ σ2 母平均μ 「真の」確率モデル正規分布xxxxxx
確率的に発生していると見なす

母集団が正規分布の場合の標本分布データを抽出 n個母集団標本標本標本・・・
μ σ2 母平均μ 標本の値の分布 N回試行「真の」確率モデル正規分布xxxxxx

μ σ2 母平均μ 標本の値の分布「真の」確率モデル正規分布xxxxxx

μ σ2 母平均μ 標本の値の分布「真の」確率モデル正規分布xxxxxx 標本平均標本分布（標本平均の分布）

μ σ2 母平均μ 標本の値の分布「真の」確率モデル正規分布xxxxxx 標本平均標本分布（標本平均の分布）全くの別物

μ σ2 標本平均母平均μ 標本の値の分布「真の」確率モデル正規分布xxxxxx 標本分布（標本平均の分布）全くの別物

μ σ2 標本平均母平均μ 標本分布（標本平均の分布）標本の値の分布「真の」確率モデル正規分布xxxxxx 全くの別物

μ σ2 μ 標本平均母平均μ 標本分布（標本平均の分布）標本の値の分布「真の」確率モデル正規分布xxxxxx 全くの別物

μ σ2 μ 標本平均一致する母平均μ 標本分布（標本平均の分布）標本の値の分布「真の」確率モデル正規分布xxxxxx 全くの別物

μ σ2 μ 標本平均一致する母平均μ 標本分布（標本平均の分布）標本の値の分布標本分布の平均（期待値）が、その統計量によって推定しようとしている母数の値に一致する時、その統計量は不偏性を持つというまた、普遍性をもつ統計量を母数の不偏推定量という「真の」確率モデル正規分布xxxxxx 全くの別物

母集団が正規分布の場合の標本分布データを抽出 n個母集団標本 μ σ2 μ 標本平均母平均μ
標本分布（標本平均の分布）標本の値の分布標本標本・・・一致する母集団の分布を正規分布だと仮定したときに、標本平均は母平均の不偏推定量になっているという性質を利用して、たまたま得られたサンプルの標本平均から母平均を推定することを不偏推定という「真の」確率モデル正規分布xxxxxx 全くの別物

標本分布（標本平均の分布）標本の値の分布標本標本・・・一致するそのままの値で推定する母集団の分布を正規分布だと仮定したときに、標本平均は母平均の不偏推定量になっているという性質を利用して、たまたま得られたサンプルの標本平均から母平均を推定することを不偏推定という「真の」確率モデル正規分布xxxxxx 全くの別物

標本分布（標本平均の分布）標本の値の分布標本標本・・・一致する母集団の分布を正規分布だと仮定したときに、標本平均は母平均の不偏推定量になっているという性質を利用して、たまたま得られたサンプルの標本平均から母平均を推定することを不偏推定という「真の」確率モデル正規分布xxxxxx そのままの値で推定する全くの別物

標本分布（標本平均の分布）標本の値の分布標本標本・・・一致する母集団の分布を正規分布だと仮定したときに、標本平均は母平均の不偏推定量になっているという性質を利用して、たまたま得られたサンプルの標本平均から母平均を推定することを不偏推定というたまに母平均から大きくハズレてしまうこともあるが平均的には母平均に近い値をとるはずであると見なす「真の」確率モデル正規分布xxxxxx そのままの値で推定する

母集団が正規分布の場合の標本分布データを抽出 m個母集団・・・ μ σ2 母平均μ
「真の」確率モデル正規分布xxxxxx

母集団が正規分布の場合の標本分布データを抽出 m個母集団・・・ μ σ2 標本平均
母平均μ 「真の」確率モデル正規分布xxxxxx

母集団が正規分布の場合の標本分布データを抽出 m個母集団・・・ μ σ2 μ
標本平均母平均μ 「真の」確率モデル正規分布xxxxxx

標本平均・・・データを抽出 n個母平均μ m << n 「真の」確率モデル正規分布xxxxxx

標本平均・・・データを抽出 n個母平均μ m << n サンプル数nが大きくなるほど、標本平均は母平均に近い値を取る確率が大きくなる「真の」確率モデル正規分布xxxxxx

母集団が任意の分布の標本分布母集団「真の」確率モデル母平均μ μ

母集団が任意の分布の標本分布データを抽出 m個母集団・・・「真の」確率モデル母平均μ μ

データを抽出 m個母集団・・・「真の」確率モデル母平均μ μ 母集団が任意の分布の標本分布

データを抽出 m個母集団・・・「真の」確率モデル標本平均母平均μ μ
母集団が任意の分布の標本分布

データを抽出 m個母集団・・・「真の」確率モデル μ 標本平均母平均μ
μ 一致する母集団が任意の分布の標本分布

μ ・・・データを抽出 n個 m << n 一致する母集団が任意の分布の標本分布

μ ・・・データを抽出 n個 m << n 一致する xxxxxxxのとき、正規分布xxxxxxxxに近づく中心極限定理母集団が任意の分布の標本分布

フリースローをθの確率で入れることができるSさんが、今10回フリースローを行うとする例えば、10回中7回入る確率は二項分布によるモデリング 10 C 7 θ7(1−θ)3 出典：『SLAM DUNK』

フリースローをθの確率で入れることができるSさんが、今10回フリースローを行うとする例えば、10回中7回入る確率は二項分布によるモデリング 10 C 7 θ7(1−θ)3 回数 10
9 8 7 6 5 4 3 2 1 0 二項分布Bin(x|10,θ)＝ 10 C x θx(1−θ)n−x 出典：『SLAM DUNK』

母集団がベルヌーイ分布の場合の標本分布母集団母比率θ 1.0 0.5 0 θ 1−θ 1 0

母集団がベルヌーイ分布の場合の標本分布データを抽出 n個母集団標本母比率θ 1.0 0.5 0 θ
1−θ 1 0 ＝

1−θ 1 0 ＝ n C x1 θx1(1−θ)n−x1

1−θ 1 0 ＝ n C x1 θx1(1−θ)n−x1 どのように推定するのがリーズナブルか？

母集団がベルヌーイ分布の場合の標本分布データを抽出 n個母集団標本標本標本・・・
母比率θ 標本比率 1.0 0.5 0 θ 1−θ 1 0 ＝＝＝

母比率θ 標本分布（標本比率の分布）標本比率＝＝＝ 1.0 0.5 0 θ 1−θ 1 0

母比率θ 標本分布（標本比率の分布）標本比率＝＝＝ Bin(x|n,θ)= n C x θx(1−θ)n−x 1.0 0.5 0 θ 1−θ 1 0

母比率θ 標本分布（標本比率の分布）標本比率＝＝＝ 1.0 0.5 0 θ 1−θ 1 0 平均θ Bin(x|n,θ)= n C x θx(1−θ)n−x

母比率θ 標本分布（標本比率の分布）標本比率＝＝＝ 1.0 0.5 0 θ 1−θ 1 0 一致する母比率θの不偏推定量 Bin(x|n,θ)= n C x θx(1−θ)n−x 平均θ

母比率θ 標本分布（標本比率の分布）標本比率＝＝＝ 1.0 0.5 0 θ 1−θ 1 0 一致する母比率θの不偏推定量 Bin(x|n,θ)= n C x θx(1−θ)n−x そのままの値で推定する平均θ

帰納推論と統計学 • 我々は、帰納推論を行うとき、推論の対象となっている未観測の事象は、推論の前提となっているこれまで観測されてきた事象と同様だろう、と無意識に想定している（『統計学を哲学する』）＝自然の斉一性仮定 • データは、背後にある確率モデルからランダムに抽出されるので、サンプルごとに変わるが、そのもととなる確率モデル自体は推論過程、あるいは未来を通じて同一に留まると仮定することで、データから確率モデルを推論することが可能であり、推論された確率モデルをもとに未来のデータも予測可能である
という形で、自然の斉一性を定式化している • 統計学の本領は、確率を用いて自然の斉一性を定式化することによって、限られたデータから帰納推論を正確に行い、さらにその推論の確からしさや信頼性を評価する枠組みを与えることである ◦ 統計学的議論の中では、統計モデリングはあくまで近似のための道具であると認めているが、自然の斉一性は真なるものとして仮定されていることには注意

• （①、②）頻度主義統計学における統計モデリングとは、得られたサンプルが、特定の確率分布にしたがう母集団から確率的に（たまたま）発生したと考えること • （③、④）統計モデリングに基づき、母集団の統計量（平均、分散、相関係数etc…）を統計的に推定することで母集団同士の比較や未知のデータの予測が可能になる ◦ 母集団の統計量（平均、分散、相関係数 etc…）を母数またはパラメータと呼ぶ頻度主義統計学における統計モデリングと点推定

頻度主義統計学における統計モデリングと点推定 • （①、②）頻度主義統計学における統計モデリングとは、得られたサンプルが、特定の確率分布にしたがう母集団から確率的に（たまたま）発生したと考えること →→ どのように統計モデリングをすればいいのか？ • （③、④）統計モデリングに基づき、母集団の統計量（平均、分散、相関係数etc…）を統計的に点推定することで母集団同士の比較や未知のデータの予測が可能になる
◦ 母集団の統計量（平均、分散、相関係数 etc…）を母数またはパラメータと呼ぶ →→ どのように母数を推定するのか？

頻度主義統計学における統計モデリングと点推定 • （①、②）頻度主義統計学における統計モデリングとは、得られたサンプルが、特定の確率分布にしたがう母集団から確率的に（たまたま）発生したと考えること →→ どのように統計モデリングをすればいいのか？ • （③、④）統計モデリングに基づき、母集団の統計量（平均、分散、相関係数etc…）を統計的に点推定することで母集団同士の比較や未知のデータの予測が可能になる
◦ 母集団の統計量（平均、分散、相関係数 etc…）を母数またはパラメータと呼ぶ →→ どのように母数を推定するのか？すでに論じてきた

対象の事象の性質に基づく分布族の当てはめ • 日本の中学生の男子の身長・体重 • 全国統一小学生テストの点数正規分布 1.0 0.5 0 θ
1−θ 1 0 ベルヌーイ分布二項分布 θ • コインを投げて裏表 • 靴を投げて裏表 • くじを引いて当たるか外れるか • フリースローを投げて入るか入らないか例えば、コイン投げであれば、コインが立つという第3の可能性を捨象している例えば、中学生男子の身長は、どこまでも大きい / 小さい値を取ることはないということを捨象している

頻度主義統計学における統計モデリングと点推定 • 推測統計では、大抵の場合、対象となる確率分布は、特定の関数形で与えられる分布（正規分布、二項分布、ポアソン分布、etc…）になると仮定する ◦ これらの分布は有限個のパラメータでその関数形が決定される ◦ このような対象の確率分布が特定の分布で与えられるとする考え方をパラメトリックと言う • パラメトリックな推測統計では、モデリングの対象を一定の範囲の分布（要は有名
で性質がよく知られた分布）に絞ることが一般的 • このようなモデリングを分析者が自らの考察・経験に基づき、主観的に行うことが統計学の難しさ ◦ 当然、分析者のモデリングがリーズナブルであるかは査定されるべき ◦ モデルの選択を定量的に行う手法も存在する

測する統計学の分類仮説検定頻度主義統計学統計的推定推測統計学ここも軽く触れておく

統計的仮説検定の考え方のイメージ 10回中9回表が出た本物のコインイカサマのコイン 10回中7回表が出た 0.879% 24.2% 11.7% 20.1%

統計的仮説検定の考え方のイメージ 10回中9回表が出た本物のコインイカサマのコイン 10回中7回表が出た 0.879% 24.2% 11.7% 20.1% 本物のコインだと仮定するとかなり奇跡
的なことが起こっているが、イカサマのコインだと仮定すれば、十分起こり得そうどちらのコインだと仮定してもあり得ないというほどのことが起こっているわけではない

統計的仮説検定の考え方のイメージ 10回中9回表が出た本物のコインイカサマのコイン 10回中7回表が出た 0.879% 24.2% 11.7% 20.1% 本物のコインだと仮定するとかなり奇跡
的なことが起こっているが、イカサマのコインだと仮定すれば、十分起こり得そうどちらのコインだと仮定してもあり得ないというほどのことが起こっているわけではない本物のコインであるという仮説を棄却し、イカサマのコインであるという仮説を選択した方が妥当どちらの仮説も捨て去るほどでもなく、結果どちらの仮説を選択する方が妥当というのも言えない

データを抽出母集団A Aの標本データを抽出母集団B Bの標本頻度主義 A：弱い光を当てて育てた植物の重さ B：強い光を当てて育てた植物の重さ

サンプルにどれだけ差があるのかにはあまり興味がないデータを抽出母集団A Aの標本データを抽出母集団B Bの標本頻度主義 A：弱い光を当てて育てた植物の重さ
B：強い光を当てて育てた植物の重さ本当に知りたいのは、母集団に差があるのか

データを抽出母集団A Aの標本データを抽出母集団B Bの標本頻度主義 A：弱い光を当てて育てた植物の重さ B：強い光を当てて育てた植物の重さ

頻度主義データを抽出母集団A Aの標本データを抽出母集団B Bの標本 μ A σ
A 2 μ B σ B 2 母集団に差があるのか

A 2 μ B σ B 2 平均値差 μ A-B

A 2 μ B σ B 2 平均値差 μ A-B −

A 2 μ B σ B 2 平均値差 μ A-B − 0 帰無仮説

A 2 μ B σ B 2 平均値差 μ A-B − 0 帰無仮説 2.5%棄却域 2.5%棄却域

A 2 μ B σ B 2 平均値差 μ A-B − 0 帰無仮説 2.5%棄却域 2.5%棄却域帰無仮説を支持するには、あまりにも（？）起きづらい確率

A 2 μ B σ B 2 平均値差 μ A-B − 0 帰無仮説 2.5%棄却域 2.5%棄却域棄却する帰無仮説を支持するには、あまりにも（？）起きづらい確率

• 知りたいのは、サンプルではなく、あくまで母集団に差があるのか • 2つの母集団が正規分布のとき、母集団の平均値差/平均値差の標準偏差の分布はt分布になる • サンプルの標本平均値差が、母集団の平均値差を0とした時のt分布から発生したと仮定した時（帰無仮説）、その発生確率をp値と呼ぶ • p値
< 5%（1%）のとき、今得られたサンプルの標本平均値差は、非常に「珍しい」ものだと考え、元の帰無仮説を棄却する ◦ 帰無仮説が正しくない確率が 5%というわけでも、 2群の平均値差の検定

ベイズ統計学入門 〜頻度主義からベイズ主義へ〜

ベイズ統計学入門 〜頻度主義からベイズ主義へ〜

More Decks by ueniki

Other Decks in Science

Featured

Transcript

ベイズ統計学入門〜頻度主義からベイズ主義へ〜

ベイズ統計学入門〜頻度主義からベイズ主義へ〜