Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ベイズ統計学入門 〜頻度主義からベイズ主義へ〜

ueniki
August 12, 2022

ベイズ統計学入門 〜頻度主義からベイズ主義へ〜

connpassで開催した勉強会『ベイズ統計学入門 〜頻度主義からベイズ主義へ〜』の内容スライドです。

統計学は、「データに潜む規則や構造を抽出し、現象の理解や未知の現象に対する予測を行う」ための学問です。
実験や社会調査の解析だけではなく、ビッグデータ分析やAI開発でも統計学は不可欠であり、現代人にとって必須の学問と言っても過言ではないでしょう。
一方で、その背後には単なる数学的論理には収まらない様々な哲学的問題が横たわっています。

そんな統計学の歴史にあって、最大にして今なお継続中の議論が、ベイズ主義vs頻度主義についてでしょう。

統計学が台頭してきた19世紀から20世紀には、頻度主義が主流でしたが、21世紀になった今やベイズ主義こそが統計学の主流になりつつあります。
ベイズ推論は、自動運転から迷惑メールフィルタリング、画像復元やノイズキャンセリングなど、様々な分野に爆発的に応用されています。
ベイズ機械学習と呼ばれるベイズ統計学と機械学習の融合分野も大きな注目を集めています。
もはやベイズ主義の深い理解なくして現代的なデータ分析を語ることはできません。

本講義では、統計学的考え方をきちんと理解した上で、ベイズ主義が統計学にもたらした転換についてみなさんが理解できることを目指します。
本講座を通じて統計学の歴史や全体感を学ぶことで、今後の統計学の勉強がスムーズになるのではないでしょうか。

# ベイズ主義 # ベイズ統計 # 統計入門 # 機械学習

ueniki

August 12, 2022
Tweet

More Decks by ueniki

Other Decks in Science

Transcript

  1. ベイズ統計学入門
    〜頻度主義からベイズ主義へ〜

    View Slide

  2. 上野彰大
    大阪府堺市生まれ・育ち
    東京大学大学院農学生命科学研究科卒
    YOJO Technologies取締役・エンジニア責任者
    自己紹介
    Twitter:@ueeeeniki

    View Slide

  3. ● この勉強会のモチベーションとゴール
    ● 統計学入門 〜統計学・統計モデリングとは何か?〜
    ● 頻度主義統計学入門 〜頻度主義的考え方〜
    ● ベイズ統計学入門 〜ベイズ主義と頻度主義との違い〜
    アジェンダ

    View Slide

  4. 参考・オススメ文献
    ● 頻度主義統計学
    ○ 心理統計学の基礎
    ● ベイズ主義統計学
    ○ 基礎からのベイズ統計
    ○ データ解析のための統計モデリング入門 ――一般化線形モデル・階層ベイズモデル・ MCMC
    ● ベイズ主義機械学習
    ○ ベイズ推論による機械学習入門
    ○ しくみがわかるベイズ統計と機械学習
    ● 統計学の歴史・哲学
    ○ 異端の統計学 ベイズ
    ○ 統計学を哲学する

    View Slide

  5. 推奨する前提知識
    ● 下記については補足をするが、ある程度の知識があることが望ましい
    ○ 頻度主義統計学の基礎知識(母集団の推定、検定など用語を知っていている
    程度)
    ○ ベイズの定理など、ベイズ統計学の超初歩的な知識
    ○ 高校程度の数学知識
    ● 仮に詳細が理解できない箇所があったとしても、議論の大枠を理解することは可能
    です

    View Slide

  6. この勉強会のモチベーションとゴール

    View Slide

  7. 統計学史上最大の論争
    頻度主義統計学 ベイズ統計学
    VS

    View Slide

  8. ベイズの定理
    ベイズ統計学とは、ベイズの定理を統計学的推測に応用した統計学
    古典的な統計学である頻度主義統計学とは、 ①何に確率を適用しているのか、
    ② どのように推論を行うのかが異なる
    事前確率
    事後確率
    尤度
    トーマス・ベイズ
    ( 1701 - 1761年)

    View Slide

  9. 闇に葬られた統計学
    ● ベイズの法則を巡る闘いは、19世紀後半の現代統計学の確立から21世紀初めまで
    の150年に渡って続いた血塗られた闘争
    ● ベイズ統計学は、長く統計学の主流だった頻度主義統計学者たちによって弾圧され
    てきた(「頻度主義にあらずんば統計学にあらず」)
    ● この論争の中で人類が向き合ったのは、「人は証拠をどのように分析し、新たな情報
    が手に入ったときにどう考えを変え、不確かな状況下でいかに合理的な決定を下す
    のか」という問題(『異端の統計学ベイズ』)
    参考:『統計初心者がベイズ統計学に入門するまでの勉強法
    』(私記事)

    View Slide

  10. 頻度主義者によるベイズ主義批判
    「逆確率の理論(ベイズの理論)はある誤謬の上に立脚するものであって、完全に葬り去
    らなければならない」
    「誤り、おそらくは、数学界がこれほどまで深く関わってしまったただ一つの誤りだ」
    (ロナルド.A.フィッシャー)
    「逆確率の法則(ベイズの定理)は・・・死んだ。これらの法則は人目につかないところにき
    ちんと埋葬されるべきものであって、そのミイラを教科書や試験用紙に残すべきではな
    い。」(ジョージ・クリスタル)
    参考:『統計初心者がベイズ統計学に入門するまでの勉強法
    』(私記事)

    View Slide

  11. 頻度主義への批判とベイズ主義の台頭
    ● 20世紀までの統計学の主流は頻度主義だったが、現代では統計学の著名学術誌
    の過半数はベイズ主義の立場を取っているとも言われている(『基礎からのベイズ
    統計学』)
    ● 頻度主義統計学の最も便利なツールである「統計学的仮説検定」の「p値」「有意性」
    が批判にさらされており、ベイズ統計学が見直されてきた
    ○ 科学的な結論やビジネス・政策上の決定は、「 p値が特定の閾値を超えたかどうか」だけに基づいて
    行われるべきではない(『 The ASA Statement on p-Values: Context, Process, and Purpose』)
    ● 頻度主義は論理が回りくどく、本質を理解するのが非常に難しい(個人の感想)
    参考:『統計初心者がベイズ統計学に入門するまでの勉強法
    』(私記事)

    View Slide

  12. ● 一方で、どちらが正しい主義かという問いに意味はなく、好きな主義と好きな方法を
    使うことができる(『統計学入門 「主義」を心配するみなさまに』)
    ○ 必要なときに必要な方の考え方を使えばいい(『
    「頻度論」の学者と「ベイズ論」の学者が対
    談したら』)
    統計学の主義論争についての注釈

    View Slide

  13. ● 頻度主義統計学であろうと、ベイズ統計学であろうと変わらない「統計学的な考え方」
    の本質を理解できる
    ● 頻度主義とベイズ主義では、推測という行為の不確実性をどこに閉じ込めるのかが
    異なるということを理解できる
    ○ ベイズ主義では、推測しようとしているパラメータそのものに「不確実性を持たせる=確率的
    に扱う」ことによって、不確実な状況下での推測を不確実なまま扱うことを可能にしている
    ● 頻度主義の論理体系の回りくどさと、それに対するベイズ主義の論理体系のシンプ
    ルさを体感し、なぜここまでベイズ主義が持て囃されるようになったのかを理解できる
    この勉強会のゴール

    View Slide

  14. 記述統計学
    頻度主義統計学 ベイズ統計学









    統計学の分類
    得られたデータの
    統計的性質を分
    析・可視化するこ
    とでデータの特徴
    を捉える
    得られたデータの
    みから、そのデー
    タが発生したした
    背後のシステムを
    推測する
    推測統計学

    View Slide

  15. 統計学の分類(推測統計学を狭義に捉える場合もある)
    記述統計学
    頻度主義統計学 ベイズ統計学









    得られたデータの
    統計的性質を分
    析・可視化するこ
    とでデータの特徴
    を捉える
    得られたデータの
    みから、そのデー
    タが発生したした
    背後のシステムを
    推測する
    推測統計学

    View Slide

  16. 記述統計学
    頻度主義統計学 ベイズ統計学









    統計学の分類(今回はこちらの定義を採用)
    統計学の
    本丸
    推測統計学
    得られたデータの
    統計的性質を分
    析・可視化するこ
    とでデータの特徴
    を捉える
    得られたデータの
    みから、そのデー
    タが発生したした
    背後のシステムを
    推測する

    View Slide

  17. ● この勉強会のモチベーションとゴール
    ● 統計学入門 〜統計学・統計モデリングとは何か?〜
    ● 頻度主義統計学入門 〜頻度主義的考え方〜
    ● ベイズ統計学入門 〜ベイズ主義と頻度主義との違い〜
    アジェンダ

    View Slide

  18. 統計学入門
    〜統計学・統計モデリングとは何か?〜

    View Slide

  19. 統計学とは何か?
    ● データの背後に潜む規則や構造を抽出する(モデリングする)ことによって、現象の
    理解や未知の現象に対する予測を行う

    View Slide

  20. 統計学とは何か?
    ● データの背後に潜む規則や構造を抽出する(モデリングする)ことによって、現象の
    理解や未知の現象に対する予測を行う
    規則や構造を抽出
    ②未知の現象に対する予測を行う
    統計モデリング
    &
    パラメータの推定
    ① 現象を理解する
    ● 確率分布を用いてデータの背後に潜む規則や構造を抽出する(= 統計モデリング
    とパラメータの推定を行う)ことによって、現象の理解や未知の現象に対する予測を
    行う

    View Slide

  21. データを抽出
    母集団
    標本
    頻度主義

    View Slide

  22. データを抽出
    母集団
    標本
    頻度主義

    View Slide

  23. 「真の」確率モデル
    正規分布
    データを抽出
    母集団
    標本
    頻度主義
    μ
    σ2
    ① 母集団の分布が正規分布なのでは
    ないかと仮定する

    View Slide

  24. 「真の」確率モデル
    正規分布
    データを抽出
    母集団
    標本
    頻度主義
    μ
    σ2
    統計モデリング
    ①’ 母集団から確率的に発生した
    と見なす
    ① 母集団の分布が正規分布なのでは
    ないかと仮定する
    S2

    View Slide

  25. 「真の」確率モデル
    正規分布
    データを抽出
    母集団
    標本
    頻度主義
    μ
    σ2
    ① 母集団の分布が正規分布なのでは
    ないかと仮定する
    推定された確率モデル
    正規分布
    μ*
    σ*2
    統計モデリング
    ①’ 母集団から確率的に発生した
    と見なす
    ② 標本統計量(標本平均と標本分散)から母集団の確率モデル=母
    集団分布のパラメータ(母平均と母分散)を推定
    S2

    View Slide

  26. 「真の」確率モデル
    正規分布
    データを抽出
    母集団
    標本
    頻度主義
    μ
    σ2
    ① 母集団の分布が正規分布なのでは
    ないかと仮定する
    推定された確率モデル
    正規分布
    μ*
    σ*2









    統計モデリング
    ①’ 母集団から確率的に発生した
    と見なす
    S2
    ② 標本統計量(標本平均と標本分散)から母集団の確率モデル=母
    集団分布のパラメータ(母平均と母分散)を推定

    View Slide

  27. 「真の」確率モデル
    正規分布
    推定された確率モデル
    正規分布
    母集団
    予測









    頻度主義
    μ*
    σ*2
    μ
    σ2
    ③ データを予測
    =確率的に発生させる

    View Slide

  28. ● (①)「今観測された事象(サンプル)は、背後にある確率モデルから確率的に発生
    したと考える枠組み」=「統計モデリング」を導入し、
    ● (②)その上で、背後にある確率モデルのパラメータをリーズナブルに推定する方法
    を明らかにし、
    ● (③)パラメータを推測した確率モデルを元に、新たな事象の「確率的な予測を行う」
    =「予測分布を生成する」
    統計学とは何をしてくれる学問なのか?
    確率モデル
    ①サンプリング ③予測
    ②推定
    データD 未来のデータD’

    View Slide

  29. 記述統計学
    頻度主義統計学 ベイズ統計学









    統計学の分類
    推測統計学

    View Slide

  30. 記述統計学
    ベイズ統計学









    統計学の分類
    統計的推定
    仮説検定
    頻度主義統計学
    推測統計学

    View Slide

  31. 点推定 区間推定
    記述統計学
    ベイズ統計学









    統計学の分類
    仮説検定
    頻度主義統計学
    統計的推定
    推測統計学
    まずはここを
    中心に

    View Slide

  32. ● この勉強会のモチベーションとゴール
    ● 統計学入門 〜統計学・統計モデリングとは何か?〜
    ● 頻度主義統計学入門 〜頻度主義的考え方〜
    ● ベイズ統計学入門 〜ベイズ主義と頻度主義との違い〜
    アジェンダ

    View Slide

  33. 頻度主義統計学入門
    〜頻度主義的考え方〜

    View Slide

  34. ● 統計的推測の課題は、「標本統計量の値をもとに、母数についてできるだけ正確な
    推測をすること」(『心理統計学の基礎』)
    頻度主義統計学の目的
    データを抽出
    母集団
    標本
    母数
    (本当に知りたいもの) (標本から計算できるもの)
    標本統計量
    母平均
    母分散
    母相関係数
    母比率
    など
    標本平均
    標本分散
    標本相関係数
    標本比率
    など
    推定
    頻度主義
    点推定

    View Slide

  35. 今得られたサンプルの標本平均
    データを抽出
    母集団
    標本
    母平均μ
    標本平均
    頻度主義
    点推定
    問: たまたま得られたサンプルの標本平均 から母平均μをどのように推測するべきか?
    標本統計量から母数を推測する方法

    View Slide

  36. データを抽出
    母集団
    標本
    母平均μ
    標本平均
    頻度主義
    点推定
    の値そのままでμを推測するのが直感的
    問: たまたま得られたサンプルの標本平均 から母平均μをどのように推測するべきか?
    標本統計量から母数を推測する方法
    今得られたサンプルの標本平均

    View Slide

  37. データを抽出
    母集団
    標本
    母平均μ
    標本平均
    頻度主義
    点推定
    の値そのままでμを推測するのが直感的
    なぜそのような推測が妥当なのかを数学的に説明でき
    るか?
    問: たまたま得られたサンプルの標本平均 から母平均μをどのように推測するべきか?
    標本統計量から母数を推測する方法
    今得られたサンプルの標本平均

    View Slide

  38. データを抽出
    母集団
    標本
    標本平均
    標本
    標本



    標本平均
    標本平均
    母平均μ
    頻度主義
    点推定
    標本統計量から母数を推測する方法
    問: たまたま得られたサンプルの標本平均 から母平均μをどのように推測するべきか?
    今得られたサンプルの標本平均 は、
    たまたまそのサンプルが選ばれたことに依
    存する、一種の偶然の産物
    (『心理統計学の基礎』)

    View Slide

  39. データを抽出
    母集団
    標本
    標本平均
    標本
    標本



    標本平均
    標本平均
    母平均μ
    頻度主義
    点推定
    標本統計量から母数を推測する方法
    問: たまたま得られたサンプルの標本平均 から母平均μをどのように推測するべきか?
    今得られたサンプルの標本平均 は、
    たまたまそのサンプルが選ばれたことに依
    存する、一種の偶然の産物
    (『心理統計学の基礎』)

    View Slide

  40. データを抽出
    母集団
    標本
    標本平均
    標本
    標本



    標本平均
    標本平均
    母平均μ
    頻度主義
    点推定
    標本統計量から母数を推測する方法
    問: たまたま得られたサンプルの標本平均 から母平均μをどのように推測するべきか?
    標本統計量の値は
    サンプルごとに変動する
    今得られたサンプルの標本平均 は、
    たまたまそのサンプルが選ばれたことに依
    存する、一種の偶然の産物
    (『心理統計学の基礎』)

    View Slide

  41. データを抽出
    母集団
    標本
    標本平均
    標本
    標本



    標本平均
    標本平均
    母平均μ
    頻度主義
    点推定
    標本統計量から母数を推測する方法
    問: たまたま得られたサンプルの標本平均 から母平均μをどのように推測するべきか?
    サンプル間でどのように
    標本統計量が変動するのか?
    今得られたサンプルの標本平均 は、
    たまたまそのサンプルが選ばれたことに依
    存する、一種の偶然の産物
    (『心理統計学の基礎』)

    View Slide

  42. データを抽出
    母集団
    標本
    標本平均
    標本
    標本



    標本平均
    標本平均
    母平均μ
    頻度主義
    点推定
    標本統計量から母数を推測する方法
    問: たまたま得られたサンプルの標本平均 から母平均μをどのように推測するべきか?
    サンプル間でどのように
    標本統計量が変動するのか?
    今得られたサンプルの標本平均 は、
    たまたまそのサンプルが選ばれたことに依
    存する、一種の偶然の産物
    (『心理統計学の基礎』)
    どのように推定するのが
    リーズナブルか?

    View Slide

  43. 母集団が任意の分布の場合の標本平均の分布
    母集団
    「真の」確率モデル
    μ
    母平均μ
    母分散σ2

    View Slide

  44. 母集団
    「真の」確率モデル
    データを抽出
    n個
    標本
    μ
    母集団が任意の分布の場合の標本平均の分布
    母平均μ
    母分散σ2

    View Slide

  45. 標本
    母集団
    「真の」確率モデル
    確率的に発生している
    データを抽出
    n個
    μ
    母集団が任意の分布の場合の標本平均の分布
    母平均μ
    母分散σ2

    View Slide

  46. 母集団
    「真の」確率モデル
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    N回試行
    μ
    母集団が任意の分布の場合の標本平均の分布
    母平均μ
    母分散σ2

    View Slide

  47. 母集団
    「真の」確率モデル
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    母集団が任意の分布の場合の標本平均の分布
    母平均μ
    母分散σ2

    View Slide

  48. 母集団
    「真の」確率モデル
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    母集団が任意の分布の場合の標本平均の分布
    母平均μ
    母分散σ2

    View Slide

  49. 母集団
    「真の」確率モデル
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    標本平均
    標本平均 の分布
    μ
    母集団が任意の分布の場合の標本平均の分布
    母平均μ
    母分散σ2

    View Slide

  50. 母集団
    「真の」確率モデル
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    標本平均
    全くの別物
    μ
    母集団が任意の分布の場合の標本平均の分布
    標本平均 の分布
    母平均μ
    母分散σ2

    View Slide

  51. 母集団
    「真の」確率モデル
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    標本平均
    全くの別物
    μ
    母集団が任意の分布の場合の標本平均の分布
    標本平均 の分布
    母平均μ
    母分散σ2

    View Slide

  52. 母集団
    「真の」確率モデル
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    標本平均
    全くの別物
    μ
    母集団が任意の分布の場合の標本平均の分布
    標本平均 の分布
    母平均μ
    母分散σ2

    View Slide

  53. 母集団
    「真の」確率モデル
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    標本平均
    全くの別物
    μ
    母集団が任意の分布の場合の標本平均の分布
    標本平均 の分布
    母平均μ
    母分散σ2

    View Slide

  54. 母集団
    「真の」確率モデル
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    標本平均
    全くの別物
    一致する
    μ
    母集団が任意の分布の場合の標本平均の分布
    標本平均 の分布
    母平均μ
    母分散σ2

    View Slide

  55. 母集団
    「真の」確率モデル
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    標本平均
    全くの別物
    一致する
    μ
    たまに母平均から大きくハズレてしまうことも
    あるが平均的には母平均に近い値をとる
    母集団が任意の分布の場合の標本平均の分布
    標本平均 の分布
    母平均μ
    母分散σ2

    View Slide

  56. 母集団
    「真の」確率モデル
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    標本平均
    全くの別物
    μ
    たまに母平均から大きくハズレてしまうことも
    あるが平均的には母平均に近い値をとる
    今得られたサンプル
    母集団が任意の分布の場合の標本平均の分布
    標本平均 の分布
    一致する
    母平均μ
    母分散σ2

    View Slide

  57. 母集団
    「真の」確率モデル
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    標本平均
    全くの別物
    たまに母平均から大きくハズレてしまうことも
    あるが平均的には母平均に近い値をとる
    今得られたサンプル
    母集団が任意の分布の場合の標本平均の分布
    標本平均 の分布
    一致する
    母平均μ
    母分散σ2
    μ
    そのままの値で推定する

    View Slide

  58. 母集団
    「真の」確率モデル
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    標本平均
    全くの別物
    μ
    今得られたサンプル
    母集団が任意の分布の場合の標本平均の分布
    標本平均 の分布
    一致する
    標本平均のように、期待値が推定したい母数に一
    致する標本統計量を母数の 不偏推定量と呼ぶ
    母平均μ
    母分散σ2
    そのままの値で推定する

    View Slide

  59. 母集団
    「真の」確率モデル
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    標本平均
    全くの別物
    μ
    今得られたサンプル
    母集団が任意の分布の場合の標本平均の分布
    標本平均 の分布
    一致する
    標本平均のように、期待値が推定したい母数に一
    致する標本統計量を母数の 不偏推定量と呼ぶ
    そのままの値で推定する
    (不偏推定)
    母平均μ
    母分散σ2

    View Slide

  60. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    σ2
    母集団が任意の分布の場合の標本分散

    View Slide

  61. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    σ2
    母集団が任意の分布の場合の標本分散

    View Slide

  62. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    σ2
    標本分散
    標本分散 の分布
    母集団が任意の分布の場合の標本分散

    View Slide

  63. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    σ2
    標本分散
    標本分散 の分布
    母集団が任意の分布の場合の標本分散

    View Slide

  64. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    σ2
    標本分散
    標本分散 の分布
    母集団が任意の分布の場合の標本分散

    View Slide

  65. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    σ2
    標本分散
    標本分散 の分布
    母集団が任意の分布の場合の標本分散

    View Slide

  66. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    σ2
    標本分散
    標本分散 の分布
    一致しない
    母集団が任意の分布の場合の標本分散

    View Slide

  67. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    σ2
    標本分散
    標本分散 の分布
    一致しない
    標本分散は母分散の 不偏推定量ではない
    母集団が任意の分布の場合の標本分散

    View Slide

  68. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    σ2
    母集団が任意の分布の場合の不偏分散

    View Slide

  69. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    σ2
    不偏分散
    不偏分散 の分布
    母集団が任意の分布の場合の不偏分散

    View Slide

  70. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    σ2
    不偏分散
    不偏分散 の分布
    母集団が任意の分布の場合の不偏分散

    View Slide

  71. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    σ2
    不偏分散
    不偏分散 の分布
    母集団が任意の分布の場合の不偏分散

    View Slide

  72. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    σ2
    不偏分散
    不偏分散 の分布
    母集団が任意の分布の場合の不偏分散

    View Slide

  73. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    σ2
    不偏分散
    不偏分散 の分布
    一致する
    母集団が任意の分布の場合の不偏分散

    View Slide

  74. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本
    標本



    標本の値 の分布
    標本の値 の分布
    μ
    σ2
    不偏分散
    不偏分散 の分布
    不偏分散は母分散の 不偏推定量になっている
    一致する
    母集団が任意の分布の場合の不偏分散

    View Slide

  75. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本の値 の分布
    標本の値 の分布
    μ
    σ2
    不偏分散
    不偏分散 の分布
    不偏分散は母分散の 不偏推定量になっている
    一致する
    標本
    標本



    母集団が任意の分布の場合の不偏分散

    View Slide

  76. 母集団
    「真の」確率モデル
    母平均μ
    母分散σ2
    データを抽出
    n個
    標本
    標本の値 の分布
    標本の値 の分布
    μ
    母集団が任意の分布の場合の不偏分散
    σ2
    不偏分散
    不偏分散 の分布
    不偏分散は母分散の 不偏推定量になっている
    一致する
    標本
    標本



    そのままの値で推定する
    (不偏推定)

    View Slide

  77. 頻度主義統計学の推測に対する考え方まとめ
    ● 「母集団を真の確率分布を持つデータ発生装置とみなし、
    真の確率分布から一個一個のデータ
    が発生してサンプルが構成されるという見方」=「頻度主義的統計モデリング」を導入した
    ○ サンプルは確率的に変動すると見なす一方で、母集団と母数は
    実際に観測可能かどうか
    に関わらず一意に決まるものと考える
    ● このような統計モデリングを導入した上で、標本統計量の性質を導くことで、標本統計量から母
    数を推定するリーズナブルな推定方法(不偏推定や最尤推定法等)を提示する
    ○ 標本統計量から母数を推定する方法を提示するのに、先に母数と標本統計量の数学的な
    関係性を熟知しておかなければならない

    View Slide

  78. 点推定 区間推定
    記述統計学
    ベイズ統計学









    統計学の分類
    仮説検定
    頻度主義統計学
    統計的推定
    推測統計学
    ここを中心に
    見てきた

    View Slide

  79. 頻度主義が批判されているポイント
    ● 論理体系が回りくどくて分かりにくい(でしょ?)
    ● そもそも一意に定まる母集団なんてものが存在するの?パラメータも一意の値を取
    るものなの?
    ○ サニーレタスの母集団って何?未来永劫サニーレタスは生まれ続けるけど?
    ○ 研究中の〇〇という肥料を与えたサニーレタスの母集団って何?
    ● パラメータについての仮説・命題がどの程度正しそうかを確率的に表すことはでき
    ない
    ○ 「例:平均身長が170cm以上である確率、A群の平均の重さよりもB群の平均の重さの方
    が大きい確率」といった確率を表すことはできない

    View Slide

  80. ● この勉強会のモチベーションとゴール
    ● 統計学入門 〜統計学・統計モデリングとは何か?〜
    ● 頻度主義統計学入門 〜頻度主義的考え方〜
    ● ベイズ統計学入門 〜ベイズ主義と頻度主義との違い〜
    ● ベイズ統計学における学習手法
    アジェンダ

    View Slide

  81. ベイズ統計学入門
    〜ベイズ主義と頻度主義との違い〜

    View Slide

  82. 条件付き確率の考え方
    全事象
    全事象:α大学の学生
    事象R:髪が長い学生
    事象A:男子学生
    事象B:女子学生
    事象R
    事象A 事象B

    View Slide

  83. 条件付き確率の考え方
    全事象
    事象R
    事象A 事象B
    積事象の確率
    男子学生でかつ髪が長い確率

    View Slide

  84. 条件付き確率の考え方
    全事象
    事象R
    事象A 事象B
    積事象の確率
    R
    男子学生の中で
    髪が長い人である確率
    男子学生である確率
    条件付き確率

    事象A


    男子学生でかつ髪が長い確率

    View Slide

  85. 全事象
    事象R
    事象A 事象B
    積事象の確率
    R
    R
    ✕ 事象R
    髪が長い人の中で
    男子学生である確率
    髪が長い確率
    条件付き確率
    事象R
    男子学生でかつ髪が長い確率

    View Slide

  86. 条件付き確率の考え方

    View Slide

  87. 条件付き確率の考え方

    View Slide

  88. ベイズの定理の導出

    View Slide

  89. ベイズの定理の導出
    R
    R


    View Slide

  90. ベイズの定理とベイズ推論
    Rという事象を観察したとする

    View Slide

  91. AとBのどちらから
    出てきたのかは分からない
    Rという事象を観察したとする
    ベイズの定理とベイズ推論

    View Slide

  92. AとBのどちらから
    出てきたのかは分からない
    そのRが
    Aから出てきたのか or Bから出てきたのか
    を推測する
    Rという事象を観察したとする
    ベイズの定理とベイズ推論

    View Slide

  93. AとBのどちらから
    出てきたのかは分からない
    そのRが
    Aから出てきたのか or Bから出てきたのか
    を推測する
    事後確率
    (事象観測後の事象の背景仮説の確率)

    Rという事象を観察したとする
    ベイズの定理とベイズ推論

    View Slide

  94. AとBのどちらから
    出てきたのかは分からない
    そのRが
    Aから出てきたのか or Bから出てきたのか
    を推測する
    事後確率
    (事象観測後の事象の背景仮説の確率)

    Rという事象を観察したとする
    ベイズの定理とベイズ推論

    View Slide

  95. AとBのどちらから
    出てきたのかは分からない
    そのRが
    Aから出てきたのか or Bから出てきたのか
    を推測する
    事後確率
    (事象観測後の事象の背景仮説の確率)

    Rという事象を観察したとする
    そもそもA or Bのどちらかである確率
    ベイズの定理とベイズ推論

    View Slide

  96. AとBのどちらから
    出てきたのかは分からない
    そのRが
    Aから出てきたのか or Bから出てきたのか
    を推測する
    事後確率
    (事象観測後の事象の背景仮説の確率)

    Rという事象を観察したとする
    そもそもA or Bのどちらかである確率
    そもそもAが発生しやすいのか、Bが発生しや
    すいのかに事後確率は比例する
    ベイズの定理とベイズ推論

    View Slide

  97. AとBのどちらから
    出てきたのかは分からない
    そのRが
    Aから出てきたのか or Bから出てきたのか
    を推測する
    事後確率
    (事象観測後の事象の背景仮説の確率)

    Rという事象を観察したとする
    そもそもA or Bのどちらかである確率
    Rの観測の前後でAが発生しやすいのか
    Bが発生しやすいのかが変化すると言える
    ベイズの定理とベイズ推論

    View Slide

  98. AとBのどちらから
    出てきたのかは分からない
    そのRが
    Aから出てきたのか or Bから出てきたのか
    を推測する
    事後確率
    (事象観測後の事象の背景仮説の確率)

    Rという事象を観察したとする
    そもそもA or Bのどちらかである確率 事前確率(事象観測前の事象の背景仮説の確率)
    ベイズの定理とベイズ推論
    Rの観測の前後でAが発生しやすいのか
    Bが発生しやすいのかが変化すると言える

    View Slide

  99. AとBのどちらから
    出てきたのかは分からない
    そのRが
    Aから出てきたのか or Bから出てきたのか
    を推測する
    事後確率
    (事象観測後の事象の背景仮説の確率)

    Rという事象を観察したとする
    A or Bのどちらかの仮説が正しい
    とした場合にRが発生し得る確率
    ベイズの定理とベイズ推論

    View Slide

  100. AとBのどちらから
    出てきたのかは分からない
    そのRが
    Aから出てきたのか or Bから出てきたのか
    を推測する
    事後確率
    (事象観測後の事象の背景仮説の確率)

    Rという事象を観察したとする
    背景からの事象の発生しやすさに
    背景の事後確率は比例する
    A or Bのどちらかの仮説が正しい
    とした場合にRが発生し得る確率
    ベイズの定理とベイズ推論

    View Slide

  101. AとBのどちらから
    出てきたのかは分からない
    そのRが
    Aから出てきたのか or Bから出てきたのか
    を推測する
    事後確率
    (事象観測後の事象の背景仮説の確率)

    Rという事象を観察したとする
    A or Bのどちらかの仮説が正しい
    とした場合にRが発生し得る確率
    尤度
    (背景仮説選択後の事象の尤もらしさの程度)
    ベイズの定理とベイズ推論
    背景からの事象の発生しやすさに
    背景の事後確率は比例する

    View Slide

  102. 全事象
    ベイズの定理とベイズ推論

    View Slide

  103. 全事象
    ベイズの定理とベイズ推論

    View Slide

  104. 全事象

    ∝ ✕

    ベイズの定理とベイズ推論

    View Slide

  105. 全事象


    事象Rを観測した時、
    仮説AとBのどちらがど
    の程度背景だった可能
    性があるのか


    そもそもA or Bの仮説
    のどちらがどの程度起
    こりやすいか
    ベイズの定理とベイズ推論
    A or Bの仮説が選択さ
    れたときにRがどの程
    度発生しやすいか

    View Slide

  106. 全事象


    事象Rを観測した時、
    仮説AとBのどちらがど
    の程度背景だった可能
    性があるのか


    そもそもA or Bの仮説
    のどちらがどの程度起
    こりやすいか
    ベイズの定理とベイズ推論
    :仮説AとBの確率の程度には関係がないので、実質意味を持たない
    A or Bの仮説が選択さ
    れたときにRがどの程
    度発生しやすいか

    View Slide

  107. あり得る背景仮説ごとの事後確率の比を決めるのは、尤度✕事前確率であるが、
    で割っておくことによって、すべての背景仮説の事後確率の和が1になる
    ベイズの定理とベイズ推論
    すべての背景仮説の事後確率の和を1にする働きをすることから、 を
    正規化定数、基準化定数、規格化定数などと呼ぶ

    View Slide

  108. 壺B
    壺A 壺A 壺A 壺B
    ベイズ推論による事後確率の計算例
    暗い部屋

    View Slide

  109. 壺B
    壺A 壺A 壺A 壺B
    ベイズ推論による事後確率の計算例
    暗い部屋

    View Slide

  110. 壺B
    壺A 壺A 壺A 壺B
    ベイズ推論による事後確率の計算例
    暗い部屋
    問題
    観測されたデータのみを元に
    どちらの仮説(壺はAだったのかBだったのか)
    が正しそうかを推測する
    壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、
    そのボールは赤色だった、
    ボールを取り出した壺はAとBのどちらだったのだろうか

    View Slide

  111. ベイズ推論による事後確率の計算例
    全仮説
    事象R
    仮説A 仮説B
    問題 壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、
    そのボールは赤色だった、
    ボールを取り出した壺はAとBのどちらだったのだろうか

    View Slide

  112. ベイズ推論による事後確率の計算例
    全仮説
    事象R
    仮説A 仮説B
    問題
    正規化定数
    壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、
    そのボールは赤色だった、
    ボールを取り出した壺はAとBのどちらだったのだろうか

    View Slide

  113. ベイズ推論による事後確率の計算例
    全仮説
    事象R
    仮説A 仮説B
    問題
    正規化定数
    事後確率
    壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、
    そのボールは赤色だった、
    ボールを取り出した壺はAとBのどちらだったのだろうか

    View Slide

  114. ベイズ推論による事後確率の計算例
    全仮説
    事象R
    仮説A 仮説B
    問題
    正規化定数

    ボールを取り出した壺はAだったのではないかと考える方が
    確からしそうだ
    事後確率
    壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、
    そのボールは赤色だった、
    ボールを取り出した壺はAとBのどちらだったのだろうか

    View Slide

  115. 壺B 壺B 壺A
    暗い部屋
    ベイズ推論による事後確率の計算例
    問題
    観測されたデータのみを元に
    どちらの仮説(壺はAだったのかBだったのか)
    が正しそうかを推測する
    どちら(壺A or B)の仮説をどの程度支持するべきか
    壺B
    壺A
    壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、
    そのボールは赤色だった、
    ボールを取り出した壺はAとBのどちらだったのだろうか

    View Slide

  116. 壺B
    壺A 壺B 壺B 壺A
    暗い部屋
    ベイズの定理と事前確率
    壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、
    そのボールは赤色だった、
    ボールを取り出した壺はAとBのどちらだったのだろうか
    問題
    事後確率を計算できない状況では
    事前確率も分からないはず
    事前確率が分からない状況で
    どちら(壺A or B)の仮説を
    どの程度支持するべきかを決められるのか?

    View Slide

  117. ベイズの定理と事前確率
    全仮説
    事象R
    事象R
    仮説A 仮説B


    View Slide

  118. ベイズの定理と事前確率
    全仮説
    事象R
    事象R
    仮説A 仮説B


    大小が逆転する

    View Slide

  119. ベイズ主義における確率の主観的解釈
    ● 事前確率が分かっていて、何度もボールを取り出し、その度に取り出した壺の答え
    合わせができるのであれば、ボールを取り出したのが実際に壺A、壺Bであった確
    率は、P(A|R)、P(B|R)に近づいていく
    ● 観測によって事前確率を決められない場合には、事前確率の決め方によって推論
    結果が大きく変わってしまうにも関わらず、事前確率を主観的に決めざるを得ない
    ○ データ分析における科学的客観性を本質的・根本的に脅かす
    ● ベイズ主義では、確率を「仮説に対する信念の度合い」として解釈することで、事前
    確率を客観的に決められない場合であっても、ベイズの定理によって事後確率を
    求め、推論を行うことができるとする
    ○ 「仮説に対する信念の度合い」として扱う確率を
    主観確率という

    View Slide

  120. 主観確率と客観確率
    ● ベイズ主義は、確率を「仮説に対する信念の度合い」=「主観確率」としてを扱うこと
    を許すが、
    頻度主義は、確率を「客観的な頻度(何分の何起こるか)」=「客観確率」としてしか
    扱わない
    ● 下記のような一期一会な事象は、同じ状況で試行を繰り返す思考実験ができず、客
    観確率を考えることはできないが、主観確率では表現することができる
    ○ 「あなたがAさんと1ヶ月以内にお付き合いできる確率」
    ○ 「この容疑者がBさん殺害の真犯人である確率」
    ○ 「火星に知的生命体がかつて生息していた確率」

    View Slide

  121. 逆確率の理論は誤謬の上に立脚するも
    のであって、完全に葬り去られなければ
    ならない
    観測上の根拠が前もって存在するよう
    な場合を除くと、逆確率の方法では、
    既知の標本が取り出された母集団に
    関する推論を、確率的に表現すること
    はできないのである
    フィッシャーによるベイズ推論批判とその例外
    ロナルド.A.フィッシャー(1890 - 1962年)

    View Slide

  122. 逆確率の理論は誤謬の上に立脚するも
    のであって、完全に葬り去られなければ
    ならない
    観測上の根拠が前もって存在するよう
    な場合を除くと、逆確率の方法では、
    既知の標本が取り出された母集団に
    関する推論を、確率的に表現すること
    はできないのである
    フィッシャーによるベイズ推論批判とその例外
    ロナルド.A.フィッシャー(1890 - 1962年)
    事前確率に観測上の根拠が存在する場合には、
    ベイズ推論(逆確率の方法)を認めているとも言える

    View Slide

  123. 頻度主義者によるベイズ主義批判
    ● 頻度主義が批判するベイズ主義のポイントは、① 確率を「仮説に対する信念の度合い」=
    主観確率として解釈すること、② 事前確率を主観的に決めること
    ● 事前確率に客観的頻度=客観確率を用いることができる場合は、頻度主義者もベイズの
    定理による事後確率の推論を認めざるを得ず、
    実際、何度もボールを取り出し、その度に取り出した壺の答え合わせができるのであれ
    ば、ボールを取り出したのが壺A、壺Bであった確率は、P(A|R)、P(B|R)に近づいていくは
    ずであるというように事後確率を頻度で解釈する
    ● 一方で、確率推論や統計学的推論において、事前確率に客観的根拠が存在することは決
    して多くはないので、頻度主義では推論対象についての仮説・命題を確率的に表す=事前
    ・事後確率を考えるようなことはしない
    ○ 「例:ボールを取り出した壺がAだった確率、〇〇の平均身長が
    170cm以上である確率、A群の平均の重さより
    もB群の平均の重さの方が大きい確率」といった推論対象についての確率を表すことはできない

    View Slide

  124. 事前確率の主観性に対する批判へのベイズ主義者の応答
    ● 考慮している仮説について事前に情報がない場合、そのどれもが同程度あり得そ
    うであると考え、全仮説に同じ確率を割りあてる「理由不十分の原則」を適用する
    ○ 例えば、マゼラン星雲に知的生物がいる確率は見当もつかないので 1/2に設定してもいいのか
    ○ 理由不十分の原則によって等確率を選択することは、情報不足な状況下において必ずしもフェアな
    対処ではない(『基礎からのベイズ統計学』)
    ● 探求の初期に主観的な相違があったとしても、データさえ十分に取ることができれ
    ば、実際上の問題にはならないとベイズ主義者は主張する(『統計学を哲学する』)
    ○ 実際には限られたデータから推論したい場面が多い
    ● 主観確率の不合理性・危険性は、今でも本質的には解決されてない。それどころ
    か、ベイズ統計学を専門としている学者の間でさえ主観確率の扱いに関する決定
    的な立場はまだない(『基礎からのベイズ統計学』)

    View Slide

  125. 壺B 壺B 壺A
    暗い部屋
    ベイズ更新による事後確率の計算例
    問題
    壺B
    壺A
    壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色
    だった、ボールを戻し、もう一度同じ壺からボールを取り出すとそのボールも赤色だった
    ボール
    を取り出した壺はAとBのどちらだったのだろうか

    View Slide

  126. 壺B 壺B 壺A
    暗い部屋
    ベイズ更新による事後確率の計算例
    問題
    ひとかたまりの事象として見る
    壺B
    壺A
    壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色
    だった、ボールを戻し、もう一度同じ壺からボールを取り出すとそのボールも赤色だった
    ボール
    を取り出した壺はAとBのどちらだったのだろうか

    View Slide

  127. ベイズ更新による事後確率の計算例
    全仮説
    事象R
    1
    ,R
    2
    仮説A 仮説B
    問題
    正規化定数
    壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色
    だった、ボールを戻し、もう一度同じ壺からボールを取り出すとそのボールも赤色だった
    ボール
    を取り出した壺はAとBのどちらだったのだろうか

    View Slide

  128. ベイズ更新による事後確率の計算例
    全仮説
    事象R
    1
    ,R
    2
    仮説A 仮説B
    問題
    正規化定数
    事後確率
    壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色
    だった、ボールを戻し、もう一度同じ壺からボールを取り出すとそのボールも赤色だった
    ボール
    を取り出した壺はAとBのどちらだったのだろうか

    View Slide

  129. ベイズ更新による事後確率の計算例
    全仮説
    事象R
    1
    ,R
    2
    仮説A 仮説B
    問題
    正規化定数
    事後確率

    赤ボール1つの場合とは逆に、赤ボール2つだった場合は取り出した
    壺はBだったのではないかと考える方が確からしい
    壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色
    だった、ボールを戻し、もう一度同じ壺からボールを取り出すとそのボールも赤色だった
    ボール
    を取り出した壺はAとBのどちらだったのだろうか

    View Slide

  130. 壺B 壺B 壺A
    暗い部屋
    ベイズ更新による事後確率の計算例
    壺が見えない暗い部屋に入って、壺の中のボールを取り出ししたところ、そのボールは赤色
    だった、ボールを戻し、もう一度同じ壺からボールを取り出すとそのボールも赤色だった
    ボール
    を取り出した壺はAとBのどちらだったのだろうか
    問題
    事象1の後に
    事象2が起こったと考える
    壺B
    壺A

    View Slide

  131. ベイズ更新による事後確率の計算例
    全仮説

    View Slide

  132. ベイズ更新による事後確率の計算例
    全仮説
    R
    1
    とR
    2
    は壺が選ばれた後は独立
    R
    1
    が選ばれた後にR
    2
    が選ばれる確率

    View Slide

  133. ベイズ更新による事後確率の計算例
    全仮説
    ベイズの定理
    R
    1
    を観測後の壺Aの事後確率

    View Slide

  134. ベイズ更新による事後確率の計算例
    全仮説
    ベイズの定理
    R
    1
    を観測後の壺Aの事後確率

    View Slide

  135. ベイズ更新による事後確率の計算例
    全仮説

    View Slide

  136. ベイズ更新による事後確率の計算例
    全仮説
    ベイズの定理の形をしている

    View Slide

  137. ベイズ更新による事後確率の計算例
    全仮説
    1回目R
    2
    を観測し、2回目R
    2
    を観測後の
    壺Aの事後確率を求めるベイズの定理
    2回目壺Aから赤ボールを取り出す尤度
    1回目R
    1
    が起こった後に2回目R
    2
    が起こる確率
    事象R
    1
    を観測後の壺Aの事後確率
    =事象R
    1
    を観測後に同じ壺Aから事象R
    2
    を観測する際の事前確率
    事象R
    1
    が与えられた時の事後確率を新たな事象
    R
    2
    の事前確率にすることができる
    “Today’s posterior is tomorrow’s prior”(Lindley,
    D.V.(2002))

    View Slide

  138. ベイズ更新による事後確率の計算例
    全仮説
    1回目R
    2
    を観測し、2回目R
    2
    を観測後の
    壺Aの事後確率を求めるベイズの定理
    2回目壺Aから赤ボールを取り出す尤度
    1回目R
    1
    が起こった後に2回目R
    2
    が起こる確率
    ベイズ推論とは、仮説に対する事前確率をデータによって更新(ベイズ更新)して事後確率を推論する
    こと = データによって仮説に対する信念をベイズ更新して推論すること
    事象R
    1
    を観測後の壺Aの事後確率
    =事象R
    1
    を観測後に同じ壺Aから事象R
    2
    を観測する際の事前確率
    事象R
    1
    が与えられた時の事後確率を新たな事象
    R
    2
    の事前確率にすることができる
    “Today’s posterior is tomorrow’s prior”(Lindley,
    D.V.(2002))

    View Slide

  139. 壺B 壺B 壺A
    暗い部屋
    ベイズ更新による事後確率の計算例
    壺が見えない暗い部屋に入って、壺の中のボールを
    10個取り出ししたところ、
    そのうち9個のボールは赤色だった、毎回ボールは壺に戻すとすると、
    ボールを取り出した壺はAとBのどちらだったのだろうか
    問題
    壺B
    壺A
    10個中9個赤ボール
    事前確率は無情報としP(A)=P(B)=1/2とする
    (理由不十分の原則)

    View Slide

  140. ベイズ更新による事後確率の計算例
    全仮説
    事象
    R
    1
    ,R
    2
    ,…,R
    10
    仮説A 仮説B
    問題
    正規化定数
    壺が見えない暗い部屋に入って、壺の中のボールを
    10個取り出ししたところ、
    そのうち9個のボールは赤色だった、毎回ボールは壺に戻すとすると、
    ボールを取り出した壺はAとBのどちらだったのだろうか

    View Slide

  141. ベイズ更新による事後確率の計算例
    全仮説
    事象
    R
    1
    ,R
    2
    ,…,R
    10
    仮説A 仮説B
    問題
    正規化定数
    33倍
    事後確率
    壺が見えない暗い部屋に入って、壺の中のボールを
    10個取り出ししたところ、
    そのうち9個のボールは赤色だった、毎回ボールは壺に戻すとすると、
    ボールを取り出した壺はAとBのどちらだったのだろうか

    View Slide

  142. 壺B 壺B 壺A
    暗い部屋
    ベイズ更新による事後確率の計算例
    壺が見えない暗い部屋に入って、壺の中のボールを
    10個取り出ししたところ、
    そのうち4個のボールは赤色だった、毎回ボールは壺に戻すとすると、
    ボールを取り出した壺はAとBのどちらだったのだろうか
    問題
    壺B
    壺A
    10個中4個赤ボール
    事前確率は無情報としP(A)=P(B)=1/2とする
    (理由不十分の原則)

    View Slide

  143. ベイズ更新による事後確率の計算例
    全仮説
    事象
    R
    1
    ,R
    2
    ,…,R
    10
    仮説A 仮説B
    問題
    正規化定数
    事後確率
    94倍
    壺が見えない暗い部屋に入って、壺の中のボールを
    10個取り出ししたところ、
    そのうち4個のボールは赤色だった、毎回ボールは壺に戻すとすると、
    ボールを取り出した壺はAとBのどちらだったのだろうか

    View Slide

  144. 近年までベイズ主義が実用的でないとされてきた理由
    ● 考慮している仮説について事前に情報がない場合、そのどれもが同程度あり得そ
    うであると考え、全仮説に同じ確率を割りあてる「理由不十分の原則」を取る
    ○ 例えば、マゼラン星雲に知的生物がいる確率は見当もつかないので 1/2に設定してもいいのか
    ○ 理由不十分の原則によって等確率を選択することは、情報不足な状況下において必ずしもフェアな
    対処ではない(『基礎からのベイズ統計学』)
    ● 探求の初期に主観的な相違があったとしても、データさえ十分に取ることができれ
    ば、実際上の問題にはならないとベイズ主義者は主張する(『統計学を哲学する』)
    ○ 実際には限られたデータから推論したい場面が多い
    ● 主観確率の不合理性・危険性は、今でも本質的には解決されてない。それどころ
    か、ベイズ統計学を専門としている学者の間でさえ主観確率の扱いに関する決定
    的な立場はまだない(『基礎からのベイズ統計学』)

    View Slide

  145. ベイズ推論まとめ
    ● ベイズ主義では、観測されたデータにを元に仮説の事後確率をベイズ更新していく
    ことで帰納推論を行う
    ● ベイズ主義では、確率を「仮説に対する信念の度合い」として解釈することで、事前
    確率を客観的に決められない場合であっても、ベイズの定理によって事後確率を
    求め、推論を行うことができるとする
    ● 主観確率の不合理性・危険性は、今でも本質的には解決されてない。それどころ
    か、ベイズ統計学を専門としている学者の間でさえ主観確率の扱いに関する決定
    的な立場はまだない(『基礎からのベイズ統計学』)ため、主観確率の問題点を理
    解した上で使用することが望ましい

    View Slide

  146. ベイズ主義統計学の萌芽
    確率モデル
    データD 未来のデータD’
    ①サンプリング
    ②推定
    ● 統計学とは、得られたデータのみから、そのデータが発生した背景の仮説を推測す
    るための学問であった
    ③予測

    View Slide

  147. ベイズ主義統計学の萌芽
    確率モデル
    データD 未来のデータD’
    ①サンプリング
    ②推定
    ● 統計学とは、得られたデータのみから、そのデータが発生した背景の仮説を推測す
    るための学問であった
    正規分布
    μ
    σ2
    推定対象
    ③予測

    View Slide

  148. ベイズ主義統計学の萌芽
    ①サンプリング ③予測
    ②推定
    ● 統計学とは、得られたデータのみから、そのデータが発生した背景の仮説を推測す
    るための学問であった
    ● データを元に推測対象であるパラメータの事後確率を推測しようと考えることで、ベ
    イズ主義を統計学に持ち込むことができる
    ○ パラメータの事後確率を考えるということは、パラメータの
    事後確率分布=事後分布を考
    えるということ
    正規分布
    μ
    σ2
    μ
    1
    μ
    2
    μ
    3
    μ
    4
    P(μ
    1
    |D)
    P(μ
    2
    |D)
    P(μ
    3
    |D)
    P(μ
    4
    |D)
    推定対象
    σ
    1
    σ
    2
    σ
    3
    σ
    4
    P(σ
    1
    |D)
    P(σ
    2
    |D)
    P(σ
    3
    |D)
    P(σ
    4
    |D)
    確率モデル
    データD 未来のデータD’
    μ事後確率 σ事後確率

    View Slide

  149. ベイズ主義統計学の萌芽
    ①サンプリング ③予測
    ②推定
    ● 統計学とは、得られたデータのみから、そのデータが発生した背景の仮説を推測す
    るための学問であった
    ● データを元に推測対象であるパラメータの事後確率を推測しようと考えることで、ベ
    イズ主義を統計学に持ち込むことができる
    ○ パラメータの事後確率を考えるということは、パラメータの
    事後確率分布=事後分布を考
    えるということ
    正規分布
    μ
    σ2
    μ
    1
    μ
    2
    μ
    3
    μ
    4
    P(μ
    1
    |D)
    P(μ
    2
    |D)
    P(μ
    3
    |D)
    推定対象
    σ
    1
    σ
    2
    σ
    3
    σ
    4
    P(σ
    1
    |D)
    P(σ
    2
    |D)
    P(σ
    3
    |D)
    P(σ
    4
    |D)
    確率モデル
    データD 未来のデータD’
    μ事後分布 σ事後分布
    P(μ
    4
    |D)

    View Slide

  150. ベイズ推論の確率分布への適応
    データDが発生した背後の確率モデルのパラメータθがある事前確率分布p(θ)に従うと
    仮定する。Dの尤度関数をp(D|θ)とするとき、パラメー タθの事後分布p(θ|D)はベイズの
    定理により与えられる
    パラメータ データ 事前分布
    尤度関数
    事後分布
    事後確率
    尤度 事前確率

    View Slide

  151. ベイズ推論の確率分布への適応
    データDが発生した背後の確率モデルのパラメータθがある事前確率分布p(θ)に従うと
    仮定する。Dの尤度関数をp(D|θ)とするとき、パラメー タθの事後分布p(θ|D)はベイズの
    定理により与えられる
    パラメータ データ 事前分布
    尤度関数
    事後分布 μ
    1
    μ
    2
    μ
    3
    μ
    4
    P(μ
    1
    )
    P(μ
    2
    ) P(μ
    3
    )
    P(μ
    4
    )
    μ
    1
    μ
    2
    μ
    3
    μ
    4
    P(μ
    1
    |D)
    P(μ
    2
    |D)
    P(μ
    3
    |D)
    P(μ
    4
    |D)

    View Slide

  152. ベイズ推論の確率分布への適応
    データDが発生した背後の確率モデルのパラメータθがある事前確率分布p(θ)に従うと
    仮定する。Dの尤度関数をp(D|θ)とするとき、パラメー タθの事後分布p(θ|D)はベイズの
    定理により与えられる
    パラメータ データ 事前分布
    尤度関数
    事後分布 μ
    1
    μ
    2
    μ
    3
    μ
    4
    P(μ
    1
    )
    P(μ
    2
    ) P(μ
    3
    )
    P(μ
    4
    )
    μ
    1
    μ
    2
    μ
    3
    μ
    4
    P(μ
    1
    |D)
    P(μ
    2
    |D)
    P(μ
    3
    |D)
    P(μ
    4
    |D)

    View Slide

  153. ベイズ推論の確率分布への適応
    データDが発生した背後の確率モデルのパラメータθがある事前確率分布p(θ)に従うと
    仮定する。Dの尤度関数をp(D|θ)とするとき、パラメー タθの事後分布p(θ|D)はベイズの
    定理により与えられる
    パラメータ データ 事前分布
    尤度関数
    事後分布 μ
    1
    μ
    2
    μ
    3
    μ
    4
    P(μ
    1
    )
    P(μ
    2
    ) P(μ
    3
    )
    P(μ
    4
    )
    μ
    1
    μ
    2
    μ
    3
    μ
    4
    P(μ
    1
    |D)
    P(μ
    2
    |D)
    P(μ
    3
    |D)
    P(μ
    4
    |D)

    View Slide

  154. 正規化定数の周辺化とベイズの定理 θ:パラメータ、D:データ
    を求めるために、事後確率の時と同様、尤度✕事前確率の和で表す
    背景仮説θが連続値であり、和を求める操作は積分となり、下記の式で表される

    View Slide

  155. 正規化定数の周辺化とベイズの定理 θ:パラメータ、D:データ
    を求めるために、事後確率の時と同様、尤度✕事前確率の和で表す
    背景仮説θが連続値であり、和を求める操作は積分となり、下記の式で表される
    周辺化

    View Slide

  156. 正規化定数の周辺化とベイズの定理 θ:パラメータ、D:データ
    尤度関数 事前分布
    モデルエビデンス
    周辺尤度
    正規化定数
    事後分布
    ベイズの定理に代入すると、次の等式を導くことができる
    実際、事後分布の和=積分を求めると

    View Slide

  157. 事後分布を求めるためには、正規化定数 を求める必要がある
    が、一般的に正規化定数を解析的に解くことは不可能
    そこで、
    事後分布の求め方
    という性質を利用し、マルコフ連鎖モンテカルロ法(MCMC)や変分推論法を用いて事後
    分布の近似計算を行うことが一般的である。
    θ:パラメータ、D:データ

    View Slide

  158. 「真の」確率モデル
    正規分布
    データを抽出
    標本
    μ
    σ2
    ベイズ主義

    View Slide

  159. 「真の」確率モデル
    正規分布
    データを抽出
    標本
    μ
    σ2
    ベイズ主義

    View Slide

  160. 「真の」確率モデル
    正規分布
    データを抽出
    標本
    μ
    σ2
    ベイズ主義
    ① 背後の確率モデルが正規分布なの
    ではないかと仮定し、
    事前分布p(θ)を設定する
    統計モデリング
    ①’ 母集団から確率的に発生した
    と見なす
    μ事前分布
    σ事前分布

    View Slide

  161. 「真の」確率モデル
    正規分布
    データを抽出
    標本
    μ
    σ2
    ② 標本から尤度関数p(D|θ)を計算して背後のモデルのパラメータ
    (ここでは平均μと標準偏差σ)の事後分布p(θ|D)を推定
    ベイズ主義
    統計モデリング
    ①’ 母集団から確率的に発生した
    と見なす
    ① 背後の確率モデルが正規分布なの
    ではないかと仮定し、
    事前分布p(θ)を設定する
    μ事前分布
    σ事前分布

    View Slide

  162. 「真の」確率モデル
    正規分布
    データを抽出
    標本
    μ
    σ2
    μ事後分布 σ事後分布
    μ事前分布
    σ事前分布
    ベイズ主義
    統計モデリング
    ①’ 母集団から確率的に発生した
    と見なす
    ① 背後の確率モデルが正規分布なの
    ではないかと仮定し、
    事前分布p(θ)を設定する
    ② 標本から尤度関数p(D|θ)を計算して背後のモデルのパラメータ
    (ここでは平均μと標準偏差σ)の事後分布p(θ|D)を推定

    View Slide

  163. 事後分布による点推定
    ベイズ統計学でも事後分布からパラメータを点推定することは可能
    事後分布
    MAP
    EAP
    ● 事後中央値MED
    MED
    ● 事後確率最大値MAP
    ● 事後期待値EAP

    View Slide

  164. ● (①)「今観測された事象(サンプル)は、背後にある確率モデルから確率的に発生
    したと考える枠組み」=「統計モデリング」を導入し、
    ● (②)その上で、背後にある確率モデルのパラメータをリーズナブルに推定する方法
    を明らかにし、の事後分布をベイズ推論で推定し
    ● (③)パラメータを推定した確率モデルを元に、新たな事象の「確率的な予測を行う」
    =「予測分布を生成する」
    ベイズ主義に基づく統計学の枠組み
    ベイズ主義は、統計モデリングをし、ベイズの定理を適用さえすればパラメータ
    の推定が可能であり、
    頻度主義の不偏推定のようなややこしい理論は必要ない

    View Slide

  165. ベイズ主義の事後予測分布
    尤度
    事後予測分布 事後分布

    View Slide

  166. θ
    D’
    θ=0.32
    0.12
    ✕ p(θ|D)=0.24
    尤度
    ベイズ主義の事後予測分布
    事後予測分布 事後分布

    View Slide

  167. θ
    D’
    θ
    D’
    θ=0.32
    θ=0.33
    θ
    D’
    0.12
    θ=0.85
    0.85









    p(θ|D)=0.24
    p(θ|D)=0.58
    p(θ|D)=1.8
    事後分布
    尤度
    ベイズ主義の事後予測分布
    事後予測分布

    View Slide

  168. θ
    θ
    θ=0.32
    θ=0.33
    θ
    0.12
    θ=0.85
    D’
    0.85









    すべてのθについて
    足し合わせる(積分する)
    D’
    D’
    D’
    p(θ|D)=0.24
    p(θ|D)=0.58
    p(θ|D)=1.8
    尤度
    ベイズ主義の事後予測分布
    事後予測分布 事後分布

    View Slide

  169. ● 頻度主義でもベイズ主義でも、背後にどのような確率モデルを想定するかは分析
    者の主観であるという点は同じで、かつ、一般的に同じような事象には同じ確率分
    布を想定する
    ○ 当然、分析者のモデリングがリーズナブルであるかは査定されるべき
    ● ベイズ主義では、母集団という言葉は使わない
    ○ ベイズ主義でも、サンプルは母集団から発生したもので、母集団のパラメータが「確率変
    数である」=「確率分布を持つ」という説明もあるが、
    パラメータが確率分布を持つ時点で母集団が一意な存在として定まっていないので、頻
    度主義的な意味での母集団ではない
    ● 背後にある規則性を確率論で定式化し、今得られたデータはその規則性からたま
    たま発生したものであると考えることは同じ
    ベイズ主義と頻度主義による統計モデリングの同異点

    View Slide

  170. 対象の事象の性質に基づく確率モデルの当てはめ
    ● 日本の中学生の男子の身長・体重
    ● ある肥料を与えたサニーレタスの重さ
    正規分布
    1.0
    0.5
    0
    θ
    1−θ
    1
    0
    ベルヌーイ分布
    二項分布
    θ
    ● コインをn回投げたときの裏表
    ● くじをn回引いて当たるか外れるか
    ● フリースローをn回投げて入るか入らないか
    ● 天気予報をn回行なって晴れたかどうか
    例えば、コイン投げであれば、コインが立つという第3の可
    能性を捨象している
    例えば、中学生男子の身長は、どこまでも大きい / 小さい値
    を取ることはないということを捨象している

    View Slide

  171. ベイズ統計学と事前分布の決め方
    ● できる限り主観を排するため、定義域の大きい一様分布や分散が非常に大きい正
    規分布などのできる限り事後分布に影響を与えない無情報事前分布を用いること
    が多い
    ● 共役事前分布という事後分布を計算しやすくするような事前分布を置くことも多い
    ○ 尤度関数に対して、事後分布と同じ種類の分布になるように設計された事前分布の
    こと
    参考:豊田秀樹. 『基礎からのベイズ統計学』
    尤度関数 共役事前分布 事後分布

    View Slide

  172. ベイズ統計学と事前分布の決め方
    ● できる限り主観を排するため、定義域の大きい一様分布や分散が非常に大きい正
    規分布などのできる限り事後分布に影響を与えない無情報事前分布を用いること
    が多い
    ● 共役事前分布という事後分布を計算しやすくするような事前分布を置くことも多い
    ○ 尤度関数に対して、事後分布と同じ種類の分布になるように設計された事前分布の
    こと
    参考:豊田秀樹. 『基礎からのベイズ統計学』
    尤度関数 共役事前分布 事後分布

    View Slide

  173. フリースローをθの確率で入れることができるSさん
    が、今10回フリースローを行うとする
    例えば、10回中6回入る確率は
    二項分布によるモデリング
    10
    C
    6
    θ6(1−θ)4
    出典:『SLAM DUNK』

    View Slide

  174. フリースローをθの確率で入れることができるSさん
    が、今10回フリースローを行うとする
    例えば、10回中6回入る確率は
    二項分布によるモデリング
    回数x
    10
    9
    8
    7
    6
    5
    4
    3
    2
    1
    0
    二項分布Bin(x|10,θ)=
    10
    C
    x
    θx(1−θ)n−x
    出典:『SLAM DUNK』
    10
    C
    6
    θ6(1−θ)4
    θ=0.7

    View Slide

  175. ベータ事前分布をもつ二項分布モデリングの事後分布
    尤度関数が二項分布の場合の共役事前分布はベータ事前分布である
    事後分布

    View Slide

  176. ベータ事前分布をもつ二項分布モデリングの事後分布
    尤度関数が二項分布の場合の共役事前分布はベータ事前分布である
    事後分布
    正規化定数

    View Slide

  177. ベータ事前分布をもつ二項分布モデリングの事後分布
    尤度関数が二項分布の場合の共役事前分布はベータ事前分布である
    事後分布
    正規化定数
    事後分布
    事後分布もベータ分布になり、パラメータは と

    View Slide

  178. ベータ事前分布をもつ二項分布モデリングの事後分布
    ベータ事前分布を持つ二項分布のパラメータθの事後分布
    事前分布 事前分布
    事後分布 事後分布
    n=10, x=6
    事前分布Beta(θ|1,1) 事前分布Beta(θ|2,2)
    θ θ
    0 0.2 0.4 0.6 0.8 1.0 0 0.2 0.4 0.6 0.8 1.0

    View Slide

  179. その他の事後分布の計算方法
    ● 次回の私の勉強会で丁寧に扱います、、、

    View Slide

  180. 事前分布に主観性に対する批判へのベイズ主義者の反論
    ● ベイズ更新を繰り返していけば、どのような事前分布から出発しても最終的には一
    つの形へと収束していく
    ○ データ数が増えるにつ連れ、事前分布の影響は徐々に薄まっていく
    ● 探求の初期に主観的な相違があったとしても、データさえ十分に取ることができれ
    ば、実際上の問題にはならないとベイズ主義者は主張する(『統計学を哲学する』)

    View Slide

  181. ベイズ主義と頻度主義の考え方の違いまとめ
    ● 頻度主義は、パラメータについての主観的確率を認めず、データが観測されようと
    されまいと、パラメータが一意に定まる前提に立つ
    ○ パラメータは観測されないため(頻度を語れない)、パラメータについての仮説・命題がどの程度正
    しそうかを確率的に表すことはできない
    ○ パラメータが一意に定まるという前提の元、今得られたサンプルがどの程度揺らぐのかを考え、せ
    いぜいリーズナブルな推定法を提示する
    ● ベイズ主義では、推測しようとしているパラメータに対する主観確率を認めること
    で、「不確実性を持たせる=確率的に扱う」ことによって、不確かな状況での推測を
    不確かなまま扱うことを可能にしている
    ○ 推測などというどこまで行ったって不確かなものは不確かなものとして扱いましょうというある意味
    素直な発想
    ○ その結果、パラメータについての仮説・命題がどの程度を正しそうかを確率で表すことができる(例
    :平均身長が170cm以上である確率、A群の平均の重さよりも B群の平均の重さの方が大きい確
    率)

    View Slide

  182. ベイズ主義と頻度主義の考え方の違いまとめ
    ● 今得られたデータが、背後にある規則性からたまたま発生したものであるという前
    提は同じで、その偶然性をどこで吸収しようとしているのかの違い
    ○ ベイズ主義は、パラメータを主観確率論で扱うことによって、データの偶然性をパラメータ側の確率
    で吸収しようという割り切ったスタンスを取る
    ■ 「今たまたま得られたデータのみから、背後のモデルのパラメータを一意に決め切ることなど
    到底無理。できるのはせいぜい確率分布の更新のみ。」「パラメータを不確実なものとして
    扱っているんだから、データの偶然性はその中に含めることができている。」
    ● 頻度主義の確率もベイズ主義の確率も確率の公理を満たしてることは同じだが、
    何に確率を適用しているのかが違う
    ○ つまり、「何を確率的に扱うべきか?」というスタンスが違う

    View Slide

  183. ベイズ主義における2群の平均値差の推測
    ● 頻度主義統計学における統計的仮説検定のp値とは、「帰無仮説が正しいと仮定
    する時、手元のデータ以上に甚だしい状況が生じる確率」というもってまわったよう
    な分かりにくい確率(『基礎からのベイズ統計学』)
    ● ベイズ主義においては、頻度主義における統計的仮説検定の代わりに、2群(もしく
    は複数群)の平均値に差がある確率を直接的に推測することが可能になる
    ○ これがベイズ主義統計学を使用する場合の大きな利点の一つである

    View Slide

  184. ベイズ主義
    データを抽出 Aの標本
    データを抽出 Bの標本
    μ
    A
    σ
    A
    2
    μ
    B
    σ
    B
    2
    確率モデルA
    確率モデルB
    A:弱い光を当てて育てた植物の重さ
    B:強い光を当てて育てた植物の重さ

    View Slide

  185. ベイズ主義
    データを抽出 Aの標本
    データを抽出 Bの標本
    μ
    A
    σ
    A
    2
    μ
    B
    σ
    B
    2
    確率モデルA
    確率モデルB
    A:弱い光を当てて育てた植物の重さ
    B:強い光を当てて育てた植物の重さ

    View Slide

  186. ベイズ主義
    データを抽出 Aの標本
    データを抽出 Bの標本
    μ
    A
    σ
    A
    2
    μ
    B
    σ
    B
    2
    μ
    A
    事後分布
    μ
    B
    事後分布
    確率モデルA
    確率モデルB
    A:弱い光を当てて育てた植物の重さ
    B:強い光を当てて育てた植物の重さ

    View Slide

  187. μ
    B
    事後分布
    ベイズ主義
    μ
    A
    事後分布
    μ
    1A
    μ
    1B
    μ
    2A
    μ
    2B
    μ
    nA
    μ
    nB
    ・・・
    ・・・
    比較 比較 比較
    μ
    iB
    の方が大きい確率を
    直接計算できる

    View Slide

  188. ベイズ統計学の有用性
    ● ベイズ統計学では、統計モデリングをして、ベイズの推論をすることで、パラメータ
    についての仮説・命題がどの程度を正しそうかを確率で表すことができる
    ○ 例:平均身長が170cm以上である確率、A群の平均の重さよりも B群の平均の重さの方が大きい確

    ○ 頻度主義の不偏推定や仮説検定のようなややこしい推測方法に関する理論は必要なく、推測に必
    要なのはベイズ定理のみ
    ● なぜ、フィッシャーたちがこれほどまでに有用なベイズの定理を受け入れられな
    かったのかと言われれば、主観確率を認めなかったこと、特にどのように事前分布
    を決めるべきかという問題にこだわり過ぎたからだろう
    ○ 事後分布の考え方そのものは批判しているわけではなく、一定受け入れているので、事前分布が
    どうしても気に入らなかったんだろう

    View Slide

  189. まとめ

    View Slide

  190. ● そもそも、観察・実験・調査を用いた経験主義的な科学の限界は、(全体から見た
    時に)一部の標本での結果しか得られないこと
    ○ 例えば、薬の臨床試験では、限られた人間でしか実験できず、「誰がやっても」「他の人間でも」「将
    来に渡って」同様の効果を得られるかどうかは極論分からない = 科学の本質である、客観性・普
    遍性・再現性は本質的には担保され得ない
    ● だからこそ、確率論的にデータの背後に潜む規則や構造を推察することで、帰納的
    推論を可能にするために統計学という学問は存在している
    ● 統計学は、科学的手法を確率論的に正当化することで、19世紀後半〜20世紀以
    降の科学の発展を支えてきた「縁の下の力持ち的学問」=近代科学を科学たらし
    めてきた
    ○ 現代統計学の金字塔となったR.A.Fisherの著書の名は『研究者のための統計的方法』
    ○ 例えば、実験心理学の父ヴィルヘルム・ヴントは、心理学に実験と統計学的分析を導入するこ
    とで、それまでの哲学的な心理学とは異なる実証的な心理学という境地を拓いた
    なぜ統計学が必要とされるのか?
    ?

    View Slide

  191. ● そもそも、観察・実験・調査を用いた経験主義的な科学の限界は、(全体から見た
    時に)一部の標本での結果しか得られないこと
    ○ 例えば、薬の臨床試験では、限られた人間でしか実験できず、「誰がやっても」「他の人間でも」「将
    来に渡って」同様の効果を得られるかどうかは極論分からない = 科学の本質である、客観性・普
    遍性・再現性は本質的には担保され得ない
    ● だからこそ、確率論的にデータの背後に潜む規則や構造を推察することで、帰納的
    推論を可能にするために統計学という学問は存在している
    ● 統計学は、科学的手法を確率論的に正当化することで、19世紀後半〜20世紀以
    降の科学の発展を支えてきた「縁の下の力持ち的学問」=近代科学を科学たらし
    めてきた
    ○ 現代統計学の金字塔となったR.A.Fisherの著書の名は『研究者のための統計的方法』
    ○ 例えば、実験心理学の父ヴィルヘルム・ヴントは、心理学に実験と統計学的分析を導入するこ
    とで、それまでの哲学的な心理学とは異なる実証的な心理学という境地を拓いた
    なぜ統計学が必要とされるのか?

    View Slide

  192. ● そもそも、観察・実験・調査を用いた経験主義的な科学の限界は、(全体から見た
    時に)一部の標本での結果しか得られないこと
    ○ 例えば、薬の臨床試験では、限られた人間でしか実験できず、「誰がやっても」「他の人間でも」「将
    来に渡って」同様の効果を得られるかどうかは極論分からない = 科学の本質である、客観性・普
    遍性・再現性は本質的には担保され得ない
    ● だからこそ、「観察されたデータに数学を応用」し、帰納的推論を可能にするために
    統計学という学問は存在している
    ● 統計学は、科学的手法を確率論的に正当化することで、19世紀後半〜20世紀以
    降の科学の発展を支えてきた「縁の下の力持ち的学問」=近代科学を科学たらし
    めてきた
    ○ 現代統計学の金字塔となったR.A.Fisherの著書の名は『研究者のための統計的方法』
    ○ 例えば、実験心理学の父ヴィルヘルム・ヴントは、心理学に実験と統計学的分析を導入するこ
    とで、それまでの哲学的な心理学とは異なる実証的な心理学という境地を拓いた
    なぜ統計学が必要とされるのか?

    View Slide

  193. 「我々はどのようにして真なる知識を獲得できるのか?」
    なぜ統計学が必要とされるのか?

    View Slide

  194. 「我々はどのようにして真なる知識を獲得できるのか?」
    なぜ統計学が必要とされるのか?
    というソクラテスの時代から続く哲学的問題に人類は、

    View Slide

  195. 「我々はどのようにして真なる知識を獲得できるのか?」
    なぜ統計学が必要とされるのか?
    というソクラテスの時代から続く哲学的問題に人類は、
    「適切な統計処理によって結論が証明※されているのであれば、正しいだろう、科学的
    知識と認めてよいだろう」という共通認識を得ることで、
    心の安寧を得て、科学的進歩に邁進することができるようになった

    View Slide

  196. ● 帰納推論が、「知っていることを元手に知らないことを推測する」という非演繹的推論である以上、
    疑いの余地のない論理的な推論を行うことは不可能
    ○ 統計学にできるのは、あくまで推論を正当化しようする試みでしかない
    ● 帰納推論を「どのように正当化することが正しいのか」=「どのように正当化すべきか」という問い
    が決着することはおそらく永遠にない
    ○ 自分の行なっている正当化手法が哲学的問題を孕むことに自覚的になり、展開している議論が真理
    促進的かに厳しい批判の目を向け続ける必要がある
    ● 統計学は帰納推論に確率論的思考の枠組みを与えたことで、帰納推論の正当化の
    ための議論を簡単にした一方で、本質的な危うさに無自覚にした
    最後に〜統計学に関する哲学的諸注意

    View Slide

  197. Appendix

    View Slide

  198. 母集団が正規分布の場合の標本分布
    母集団
    「真の」確率モデル
    正規分布xxxxxx
    μ
    σ2
    母平均μ

    View Slide

  199. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    μ
    σ2
    母平均μ
    「真の」確率モデル
    正規分布xxxxxx

    View Slide

  200. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    μ
    σ2
    母平均μ
    「真の」確率モデル
    正規分布xxxxxx
    確率的に発生している
    と見なす

    View Slide

  201. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    μ
    σ2
    母平均μ
    標本の値 の分布
    N回試行
    「真の」確率モデル
    正規分布xxxxxx

    View Slide

  202. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    μ
    σ2
    母平均μ
    標本の値 の分布
    「真の」確率モデル
    正規分布xxxxxx

    View Slide

  203. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    μ
    σ2
    母平均μ
    標本の値 の分布
    「真の」確率モデル
    正規分布xxxxxx

    View Slide

  204. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    μ
    σ2
    母平均μ
    標本の値 の分布
    「真の」確率モデル
    正規分布xxxxxx
    標本平均
    標本分布
    (標本平均 の分布)

    View Slide

  205. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    μ
    σ2
    母平均μ
    標本の値 の分布
    「真の」確率モデル
    正規分布xxxxxx
    標本平均
    標本分布
    (標本平均 の分布)
    全くの別物

    View Slide

  206. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    μ
    σ2
    標本平均
    母平均μ
    標本の値 の分布
    「真の」確率モデル
    正規分布xxxxxx
    標本分布
    (標本平均 の分布)
    全くの別物

    View Slide

  207. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    μ
    σ2
    標本平均
    母平均μ
    標本の値 の分布
    「真の」確率モデル
    正規分布xxxxxx
    標本分布
    (標本平均 の分布)
    全くの別物

    View Slide

  208. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    μ
    σ2
    標本平均
    母平均μ
    標本分布
    (標本平均 の分布)
    標本の値 の分布
    「真の」確率モデル
    正規分布xxxxxx
    全くの別物

    View Slide

  209. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    μ
    σ2
    μ
    標本平均
    母平均μ
    標本分布
    (標本平均 の分布)
    標本の値 の分布
    「真の」確率モデル
    正規分布xxxxxx
    全くの別物

    View Slide

  210. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    μ
    σ2
    μ
    標本平均
    一致する
    母平均μ
    標本分布
    (標本平均 の分布)
    標本の値 の分布
    「真の」確率モデル
    正規分布xxxxxx
    全くの別物

    View Slide

  211. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    μ
    σ2
    μ
    標本平均
    一致する
    母平均μ
    標本分布
    (標本平均 の分布)
    標本の値 の分布
    標本分布の平均(期待値)が、
    その統計量によって推定しようとしている母数の値に一
    致する時、その統計量は 不偏性を持つという
    また、普遍性をもつ統計量を母数の 不偏推定量という
    「真の」確率モデル
    正規分布xxxxxx
    全くの別物

    View Slide

  212. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    μ
    σ2
    μ
    標本平均
    母平均μ
    標本分布
    (標本平均 の分布)
    標本の値 の分布
    標本
    標本



    一致する
    母集団の分布を正規分布だと仮定したときに、
    標本平均は母平均の 不偏推定量になっているという性
    質を利用して、
    たまたま得られたサンプルの標本平均から母平均を推
    定することを不偏推定という
    「真の」確率モデル
    正規分布xxxxxx
    全くの別物

    View Slide

  213. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    μ
    σ2
    μ
    標本平均
    母平均μ
    標本分布
    (標本平均 の分布)
    標本の値 の分布
    標本
    標本



    一致する
    そのままの値で推定する
    母集団の分布を正規分布だと仮定したときに、
    標本平均は母平均の 不偏推定量になっているという性
    質を利用して、
    たまたま得られたサンプルの標本平均から母平均を推
    定することを不偏推定という
    「真の」確率モデル
    正規分布xxxxxx
    全くの別物

    View Slide

  214. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    μ
    σ2
    μ
    標本平均
    母平均μ
    標本分布
    (標本平均 の分布)
    標本の値 の分布
    標本
    標本



    一致する
    母集団の分布を正規分布だと仮定したときに、
    標本平均は母平均の 不偏推定量になっているという性
    質を利用して、
    たまたま得られたサンプルの標本平均から母平均を推
    定することを不偏推定という
    「真の」確率モデル
    正規分布xxxxxx
    そのままの値で推定する
    全くの別物

    View Slide

  215. 母集団が正規分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    μ
    σ2
    μ
    標本平均
    母平均μ
    標本分布
    (標本平均 の分布)
    標本の値 の分布
    標本
    標本



    一致する
    母集団の分布を正規分布だと仮定したときに、
    標本平均は母平均の 不偏推定量になっているという性
    質を利用して、
    たまたま得られたサンプルの標本平均から母平均を推
    定することを不偏推定という
    たまに母平均から大きくハズレてしまうこともあるが
    平均的には母平均に近い値をとるはずであると見なす
    「真の」確率モデル
    正規分布xxxxxx
    そのままの値で推定する

    View Slide

  216. 母集団が正規分布の場合の標本分布
    データを抽出
    m個
    母集団



    μ
    σ2
    母平均μ
    「真の」確率モデル
    正規分布xxxxxx

    View Slide

  217. 母集団が正規分布の場合の標本分布
    データを抽出
    m個
    母集団



    μ
    σ2
    標本平均
    母平均μ
    「真の」確率モデル
    正規分布xxxxxx

    View Slide

  218. 母集団が正規分布の場合の標本分布
    データを抽出
    m個
    母集団



    μ
    σ2
    μ
    標本平均
    母平均μ
    「真の」確率モデル
    正規分布xxxxxx

    View Slide

  219. 母集団が正規分布の場合の標本分布
    データを抽出
    m個
    母集団



    μ
    σ2
    μ
    標本平均



    データを抽出
    n個
    母平均μ
    m << n
    「真の」確率モデル
    正規分布xxxxxx

    View Slide

  220. 母集団が正規分布の場合の標本分布
    データを抽出
    m個
    母集団



    μ
    σ2
    μ
    標本平均



    データを抽出
    n個
    母平均μ
    m << n
    「真の」確率モデル
    正規分布xxxxxx

    View Slide

  221. 母集団が正規分布の場合の標本分布
    データを抽出
    m個
    母集団



    μ
    σ2
    μ
    標本平均



    データを抽出
    n個
    母平均μ
    m << n
    「真の」確率モデル
    正規分布xxxxxx

    View Slide

  222. 母集団が正規分布の場合の標本分布
    データを抽出
    m個
    母集団



    μ
    σ2
    μ
    標本平均



    データを抽出
    n個
    母平均μ
    m << n
    サンプル数nが大きくなるほど、標本平均は母平均に
    近い値を取る確率が大きくなる
    「真の」確率モデル
    正規分布xxxxxx

    View Slide

  223. 母集団が任意の分布の標本分布
    母集団
    「真の」確率モデル
    母平均μ
    μ

    View Slide

  224. 母集団が任意の分布の標本分布
    データを抽出
    m個
    母集団



    「真の」確率モデル
    母平均μ
    μ

    View Slide

  225. データを抽出
    m個
    母集団



    「真の」確率モデル
    母平均μ
    μ
    母集団が任意の分布の標本分布

    View Slide

  226. データを抽出
    m個
    母集団



    「真の」確率モデル
    標本平均
    母平均μ
    μ
    母集団が任意の分布の標本分布

    View Slide

  227. データを抽出
    m個
    母集団



    「真の」確率モデル
    μ
    標本平均
    母平均μ
    μ
    一致する
    母集団が任意の分布の標本分布

    View Slide

  228. データを抽出
    m個
    母集団



    「真の」確率モデル
    μ
    標本平均
    母平均μ
    μ



    データを抽出
    n個
    m << n
    一致する
    母集団が任意の分布の標本分布

    View Slide

  229. データを抽出
    m個
    母集団



    「真の」確率モデル
    μ
    標本平均
    母平均μ
    μ



    データを抽出
    n個
    m << n
    一致する
    母集団が任意の分布の標本分布

    View Slide

  230. データを抽出
    m個
    母集団



    「真の」確率モデル
    μ
    標本平均
    母平均μ
    μ



    データを抽出
    n個
    m << n
    一致する
    母集団が任意の分布の標本分布

    View Slide

  231. データを抽出
    m個
    母集団



    「真の」確率モデル
    μ
    標本平均
    母平均μ
    μ



    データを抽出
    n個
    m << n
    一致する
    xxxxxxxのとき、正規分布xxxxxxxxに近づく
    中心極限定理
    母集団が任意の分布の標本分布

    View Slide

  232. フリースローをθの確率で入れることができるSさん
    が、今10回フリースローを行うとする
    例えば、10回中7回入る確率は
    二項分布によるモデリング
    10
    C
    7
    θ7(1−θ)3
    出典:『SLAM DUNK』

    View Slide

  233. フリースローをθの確率で入れることができるSさん
    が、今10回フリースローを行うとする
    例えば、10回中7回入る確率は
    二項分布によるモデリング
    10
    C
    7
    θ7(1−θ)3
    回数
    10
    9
    8
    7
    6
    5
    4
    3
    2
    1
    0
    二項分布Bin(x|10,θ)=
    10
    C
    x
    θx(1−θ)n−x
    出典:『SLAM DUNK』

    View Slide

  234. 母集団がベルヌーイ分布の場合の標本分布
    母集団
    母比率θ
    1.0
    0.5
    0
    θ
    1−θ
    1
    0

    View Slide

  235. 母集団がベルヌーイ分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    母比率θ
    1.0
    0.5
    0
    θ
    1−θ
    1
    0

    View Slide

  236. 母集団がベルヌーイ分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    母比率θ
    1.0
    0.5
    0
    θ
    1−θ
    1
    0

    n
    C
    x1
    θx1(1−θ)n−x1

    View Slide

  237. 母集団がベルヌーイ分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    母比率θ
    1.0
    0.5
    0
    θ
    1−θ
    1
    0

    n
    C
    x1
    θx1(1−θ)n−x1

    View Slide

  238. 母集団がベルヌーイ分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    母比率θ
    1.0
    0.5
    0
    θ
    1−θ
    1
    0

    n
    C
    x1
    θx1(1−θ)n−x1
    どのように推定するのが
    リーズナブルか?

    View Slide

  239. 母集団がベルヌーイ分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    母比率θ
    標本比率
    1.0
    0.5
    0
    θ
    1−θ
    1
    0



    View Slide

  240. 母集団がベルヌーイ分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    母比率θ
    標本分布
    (標本比率 の分布)
    標本比率



    1.0
    0.5
    0
    θ
    1−θ
    1
    0

    View Slide

  241. 母集団がベルヌーイ分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    母比率θ
    標本分布
    (標本比率 の分布)
    標本比率



    Bin(x|n,θ)=
    n
    C
    x
    θx(1−θ)n−x
    1.0
    0.5
    0
    θ
    1−θ
    1
    0

    View Slide

  242. 母集団がベルヌーイ分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    母比率θ
    標本分布
    (標本比率 の分布)
    標本比率



    1.0
    0.5
    0
    θ
    1−θ
    1
    0
    平均θ
    Bin(x|n,θ)=
    n
    C
    x
    θx(1−θ)n−x

    View Slide

  243. 母集団がベルヌーイ分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    母比率θ
    標本分布
    (標本比率 の分布)
    標本比率



    1.0
    0.5
    0
    θ
    1−θ
    1
    0
    一致する
    母比率θの不偏推定量
    Bin(x|n,θ)=
    n
    C
    x
    θx(1−θ)n−x
    平均θ

    View Slide

  244. 母集団がベルヌーイ分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    母比率θ
    標本分布
    (標本比率 の分布)
    標本比率



    1.0
    0.5
    0
    θ
    1−θ
    1
    0
    一致する
    母比率θの不偏推定量
    Bin(x|n,θ)=
    n
    C
    x
    θx(1−θ)n−x
    平均θ

    View Slide

  245. 母集団がベルヌーイ分布の場合の標本分布
    データを抽出
    n個
    母集団
    標本
    標本
    標本



    母比率θ
    標本分布
    (標本比率 の分布)
    標本比率



    1.0
    0.5
    0
    θ
    1−θ
    1
    0
    一致する
    母比率θの不偏推定量
    Bin(x|n,θ)=
    n
    C
    x
    θx(1−θ)n−x
    そのままの値で推定する
    平均θ

    View Slide

  246. 帰納推論と統計学
    ● 我々は、帰納推論を行うとき、推論の対象となっている未観測の事象は、推論の前提となっているこ
    れまで観測されてきた事象と同様だろう、と無意識に想定している(『統計学を哲学する』)=自然の
    斉一性仮定
    ● データは、背後にある確率モデルからランダムに抽出されるので、サンプルごとに変わるが、そのも
    ととなる確率モデル自体は推論過程、あるいは未来を通じて同一に留まると仮定することで、
    データから確率モデルを推論することが可能であり、
    推論された確率モデルをもとに未来のデータも予測可能である
    という形で、自然の斉一性を定式化している
    ● 統計学の本領は、確率を用いて自然の斉一性を定式化することによって、限られたデータから帰納
    推論を正確に行い、さらにその推論の確からしさや信頼性を評価する枠組みを与えることである
    ○ 統計学的議論の中では、統計モデリングはあくまで近似のための道具であると認めている
    が、自然の斉一性は真なるものとして仮定されていることには注意

    View Slide

  247. ● (①、②)頻度主義統計学における統計モデリングとは、得られたサンプルが、特定
    の確率分布にしたがう母集団から確率的に(たまたま)発生したと考えること
    ● (③、④)統計モデリングに基づき、母集団の統計量(平均、分散、相関係数etc…)
    を統計的に推定することで母集団同士の比較や未知のデータの予測が可能になる
    ○ 母集団の統計量(平均、分散、相関係数
    etc…)を母数またはパラメータと呼ぶ
    頻度主義統計学における統計モデリングと点推定

    View Slide

  248. 頻度主義統計学における統計モデリングと点推定
    ● (①、②)頻度主義統計学における統計モデリングとは、得られたサンプルが、特定
    の確率分布にしたがう母集団から確率的に(たまたま)発生したと考えること
    →→ どのように統計モデリングをすればいいのか?
    ● (③、④)統計モデリングに基づき、母集団の統計量(平均、分散、相関係数etc…)
    を統計的に点推定することで母集団同士の比較や未知のデータの予測が可能に
    なる
    ○ 母集団の統計量(平均、分散、相関係数
    etc…)を母数またはパラメータと呼ぶ
    →→ どのように母数を推定するのか?

    View Slide

  249. 頻度主義統計学における統計モデリングと点推定
    ● (①、②)頻度主義統計学における統計モデリングとは、得られたサンプルが、特定
    の確率分布にしたがう母集団から確率的に(たまたま)発生したと考えること
    →→ どのように統計モデリングをすればいいのか?
    ● (③、④)統計モデリングに基づき、母集団の統計量(平均、分散、相関係数etc…)
    を統計的に点推定することで母集団同士の比較や未知のデータの予測が可能に
    なる
    ○ 母集団の統計量(平均、分散、相関係数
    etc…)を母数またはパラメータと呼ぶ
    →→ どのように母数を推定するのか?
    すでに論じてきた

    View Slide

  250. 対象の事象の性質に基づく分布族の当てはめ
    ● 日本の中学生の男子の身長・体重
    ● 全国統一小学生テストの点数
    正規分布
    1.0
    0.5
    0
    θ
    1−θ
    1
    0
    ベルヌーイ分布
    二項分布
    θ
    ● コインを投げて裏表
    ● 靴を投げて裏表
    ● くじを引いて当たるか外れるか
    ● フリースローを投げて入るか入らないか
    例えば、コイン投げであれば、コインが立つという第3の可
    能性を捨象している
    例えば、中学生男子の身長は、どこまでも大きい / 小さい値
    を取ることはないということを捨象している

    View Slide

  251. 頻度主義統計学における統計モデリングと点推定
    ● 推測統計では、大抵の場合、対象となる確率分布は、特定の関数形で与えられる
    分布(正規分布、二項分布、ポアソン分布、etc…)になると仮定する
    ○ これらの分布は有限個のパラメータでその関数形が決定される
    ○ このような対象の確率分布が特定の分布で与えられるとする考え方をパラメトリックと言う
    ● パラメトリックな推測統計では、モデリングの対象を一定の範囲の分布(要は有名
    で性質がよく知られた分布)に絞ることが一般的
    ● このようなモデリングを分析者が自らの考察・経験に基づき、主観的に行うことが統
    計学の難しさ
    ○ 当然、分析者のモデリングがリーズナブルであるかは査定されるべき
    ○ モデルの選択を定量的に行う手法も存在する

    View Slide

  252. 点推定 区間推定
    記述統計学
    ベイズ統計学









    統計学の分類
    仮説検定
    頻度主義統計学
    統計的推定
    推測統計学
    ここも軽く触
    れておく

    View Slide

  253. 統計的仮説検定の考え方のイメージ
    10回中9回表が出た
    本物のコイン
    イカサマのコイン
    10回中7回表が出た
    0.879%
    24.2%
    11.7%
    20.1%

    View Slide

  254. 統計的仮説検定の考え方のイメージ
    10回中9回表が出た
    本物のコイン
    イカサマのコイン
    10回中7回表が出た
    0.879%
    24.2%
    11.7%
    20.1%
    本物のコインだと仮定するとかなり奇跡
    的なことが起こっているが、イカサマのコ
    インだと仮定すれば、十分起こり得そう
    どちらのコインだと仮定してもあり得ない
    というほどのことが起こっているわけでは
    ない

    View Slide

  255. 統計的仮説検定の考え方のイメージ
    10回中9回表が出た
    本物のコイン
    イカサマのコイン
    10回中7回表が出た
    0.879%
    24.2%
    11.7%
    20.1%
    本物のコインだと仮定するとかなり奇跡
    的なことが起こっているが、イカサマのコ
    インだと仮定すれば、十分起こり得そう
    どちらのコインだと仮定してもあり得ない
    というほどのことが起こっているわけでは
    ない
    本物のコインであるという仮説を棄却し、
    イカサマのコインであるという仮説を選択
    した方が妥当
    どちらの仮説も捨て去るほどでもなく、結
    果どちらの仮説を選択する方が妥当とい
    うのも言えない

    View Slide

  256. データを抽出
    母集団A
    Aの標本
    データを抽出
    母集団B
    Bの標本
    頻度主義
    A:弱い光を当てて育てた植物の重さ
    B:強い光を当てて育てた植物の重さ

    View Slide

  257. サンプルにどれだけ差があるのか
    にはあまり興味がない
    データを抽出
    母集団A
    Aの標本
    データを抽出
    母集団B
    Bの標本
    頻度主義
    A:弱い光を当てて育てた植物の重さ
    B:強い光を当てて育てた植物の重さ
    本当に知りたいのは、
    母集団に差があるのか

    View Slide

  258. データを抽出
    母集団A
    Aの標本
    データを抽出
    母集団B
    Bの標本
    頻度主義
    A:弱い光を当てて育てた植物の重さ
    B:強い光を当てて育てた植物の重さ

    View Slide

  259. 頻度主義
    データを抽出
    母集団A
    Aの標本
    データを抽出
    母集団B
    Bの標本
    μ
    A
    σ
    A
    2
    μ
    B
    σ
    B
    2
    母集団に差があるのか

    View Slide

  260. 頻度主義
    データを抽出
    母集団A
    Aの標本
    データを抽出
    母集団B
    Bの標本
    μ
    A
    σ
    A
    2
    μ
    B
    σ
    B
    2
    平均値差
    μ
    A-B

    View Slide

  261. 頻度主義
    データを抽出
    母集団A
    Aの標本
    データを抽出
    母集団B
    Bの標本
    μ
    A
    σ
    A
    2
    μ
    B
    σ
    B
    2
    平均値差
    μ
    A-B

    View Slide

  262. 頻度主義
    データを抽出
    母集団A
    Aの標本
    データを抽出
    母集団B
    Bの標本
    μ
    A
    σ
    A
    2
    μ
    B
    σ
    B
    2
    平均値差
    μ
    A-B

    View Slide

  263. 頻度主義
    データを抽出
    母集団A
    Aの標本
    データを抽出
    母集団B
    Bの標本
    μ
    A
    σ
    A
    2
    μ
    B
    σ
    B
    2
    平均値差
    μ
    A-B

    0
    帰無仮説

    View Slide

  264. 頻度主義
    データを抽出
    母集団A
    Aの標本
    データを抽出
    母集団B
    Bの標本
    μ
    A
    σ
    A
    2
    μ
    B
    σ
    B
    2
    平均値差
    μ
    A-B

    0
    帰無仮説
    2.5%棄却域
    2.5%棄却域

    View Slide

  265. 頻度主義
    データを抽出
    母集団A
    Aの標本
    データを抽出
    母集団B
    Bの標本
    μ
    A
    σ
    A
    2
    μ
    B
    σ
    B
    2
    平均値差
    μ
    A-B

    0
    帰無仮説
    2.5%棄却域
    2.5%棄却域
    帰無仮説を支持するには、
    あまりにも(?)起きづらい確率

    View Slide

  266. 頻度主義
    データを抽出
    母集団A
    Aの標本
    データを抽出
    母集団B
    Bの標本
    μ
    A
    σ
    A
    2
    μ
    B
    σ
    B
    2
    平均値差
    μ
    A-B

    0
    帰無仮説
    2.5%棄却域
    2.5%棄却域
    棄却する
    帰無仮説を支持するには、
    あまりにも(?)起きづらい確率

    View Slide

  267. ● 知りたいのは、サンプルではなく、あくまで母集団に差があるのか
    ● 2つの母集団が正規分布のとき、母集団の平均値差/平均値差の標準偏差の分布
    はt分布になる
    ● サンプルの標本平均値差が、母集団の平均値差を0とした時のt分布から発生した
    と仮定した時(帰無仮説)、その発生確率をp値と呼ぶ
    ● p値 < 5%(1%)のとき、今得られたサンプルの標本平均値差は、非常に「珍しい」も
    のだと考え、元の帰無仮説を棄却する
    ○ 帰無仮説が正しくない確率が 5%というわけでも、
    2群の平均値差の検定

    View Slide