Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Concepts and Methods of Bayesian Statistics

Ken
August 31, 2018

Concepts and Methods of Bayesian Statistics

Presentation at the Japanese Society for Cognitive Psychology

Ken

August 31, 2018
Tweet

More Decks by Ken

Other Decks in Research

Transcript

  1. 3 Figure: van de Schoot et al. (2017) http://psycnet.apa.org/record/2017-24635-002 

    内訳としては,線形モデルについで,認知心理学的な 応用(認知モデル,計算論モデル)が多い (van de Schoot et al., 2017)
  2. 近年の心理学におけるベイズ統計 4 心の普遍的な法則性を解明・ 理解したい(数理心理学) 帰無仮説検定の 本来の意味を超えた濫用誤用 階層・潜在変数モデリングの ツールとしてのベイズ (認知モデル・計算論モデル) オルタナティヴな分析,

    評価の枠組みとしてのベイズ (ベイズファクター) ベイズ統計的アプローチの受容・応用が進んでいる マルコフ連鎖モンテ カルロ(MCMC)法 JAGS・Stan等 のソフトウェア Figure: 清水(2018) 心理学におけるベイズ統計モデリング 心理学評論 に基づき改変 再現可能性 問題 心理学における 統計改革 学んでみる・やってみると ベイズ統計の考え方は自然で合理的だ
  3. 近年の心理学におけるベイズ統計 5 心の普遍的な法則性を解明・ 理解したい(数理心理学) 「p<.05」や帰無仮説検定の 本来の意味を超えた濫用誤用 階層・潜在変数モデリングの ツールとしてのベイズ (認知モデル・計算論モデル) オルタナティヴな分析,

    評価の枠組みとしてのベイズ (ベイズファクター) 学んでみる・やってみると ベイズ統計の考え方は自然で合理的だ マルコフ連鎖モンテ カルロ(MCMC)法 JAGS・Stan等 のソフトウェア 再現可能性 問題 心理学における 統計改革 Figure: 清水(2018) 心理学におけるベイズ統計モデリング 心理学評論 に基づき改変 ベイズ統計的アプローチの受容・応用が進んでいる
  4.  知りたいこと・不確かなことを確率で表現する  データの情報から,その確率を更新する () = () ベイズ統計学の考え方 8 ▪推定

    � = � Θ � 将来のデータ� ▪予測 ▪モデル比較 → ()の比(ベイズファクター) 統計モデル ベイズの定理 知りたいこと パラメータ 手に入ったデータ 事後確率(分布) 事前確率(分布) 尤度 事後予測確率(分布) 事後確率(分布) 尤度 周辺尤度
  5.  英単語の問題が1問ずつ出題されるテスト  結果は正答か誤答かのどちらか  各問題の難易度は等しいとする  = 20問のうち問に正答した,というデータから, 回答者の正答確率(単語力)を推定したい

     モデル: 例1:比率の推定 9 θ ~ Beta(1, 1) (一様分布) y ~ Binominal(θ, n) (二項分布) 正答できる確率 正答数 問題数 □:離散変数 ◦:連続変数 色つき:観測 色なし:非観測
  6. 19 Pre-MCMC Post-MCMC  共役事前分布以 外の推論は困難  ベイズ統計は机 上の空論? 

    理論的に綺麗だ が、簡単な問題 以外では実際に 使えない  計算機を使って、ベ イズ推定が様々なモ デルで容易・自在に 行えるように
  7. 近年の心理学におけるベイズ統計 20 心の普遍的な法則性を解明・ 理解したい(数理心理学) 「p<.05」や帰無仮説検定の 本来の意味を超えた濫用誤用 階層・潜在変数モデリングの ツールとしてのベイズ (認知モデル・計算論モデル) オルタナティヴな分析,

    評価の枠組みとしてのベイズ (ベイズファクター) 学んでみる・やってみると ベイズ統計の考え方は自然で合理的だ マルコフ連鎖モンテ カルロ(MCMC)法 JAGS・Stan等 のソフトウェア 再現可能性 問題 心理学における 統計改革 Figure: 清水(2018) 心理学におけるベイズ統計モデリング 心理学評論 に基づき改変 ベイズ統計的アプローチの受容・応用が進んでいる
  8. 現代のベイズ推論のための典型的道具 22  統計環境  MCMCエンジン + https://cran.r-project.org/ https://sourceforge.net/projects/mcmc-jags/ http://mc-stan.org/

    https://www.rstudio.com/ (R Core Team, 2018) (RStudio Team, 2015) (Plummer, 2003) (Carpenter et al., 2017; Stan Development Team, 2018) 22
  9. model{ theta ~ dbeta(1,1) y ~ dbin(theta,n) } JAGSでの記述 θ

    ~ Beta(0, 1) (一様分布) y ~ Binominal(θ, n) (二項分布) 正答できる確率 正答数 問題数 23
  10. data { int<lower=0> n; int<lower=0> y; } parameaters { real<lower=0,upper=1>

    theta; } model { theta ~ beta(1,1); y ~ binomial(n,theta); } Stanでの記述 24 24
  11. モデリング的な考え方の重要性  JAGSやStanに代表される,MCMC法によるベイズ推定 を実装したオープンなソフトウェアの登場で,モデリ ング研究は心理学者に実行可能なものになった  これから紹介する例:  社会心理学における古典的な知見とされてきた 

    モデリングという観点を導入することで,研究者コ ミュニティが数十年にわたって見落としてきた問題 が浮き彫りになった  Chen & Risen (2009, JESP; 2010 JPSP)が数理モデル化し て指摘, Izuma & Murayama (2013, Front Psych)がシ ミュレーションで示す  竹澤(2018, 心理学評論)に紹介 26 竹澤正哲 (2018). 心理学におけるモデリングの必要性 心理学評論, 61, 43-54. http://team1mile.com/sjpr61-1/contents_original/takezawa2018/
  12. 自由選択 (free choice)パラダイム 27 (Brehm, 1956) 各アイテムに対する 選好度(時点1)を リッカート尺度で評定 どちらかを持ち帰ってよい

    とくに持ち帰らない AとBの選好度は 平均的に等しい 選好度(時点2) をリッカート 尺度で評定 たまたま持ち帰るために選んだBの 選好度がAよりも平均的に高くなる ⇒ 認知的不協和理論を支持(と,されてきた) ランダムに同じ選好度の 2アイテムが提示 Figure: Izuma & Murayama (2013) https://www.frontiersin.org/articles/10.3389/fpsyg.2013.00041/full
  13. 認知的不協和(cognitive dissonance)  行動と自分の選好が一貫してい ない場合に不快な感情状態が引 き起こされ(認知的不協和), これを低減するために自分の好 みが変化させられる 28 Figure:

    玉川大学脳科学研究所 http://www.tamagawa.ac.jp/brain/news/101213.html  自由選択パラダイムでは,最初はA,Bの2つを同程度に 選好していたのに,敢えて一方を持ち帰るために選択 させることによって、アイテムの選好度が変化 ⇒ 認知的不協和理論を支持
  14. 「認知的不協和」は必要か? この数理モデルの想定  各アイテムについて の選好は確率分布に よって表現される  観測される評定値は, 背後にある選好の確 率分布からの実現値

    を四捨五入した値で ある 29 Figure: Izuma & Murayama (2013) https://www.frontiersin.org/articles/10.3389/fpsyg.2013.00041/full (Chen & Risen, 2009, JESP; 2010 JPSP)
  15. 階層ベイズモデルによる推定 例 32 Figure: Shibuya, Okada, et al. (2018) Hierarchical

    Bayesian models for the autonomic-based concealed information test. Biological Psychology, 132, 81-90. https://doi.org/10.1016/j.biopsycho.2017.11.007 盗まれうる対象物 生理指標値(心拍数,皮膚コンダク タンス反応,脈波容積,呼吸数) 実験条件(盗んだ, コントロール) 繰り返し(5回/物) 実験参加者 P=167 人
  16. 速さと正確さのトレードオフ  選択行動と反応時間を測定する心理実験課題では, 「速いけど不正確」な人もいれば,「遅いけど正 確」な人もいる  単に観測された反応時間や正答率を指標として用 いるだけでは,こうした速さと正確さのトレード オフを考慮できない 

    内的な過程の認知モデリングによって心理学的意 味を持つパラメータを推定し,それを用いて議論 を行えるとよい 33 Ratcliff, R. (1985). Theoretical interpretations of the speed and accuracy of positive and negative responses. Psychological Review, 92, 212-225. http://psycnet.apa.org/record/1985-19264-001
  17. 34 反応時間の拡散(diffusion)モデル 反応時間 の分布 内的 過程 Figure: Wiecki et al.

    (2013) https://www.frontiersin.org/articles/10.3389/fninf.2013.00014/full β τ δ α 傾き ドリフト率(処理の速さ) 初期バイアス 非決定時間 境界の幅 (慎重さ) (Ratcliff, 1978, Psych Review)
  18. 脳波のN200ピーク潜時は階層ベイズ推定した Diffusionモデルの非決定時間と相関する 35 Figure: Nunez et al. (2018). The latency

    of a visual evoked potential tracks the onset of decision making bioRxiv https://www.biorxiv.org/content/early/2018/04/19/275727
  19. 近年の心理学におけるベイズ統計 40 心の普遍的な法則性を解明・ 理解したい(数理心理学) 「p<.05」や帰無仮説検定の 本来の意味を超えた濫用誤用 階層・潜在変数モデリングの ツールとしてのベイズ (認知モデル・計算論モデル) オルタナティヴな分析,

    評価の枠組みとしてのベイズ (ベイズファクター) 学んでみる・やってみると ベイズ統計の考え方は自然で合理的だ マルコフ連鎖モンテ カルロ(MCMC)法 JAGS・Stan等 のソフトウェア 再現可能性 問題 心理学における 統計改革 Figure: 清水(2018) 心理学におけるベイズ統計モデリング 心理学評論 に基づき改変 ベイズ統計的アプローチの受容・応用が進んでいる
  20. Open Science Collaboration (2015, Science) 42  心理学のトップジャーナル3誌に2008年以降刊行され た100の研究を世界各国の270の研究者が追試 

    Psychological Science,Journal of Personality and Social Psychology,Journal of Experimental Psychology: Learning, Memory, and Cognition 元論文 追試 元論文 追試 p値 (p value) 効果量(effect size) 有意の割合 95%→36% 半減
  21. Bem (2011, J Pers Soc Psy)  どちらかのカーテンの背後には画像があり,どちらかには 何もない。画像がある方を当ててほしい 

    手続きを変えて実験を9個行い,うち8個で「有意な」結 果を得ているが,たとえば実験1は:  N=100, 1人あたり36試行  (性的な画像12試行, ネガティブな画像12試行, 中立画像12試行)  結果,性的な画像の時だけチャンスレベルを超える 53.1%の正答率 ( t(99)=2.51, p=.01, d=.25) 46
  22. Wagenmakers & Lee (2013, Cambridge U Press)  Bem (2011,

    JPSP)の論文は「統計的に有意になる までデータ収集を繰り返した」可能性がある 47 Bem (2011, JPSP)の実験1~9における効果量(effect size)と標本サイズとの関係 標本サイズ 効果量 両者の相関係数 (の事後分布)
  23. p-hacking (Simmons et al, 2011, Pscych Sci)  心理学の研究論文における一般的な(当時)報告の基 準を満たしつつ,p値を小さくする操作

     結果を見ながら参加者を少しずつ足して検定を繰 り返し,有意になったところでとめる  多くの説明変数・共変量を用いて分析を行い,有 意になったものだけを報告する  行った条件や測定した変数の一部だけ報告  論文中に書かれない研究者の自由度(researchers’ degrees of freedom)が大きいことによる  「差がある」(対立仮説)だけに価値をおく,帰無仮説 検定に基づく意識からの脱却  研究の事前登録,研究素材やデータ・コードの公開 オープンサイエンス 48
  24. Masicampo & Lalande (2012, Quart J Exp Psych)  Journal

    of Experimental Psychology: General, Journal of Personality and Social Psychology,Psychological Science の3 誌で2007年から2008 年の間に報告された p値を集計 50
  25. Legget et al. (2013, Quart J Exp Psych) 51 

    2誌における1965年と2005年の比較
  26. ベイズファクター  あるモデル ( = 1,2)のもとでの推論は  モデルの平均的な予測力(周辺尤度) = �

    Θ , ※対数周辺尤度の符合反転が自由エネルギー(e.g., 乾, 2018) の比であるベイズファクター(Bayes factor) 21 = (|2 ) (|1 ) を,2モデル間のモデル比較に用いる 「帰無仮説」に特別な地位を与えず,「対立仮説」 と平等に支持・不支持することができる 53 , = , (| ) (| ) 仮説 と基本的に同義 乾敏郎 (2018) 知覚・認知・運動・感情・意思決定をつなぐ自由エネルギー原理 日本神経回路学会誌
  27. モデルの事後確率とベイズファクター  モデル の事後確率は = ( ) () = (

    ) ∑ℎ=1 ℎ ℎ  考えるモデルが2つ(K=2)の場合には 54 (2 |) (1 |) = 2 1  ベイズファクターは、データによって与えられた、 モデル1 に比してモデル2 を支持する程度(オッ ズ)の変化を表す (2 ) (1 ) 21 (Jeffreys, 1935; Kass & Raftery, 1995, JASA)
  28. 例:ベイズ的t検定 (Rouder et al., 2009) 56 データ = {−1.7, 1.6,

    0.3, −0.5, 0.3, 0.2, −0.2, −0.9, 0.8, 0.5} 図: 岡田謙介(2018)ベイズファクターによる心理学的仮説・モデルの評価 心理学評論,61, 101-115. http://team1mile.com/sjpr61-1/okada.pdf Rouder et al. (2009) Bayesian t tests for accepting and rejecting the null hypothesis. Psychonomic Bulletin & Review, 16, 225-237. https://doi.org/10.3758/PBR.16.2.225 56
  29. 57 Camerer et al. (2018). Evaluating the replicability of social

    science experiments in Nature and Science between 2010 and 2015. Nature Human Behavior, Online Ahead of Print. https://doi.org/10.1038/s41562-018-0399-z Open Science Framework: https://osf.io/pfdyw/
  30. 58 Camerer et al. (2018). Evaluating the replicability of social

    science experiments in Nature and Science between 2010 and 2015. Nature Human Behavior, Online Ahead of Print. https://doi.org/10.1038/s41562-018-0399-z 58
  31. 59 Camerer et al. (2018). Evaluating the replicability of social

    science experiments in Nature and Science between 2010 and 2015. Nature Human Behavior, Online Ahead of Print. https://doi.org/10.1038/s41562-018-0399-z 59
  32. まとめ(再掲) 61 心の普遍的な法則性を解明・ 理解したい(数理心理学) 「p<.05」や帰無仮説検定の 本来の意味を超えた濫用誤用 階層・潜在変数モデリングの ツールとしてのベイズ (認知モデル・計算論モデル) オルタナティヴな分析,

    評価の枠組みとしてのベイズ (ベイズファクター) マルコフ連鎖モンテ カルロ(MCMC)法 JAGS・Stan等 のソフトウェア Figure: 清水(2018) 心理学におけるベイズ統計モデリング 心理学評論 の図を改変 再現可能性 問題 心理学における 統計改革 学んでみる・やってみると ベイズ統計の考え方は自然で合理的だ ベイズ統計的アプローチの受容・応用が進んでいる
  33. 62