Slide 1

Slide 1 text

ベイズ統計学の考え方と方法 東京大学 教育学研究科 岡田謙介 ([email protected]) 1 日本認知心理学会第16回大会(立命館大学) ベーシック&フロンティアセミナー Aug 31, 2018

Slide 2

Slide 2 text

 心理学分野におけるベイズ統計的アプローチの(正確 には“Bayesian“の語を含む)論文は,絶対数・相対数 ともに増加(van de Schoot et al., 2017) 2 Figure: van de Schoot et al. (2017) http://psycnet.apa.org/record/2017-24635-002

Slide 3

Slide 3 text

3 Figure: van de Schoot et al. (2017) http://psycnet.apa.org/record/2017-24635-002  内訳としては,線形モデルについで,認知心理学的な 応用(認知モデル,計算論モデル)が多い (van de Schoot et al., 2017)

Slide 4

Slide 4 text

近年の心理学におけるベイズ統計 4 心の普遍的な法則性を解明・ 理解したい(数理心理学) 帰無仮説検定の 本来の意味を超えた濫用誤用 階層・潜在変数モデリングの ツールとしてのベイズ (認知モデル・計算論モデル) オルタナティヴな分析, 評価の枠組みとしてのベイズ (ベイズファクター) ベイズ統計的アプローチの受容・応用が進んでいる マルコフ連鎖モンテ カルロ(MCMC)法 JAGS・Stan等 のソフトウェア Figure: 清水(2018) 心理学におけるベイズ統計モデリング 心理学評論 に基づき改変 再現可能性 問題 心理学における 統計改革 学んでみる・やってみると ベイズ統計の考え方は自然で合理的だ

Slide 5

Slide 5 text

近年の心理学におけるベイズ統計 5 心の普遍的な法則性を解明・ 理解したい(数理心理学) 「p<.05」や帰無仮説検定の 本来の意味を超えた濫用誤用 階層・潜在変数モデリングの ツールとしてのベイズ (認知モデル・計算論モデル) オルタナティヴな分析, 評価の枠組みとしてのベイズ (ベイズファクター) 学んでみる・やってみると ベイズ統計の考え方は自然で合理的だ マルコフ連鎖モンテ カルロ(MCMC)法 JAGS・Stan等 のソフトウェア 再現可能性 問題 心理学における 統計改革 Figure: 清水(2018) 心理学におけるベイズ統計モデリング 心理学評論 に基づき改変 ベイズ統計的アプローチの受容・応用が進んでいる

Slide 6

Slide 6 text

ベイズ統計の考え方 1. 知りたいことについての確率を求めよう 2. データの情報をそのために使おう 6 (Lee & Wagenmakers, 2013 井関訳, 2017 ベイズ統計で実践モデリング 北大路書房)

Slide 7

Slide 7 text

ベイズ統計の考え方 1. 知りたいこと・未知なことについての不確 実性(uncertainty)の度合いは確率によっ て定量化される 2. データから得られた情報を用いて、未知な ことについての確率を更新する 既知の「データ」と未知の「パラメー タ」の間の関係は統計モデルによって表 されている 更新にベイズの定理を使う 7 (Lee & Wagenmakers, 2013 井関訳, 2017 ベイズ統計で実践モデリング 北大路書房)

Slide 8

Slide 8 text

 知りたいこと・不確かなことを確率で表現する  データの情報から,その確率を更新する () = () ベイズ統計学の考え方 8 ■推定 � = � Θ � 将来のデータ� ■予測 ■モデル比較 → ()の比(ベイズファクター) 統計モデル ベイズの定理 知りたいこと パラメータ 手に入ったデータ 事後確率(分布) 事前確率(分布) 尤度 事後予測確率(分布) 事後確率(分布) 尤度 周辺尤度

Slide 9

Slide 9 text

 英単語の問題が1問ずつ出題されるテスト  結果は正答か誤答かのどちらか  各問題の難易度は等しいとする  = 20問のうち問に正答した,というデータから, 回答者の正答確率(単語力)を推定したい  モデル: 例1:比率の推定 9 θ ~ Beta(1, 1) (一様分布) y ~ Binominal(θ, n) (二項分布) 正答できる確率 正答数 問題数 □:離散変数 ○:連続変数 色つき:観測 色なし:非観測

Slide 10

Slide 10 text

ベイズ更新の例  データが得られる前の状態は,θに対する平坦な事前 分布で表現できるとする 10 最頻値: なし 平均:0.500 標準偏差:0.289 Beta(1,1) パラメータのとりうる値 確率 密度

Slide 11

Slide 11 text

ベイズ更新の例 11 最頻値:1.000 平均:0.667 標準偏差:0.236 Beta(2,1)  1問め:正答

Slide 12

Slide 12 text

ベイズ更新の例  1問め:正答→2問め:正答 12 最頻値:1.000 平均:0.750 標準偏差:0.194 Beta(3,1)

Slide 13

Slide 13 text

ベイズ更新の例  1問め:正答→2問め:正答→3問め:誤答 13 最頻値:0.667 平均:0.600 標準偏差:0.200 Beta(3,2)

Slide 14

Slide 14 text

ベイズ更新の例  1問め:正答→2問め:正答→3問め:誤答 →4問め:正答 14 最頻値:0.750 平均:0.667 標準偏差:0.179 Beta(4,2)

Slide 15

Slide 15 text

ベイズ更新の例  1問め:正答→2問め:正答→3問め:誤答 →4問め:正答→5問め:正答 15 最頻値:0.800 平均:0.714 標準偏差:0.160 Beta(5,2)

Slide 16

Slide 16 text

ベイズ更新の例  → … →20問回答後(正答15回,誤答5回) 16 最頻値:0.750 平均:0.727 標準偏差:0.093 Beta(16,6)

Slide 17

Slide 17 text

事後分布とその要約  ベイズ推定では、事後分布(|) が、関心のあるパ ラメータについてのすべての情報を持つ  必要に応じて事後分布を要約できる 事後平均 (EAP: expected a posteriori) 事後モード (MAP: maximum a posteriori) 95%信用区間 (credible interval) 事後分散 事後標準偏差 17

Slide 18

Slide 18 text

共役事前分布  尤度が二項分布のとき,事前分布にベータ分布をお くと,事後分布もベータ分布となる。このように事 前分布と事後分布が同じ分布族になる事前分布を, 共役事前分布(conjugate prior)という 事後分布 事前分布 尤度 ベイズ推論 (, ) 𝐵𝐵𝑜𝑜𝑜𝑜(, ) ( + , + − ) 18

Slide 19

Slide 19 text

19 Pre-MCMC Post-MCMC  共役事前分布以 外の推論は困難  ベイズ統計は机 上の空論?  理論的に綺麗だ が、簡単な問題 以外では実際に 使えない  計算機を使って、ベ イズ推定が様々なモ デルで容易・自在に 行えるように

Slide 20

Slide 20 text

近年の心理学におけるベイズ統計 20 心の普遍的な法則性を解明・ 理解したい(数理心理学) 「p<.05」や帰無仮説検定の 本来の意味を超えた濫用誤用 階層・潜在変数モデリングの ツールとしてのベイズ (認知モデル・計算論モデル) オルタナティヴな分析, 評価の枠組みとしてのベイズ (ベイズファクター) 学んでみる・やってみると ベイズ統計の考え方は自然で合理的だ マルコフ連鎖モンテ カルロ(MCMC)法 JAGS・Stan等 のソフトウェア 再現可能性 問題 心理学における 統計改革 Figure: 清水(2018) 心理学におけるベイズ統計モデリング 心理学評論 に基づき改変 ベイズ統計的アプローチの受容・応用が進んでいる

Slide 21

Slide 21 text

マルコフ連鎖モンテカルロ(MCMC)法 21  事後分布からの乱数を発生させる汎用性の高い方法  MCMC法により事後分布から得られた乱数を集める ことで,事後分布やその各種指標(平均・分散・ モード等)を実用上十分な精度で得ることができる 事後分布 MCMC法で得られた乱数列と, そのヒストグラム (Lee & Wagenmakers, 2013 井関訳, 2017 図1.3, 1.4)

Slide 22

Slide 22 text

現代のベイズ推論のための典型的道具 22  統計環境  MCMCエンジン + https://cran.r-project.org/ https://sourceforge.net/projects/mcmc-jags/ http://mc-stan.org/ https://www.rstudio.com/ (R Core Team, 2018) (RStudio Team, 2015) (Plummer, 2003) (Carpenter et al., 2017; Stan Development Team, 2018) 22

Slide 23

Slide 23 text

model{ theta ~ dbeta(1,1) y ~ dbin(theta,n) } JAGSでの記述 θ ~ Beta(0, 1) (一様分布) y ~ Binominal(θ, n) (二項分布) 正答できる確率 正答数 問題数 23

Slide 24

Slide 24 text

data { int n; int y; } parameaters { real theta; } model { theta ~ beta(1,1); y ~ binomial(n,theta); } Stanでの記述 24 24

Slide 25

Slide 25 text

このモデルのJAGSとStanによる推定  https://www.dropbox.com/sh/rk4z7v34h4iulqg/ AACUzZPbsdrCD41gjS06wyaza?dl=0 に,今のモデルをJAGSとStanでベイズ推定するため のRスクリプトをおきました。よろしければダウン ロードして試してみてください 25 θ ~ Beta(0, 1) (一様分布) y ~ Binominal(θ, n) (二項分布) 正答できる確率 正答数 問題数

Slide 26

Slide 26 text

モデリング的な考え方の重要性  JAGSやStanに代表される,MCMC法によるベイズ推定 を実装したオープンなソフトウェアの登場で,モデリ ング研究は心理学者に実行可能なものになった  これから紹介する例:  社会心理学における古典的な知見とされてきた  モデリングという観点を導入することで,研究者コ ミュニティが数十年にわたって見落としてきた問題 が浮き彫りになった  Chen & Risen (2009, JESP; 2010 JPSP)が数理モデル化し て指摘, Izuma & Murayama (2013, Front Psych)がシ ミュレーションで示す  竹澤(2018, 心理学評論)に紹介 26 竹澤正哲 (2018). 心理学におけるモデリングの必要性 心理学評論, 61, 43-54. http://team1mile.com/sjpr61-1/contents_original/takezawa2018/

Slide 27

Slide 27 text

自由選択 (free choice)パラダイム 27 (Brehm, 1956) 各アイテムに対する 選好度(時点1)を リッカート尺度で評定 どちらかを持ち帰ってよい とくに持ち帰らない AとBの選好度は 平均的に等しい 選好度(時点2) をリッカート 尺度で評定 たまたま持ち帰るために選んだBの 選好度がAよりも平均的に高くなる ⇒ 認知的不協和理論を支持(と,されてきた) ランダムに同じ選好度の 2アイテムが提示 Figure: Izuma & Murayama (2013) https://www.frontiersin.org/articles/10.3389/fpsyg.2013.00041/full

Slide 28

Slide 28 text

認知的不協和(cognitive dissonance)  行動と自分の選好が一貫してい ない場合に不快な感情状態が引 き起こされ(認知的不協和), これを低減するために自分の好 みが変化させられる 28 Figure: 玉川大学脳科学研究所 http://www.tamagawa.ac.jp/brain/news/101213.html  自由選択パラダイムでは,最初はA,Bの2つを同程度に 選好していたのに,敢えて一方を持ち帰るために選択 させることによって、アイテムの選好度が変化 ⇒ 認知的不協和理論を支持

Slide 29

Slide 29 text

「認知的不協和」は必要か? この数理モデルの想定  各アイテムについて の選好は確率分布に よって表現される  観測される評定値は, 背後にある選好の確 率分布からの実現値 を四捨五入した値で ある 29 Figure: Izuma & Murayama (2013) https://www.frontiersin.org/articles/10.3389/fpsyg.2013.00041/full (Chen & Risen, 2009, JESP; 2010 JPSP)

Slide 30

Slide 30 text

自由選択パラダイムと認知的不協和  最初は2つを同程度に選好していたのに、敢えて一方 のアイテムを選択させることによって、両アイテムの 選好度が変化した ⇒ 認知的不協和理論を支持 この前提の疑わしさが,モデリング的な考え方の導入 により明らかになった 「認知的不協和理論」がなくても,「潜在的な真の選 好度」と「選択行動の結果観測される評定値」の間に誤 差を考える単純な確率モデルによって,この現象は説明 できる 30

Slide 31

Slide 31 text

階層ベイズモデル  実際のデータのモデリングでは,反復測定や個人 差もとりいれつつ,条件の違いやモデルの構造パ ラメータ(潜在変数)を推定できることが有用 31 Figure: https://stats.stackexchange.com/questions/41746/what-level-to-use-when-comparing-subjects-in-a-hierarchical-bayesian-analysis 試行レベル 参加者 レベル 集団・条件 レベル

Slide 32

Slide 32 text

階層ベイズモデルによる推定 例 32 Figure: Shibuya, Okada, et al. (2018) Hierarchical Bayesian models for the autonomic-based concealed information test. Biological Psychology, 132, 81-90. https://doi.org/10.1016/j.biopsycho.2017.11.007 盗まれうる対象物 生理指標値(心拍数,皮膚コンダク タンス反応,脈波容積,呼吸数) 実験条件(盗んだ, コントロール) 繰り返し(5回/物) 実験参加者 P=167 人

Slide 33

Slide 33 text

速さと正確さのトレードオフ  選択行動と反応時間を測定する心理実験課題では, 「速いけど不正確」な人もいれば,「遅いけど正 確」な人もいる  単に観測された反応時間や正答率を指標として用 いるだけでは,こうした速さと正確さのトレード オフを考慮できない  内的な過程の認知モデリングによって心理学的意 味を持つパラメータを推定し,それを用いて議論 を行えるとよい 33 Ratcliff, R. (1985). Theoretical interpretations of the speed and accuracy of positive and negative responses. Psychological Review, 92, 212-225. http://psycnet.apa.org/record/1985-19264-001

Slide 34

Slide 34 text

34 反応時間の拡散(diffusion)モデル 反応時間 の分布 内的 過程 Figure: Wiecki et al. (2013) https://www.frontiersin.org/articles/10.3389/fninf.2013.00014/full β τ δ α 傾き ドリフト率(処理の速さ) 初期バイアス 非決定時間 境界の幅 (慎重さ) (Ratcliff, 1978, Psych Review)

Slide 35

Slide 35 text

脳波のN200ピーク潜時は階層ベイズ推定した Diffusionモデルの非決定時間と相関する 35 Figure: Nunez et al. (2018). The latency of a visual evoked potential tracks the onset of decision making bioRxiv https://www.biorxiv.org/content/early/2018/04/19/275727

Slide 36

Slide 36 text

36 https://cran.r-project.org/web/packages/hBayesDM/index.html 様々な認知モデルをStanでベイズ推定できる hBayesDMパッケージ (Ahn et al., 2017, Computational Psychiatry)

Slide 37

Slide 37 text

37 hBayesDM パッケージ に含まれる Stanで書かれ たモデル一覧 (国里愛彦先生 ホームページ より) https://kunisatolab.github.io/main/how-to-hBayesDM.html

Slide 38

Slide 38 text

38 http://team1mile.com/sjpr61-1/ contents_original/shimizu2018/ http://team1mile.com/sjpr61-1/ contents_original/takezawa2018/ http://team1mile.com/sjpr61-1/ contents_original/kunisato2018/ http://team1mile.com/sjpr61-1/ contents_original/nakamura2018/

Slide 39

Slide 39 text

39 https://www.slideshare.net/ ShushiNamba/ss-103720245 https://www.slideshare.net/ HiroyukiMuto/ss-103712544 https://www.slideshare.net/ TakashiYamane1/type2-sdt https://doi.org/10.3758/s13423-017-1317-5

Slide 40

Slide 40 text

近年の心理学におけるベイズ統計 40 心の普遍的な法則性を解明・ 理解したい(数理心理学) 「p<.05」や帰無仮説検定の 本来の意味を超えた濫用誤用 階層・潜在変数モデリングの ツールとしてのベイズ (認知モデル・計算論モデル) オルタナティヴな分析, 評価の枠組みとしてのベイズ (ベイズファクター) 学んでみる・やってみると ベイズ統計の考え方は自然で合理的だ マルコフ連鎖モンテ カルロ(MCMC)法 JAGS・Stan等 のソフトウェア 再現可能性 問題 心理学における 統計改革 Figure: 清水(2018) 心理学におけるベイズ統計モデリング 心理学評論 に基づき改変 ベイズ統計的アプローチの受容・応用が進んでいる

Slide 41

Slide 41 text

 心理学研究の再現性が必ずしも高くないことが問 題に 再現性の危機 replication crisis 41 画像出典:http://projects.iq.harvard.edu/psychology-replications

Slide 42

Slide 42 text

Open Science Collaboration (2015, Science) 42  心理学のトップジャーナル3誌に2008年以降刊行され た100の研究を世界各国の270の研究者が追試  Psychological Science,Journal of Personality and Social Psychology,Journal of Experimental Psychology: Learning, Memory, and Cognition 元論文 追試 元論文 追試 p値 (p value) 効果量(effect size) 有意の割合 95%→36% 半減

Slide 43

Slide 43 text

 https://osf.io/ezcuj/wiki/home/ 43 https://osf.io/ezcuj/wiki/home/

Slide 44

Slide 44 text

心理学評論 再現性特集号(2016) 44  「これらの問題に対する関心は今に始まったことではないが,ここ数 年,研究者の側もこれらに対して自覚的になってきたというのも事実 だ。そこで,再現可能性,統計の問題,QRPsから研究不正まで,とい う相互に密接に関連しあうこれらの問題に対する現状の認識と展望に ついて,忌憚のない議論を進めるべく本特集号を企画した。」 (友永・三浦・針生, 2016, 巻頭言) https://www.jstage.jst.go.jp/browse/sjpr/59/1/_contents/-char/ja 統計学的観点をとく に扱っているのは 池田・平石(2016) 大久保(2016) 三中(2016)

Slide 45

Slide 45 text

話題になった研究例: 45 psiとは,既知の物理学的もしくは生物学的メカニズムでは説明 できない,特異な情報やエネルギーの伝達過程を指す。

Slide 46

Slide 46 text

Bem (2011, J Pers Soc Psy)  どちらかのカーテンの背後には画像があり,どちらかには 何もない。画像がある方を当ててほしい  手続きを変えて実験を9個行い,うち8個で「有意な」結 果を得ているが,たとえば実験1は:  N=100, 1人あたり36試行  (性的な画像12試行, ネガティブな画像12試行, 中立画像12試行)  結果,性的な画像の時だけチャンスレベルを超える 53.1%の正答率 ( t(99)=2.51, p=.01, d=.25) 46

Slide 47

Slide 47 text

Wagenmakers & Lee (2013, Cambridge U Press)  Bem (2011, JPSP)の論文は「統計的に有意になる までデータ収集を繰り返した」可能性がある 47 Bem (2011, JPSP)の実験1~9における効果量(effect size)と標本サイズとの関係 標本サイズ 効果量 両者の相関係数 (の事後分布)

Slide 48

Slide 48 text

p-hacking (Simmons et al, 2011, Pscych Sci)  心理学の研究論文における一般的な(当時)報告の基 準を満たしつつ,p値を小さくする操作  結果を見ながら参加者を少しずつ足して検定を繰 り返し,有意になったところでとめる  多くの説明変数・共変量を用いて分析を行い,有 意になったものだけを報告する  行った条件や測定した変数の一部だけ報告  論文中に書かれない研究者の自由度(researchers’ degrees of freedom)が大きいことによる  「差がある」(対立仮説)だけに価値をおく,帰無仮説 検定に基づく意識からの脱却  研究の事前登録,研究素材やデータ・コードの公開 オープンサイエンス 48

Slide 49

Slide 49 text

再現失敗の報告が相次ぐ 49

Slide 50

Slide 50 text

Masicampo & Lalande (2012, Quart J Exp Psych)  Journal of Experimental Psychology: General, Journal of Personality and Social Psychology,Psychological Science の3 誌で2007年から2008 年の間に報告された p値を集計 50

Slide 51

Slide 51 text

Legget et al. (2013, Quart J Exp Psych) 51  2誌における1965年と2005年の比較

Slide 52

Slide 52 text

52 被引用数2,836 (July 31, 2018)

Slide 53

Slide 53 text

ベイズファクター  あるモデル ( = 1,2)のもとでの推論は  モデルの平均的な予測力(周辺尤度) = � Θ , ※対数周辺尤度の符合反転が自由エネルギー(e.g., 乾, 2018) の比であるベイズファクター(Bayes factor) 21 = (|2 ) (|1 ) を,2モデル間のモデル比較に用いる 「帰無仮説」に特別な地位を与えず,「対立仮説」 と平等に支持・不支持することができる 53 , = , (| ) (| ) 仮説 と基本的に同義 乾敏郎 (2018) 知覚・認知・運動・感情・意思決定をつなぐ自由エネルギー原理 日本神経回路学会誌

Slide 54

Slide 54 text

モデルの事後確率とベイズファクター  モデル の事後確率は = ( ) () = ( ) ∑ℎ=1 ℎ ℎ  考えるモデルが2つ(K=2)の場合には 54 (2 |) (1 |) = 2 1  ベイズファクターは、データによって与えられた、 モデル1 に比してモデル2 を支持する程度(オッ ズ)の変化を表す (2 ) (1 ) 21 (Jeffreys, 1935; Kass & Raftery, 1995, JASA)

Slide 55

Slide 55 text

定型的分析法でのベイズファクター 計算に便利なJASP 55 JASP Team, 2018; https://jasp-stats.org/  日本心理学会で院生たちが ワークショップをするそうです

Slide 56

Slide 56 text

例:ベイズ的t検定 (Rouder et al., 2009) 56 データ = {−1.7, 1.6, 0.3, −0.5, 0.3, 0.2, −0.2, −0.9, 0.8, 0.5} 図: 岡田謙介(2018)ベイズファクターによる心理学的仮説・モデルの評価 心理学評論,61, 101-115. http://team1mile.com/sjpr61-1/okada.pdf Rouder et al. (2009) Bayesian t tests for accepting and rejecting the null hypothesis. Psychonomic Bulletin & Review, 16, 225-237. https://doi.org/10.3758/PBR.16.2.225 56

Slide 57

Slide 57 text

57 Camerer et al. (2018). Evaluating the replicability of social science experiments in Nature and Science between 2010 and 2015. Nature Human Behavior, Online Ahead of Print. https://doi.org/10.1038/s41562-018-0399-z Open Science Framework: https://osf.io/pfdyw/

Slide 58

Slide 58 text

58 Camerer et al. (2018). Evaluating the replicability of social science experiments in Nature and Science between 2010 and 2015. Nature Human Behavior, Online Ahead of Print. https://doi.org/10.1038/s41562-018-0399-z 58

Slide 59

Slide 59 text

59 Camerer et al. (2018). Evaluating the replicability of social science experiments in Nature and Science between 2010 and 2015. Nature Human Behavior, Online Ahead of Print. https://doi.org/10.1038/s41562-018-0399-z 59

Slide 60

Slide 60 text

60 https://osf.io/7cq2d https://www.slideshare.net/ daikihojo/ss-103760750 http://team1mile.com/sjpr61- 1/contents_original/okada2018/ https://www.sciencedirect.com/journal/journal -of-mathematical-psychology/vol/72

Slide 61

Slide 61 text

まとめ(再掲) 61 心の普遍的な法則性を解明・ 理解したい(数理心理学) 「p<.05」や帰無仮説検定の 本来の意味を超えた濫用誤用 階層・潜在変数モデリングの ツールとしてのベイズ (認知モデル・計算論モデル) オルタナティヴな分析, 評価の枠組みとしてのベイズ (ベイズファクター) マルコフ連鎖モンテ カルロ(MCMC)法 JAGS・Stan等 のソフトウェア Figure: 清水(2018) 心理学におけるベイズ統計モデリング 心理学評論 の図を改変 再現可能性 問題 心理学における 統計改革 学んでみる・やってみると ベイズ統計の考え方は自然で合理的だ ベイズ統計的アプローチの受容・応用が進んでいる

Slide 62

Slide 62 text

62

Slide 63

Slide 63 text

63 http://team1mile.com/sjpr61-1/