Slide 1

Slide 1 text

しなやかな項⽬反応モデル ⾮正規データを扱うTips 福島県⽴医科⼤学医学部 健康リスクコミュニケーション学講座 臨床⼼理⼠ ⽵林由武 公認⼼理師 <- New !! 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 1

Slide 2

Slide 2 text

今⽇の話題 2 •  brmsでベイジアン項⽬反応モデル •  中間反応による歪みの検出と対処 •  ゼロ過剰データへの対処 •  潜在変数分布の歪みへの対処 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学

Slide 3

Slide 3 text

今⽇の話題 3 •  brmsでベイジアン項⽬反応モデル →線型モデルによる理解と拡張 •  中間反応による歪みの検出と対処 →GPCM-IRTとNRM-IRTの活⽤ •  ゼロ過剰データへの対処 →ゼロ過剰混合IRT •  潜在特性分布の歪みへの対処 →Ramsay curve IRT 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学

Slide 4

Slide 4 text

BRMSでベイジアン項⽬反応モデル 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 4

Slide 5

Slide 5 text

brms 5 #BZFTJBO3FHSFTTJPO.PEFMVTJOH4UBO ϕΠζͰʢ#BZFTJBOʣ ճؼϞσϧʢ3FHSFTTJPO.PEFMʣ 4UBO࢖ͬͯʢVTJOH4UBOʣ 4UBOͷϥούʔ3ύοέʔδ Ϣʔβ͸ࣗ਎Ͱ4UBOίʔυΛॻ͘ඞཁ͸ͳ͘ɺ ϞσϧΛࢦఆ͢Δͱࣗಈతʹ಺෦Ͱ4UBOίʔυ͕ੜ੒͞Εɺα ϯϓϦϯά͕࣮ߦ͞ΕΔɻ https://das-kino.hatenablog.com/entry/2018/12/15/230938 https://github.com/paul-buerkner/brms

Slide 6

Slide 6 text

brms 6 https://das-kino.hatenablog.com/entry/2018/12/15/230938 ҰൠԽઢܕࠞ߹ϞσϧͷMNF ύοέʔδͷHMNFSؔ਺ͱಉ༷ͷ ϞσϧࣜͰ࣮ߦՄೳ MNFHMNFS ZdY cHSPVQ GBNJMZzHBVTTJBOl EBUBEBU ઢܕࠞ߹Ϟσϧ MNFHMNFS ZdY cHSPVQ GBNJMZzCJOPNJBMl EBUBEBU ҰൠԽઢܕࠞ߹Ϟσϧ MNFHMNFS ZdY cHSPVQ GBNJMZzQPJTTPO EBUBEBU ҰൠԽઢܕࠞ߹Ϟσϧ CSNTCSN ZdY cHSPVQ GBNJMZzHBVTTJBOl EBUBEBU ઢܕࠞ߹Ϟσϧ CSNTCSN ZdY cHSPVQ GBNJMZzCJOPNJBMl EBUBEBU ҰൠԽઢܕࠞ߹Ϟσϧ CSNTCSNS ZdY cHSPVQ GBNJMZzQPJTTPOl EBUBEBU ҰൠԽઢܕࠞ߹Ϟσϧ

Slide 7

Slide 7 text

なぜ回帰モデル? •  Ҽࢠ෼ੳϞσϧɺ߲໨൓ԠϞσϧ͸ɺજࡏม ਺Ͱ߲໨൓ԠΛ༧ଌ͢ճؼϞσϧͱͯ͠දݱ Մೳ •  ݸਓͱ߲໨ΛมྔޮՌʹࢦఆ͢Δ͜ͱͰ֤छ ͷ*35ϞσϧΛॊೈʹදݱͰ͖Δ •  ճؼϞσϧͷ࿮૊ΈͰɺڞมྔΛؚΉ*35Ϟσ ϧΛදݱՄೳ 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 7

Slide 8

Slide 8 text

؍ଌม਺ؒͷؔ܎Λજࡏม਺Λಋೖͯ͠આ໌͢ΔϞσϧ 潜在変数モデル 8 X1 X2 X3 જࡏ ม਺ e 1 e 2 e 3 જࡏม਺ɿ ௚઀ଌఆෆೳͳม਺ FH ஌ೳ ੑ֨ ͏ͭප ؍ଌม਺ ௚઀ଌఆՄೳͳม਺ FH ஌ೳݕࠪͷ߲໨ ɹɹੑ֨ݕࠪͷ߲໨ ͏ͭප

Slide 9

Slide 9 text

reflective vs formative   9 Terwee, C. B., Prinsen, C. A., Chiarotto, A., Westerman, M. J., Patrick, D. L., Alonso, J., ... & Mokkink, L. B. (2018). COSMIN methodology for evaluating the content validity of patient-reported outcome measures: a Delphi study. Quality of Life Research, 27(5), 1159-1170. formative model reflective model :69 78;7 ' &!$ 0 &"$ 20 $ 0 :69 78;7 ' %!$ 0 %"$ 0 %#$ ε ε ε ε formative reflective ⇒ ⇒ CTT, IRT 01,0/ 5)4 0/<,00 * +4-13.(

Slide 10

Slide 10 text

潜在変数モデルの種類 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 10 જࡏม਺ ࿈ଓ ΧςΰϦΧϧ ؍ ଌ ม ਺ ࿈ ଓ Ҽࢠ෼ੳϞσϧ જࡏϓϩϑΟϧϞσϧ Χ ς ΰ Ϧ Χ ϧ ߲໨൓ԠϞσϧ જࡏΫϥεɾϥϯΫϞσϧ X2 X1 X3 θi X2 X1 X3 Ci U2 U1 U3 θi U2 U1 U3 Ci

Slide 11

Slide 11 text

CFA / IRT 11 X5 X6 X2 X1 X3 X4 θi CFA e5 e6 e2 e1 e3 e4 IRT Z5 Z6 Z2 Z1 Z3 Z4 θi CTT IRT Xij : 個人iの項目jの反応 (連続) μj : 項目jの切片 αj : 項目jの因子負荷量 Θi : 個人iの因子得点 ej : 項目jの誤差 Zij : 個人iの項目jの反応 (2値/順序) αj : 項目jの困難度 (切片) βj : 項目jの識別力 Θi : 個人iの因子得点 (能力値) ej : 項目jの誤差 因子得点で観測変数を説明する線形回帰モデル Xij = µj +αj θi + eij α1 α2 α3 α4 α5 α6 β1 β2 β3 β4 β5 β6 e5 e6 e2 e1 e3 e4 Zij = -αj +βj θi + eij 因子得点で観測変数を説明するロジスティック回帰モデル 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学

Slide 12

Slide 12 text

潜在変数の得点がX1-X3の観測変数を説明 CFAモデル 12 潜在変数 潜在変数 潜在変数 X1 X2 X3 ؍ଌม਺Λैଐม਺ͱ͠ જࡏม਺Λಠཱม਺ͱ͢ΔઢܗճؼϞσϧ ؍ଌม਺Cજࡏม਺ޡࠩ X2 X1 X3 θi

Slide 13

Slide 13 text

潜在変数の得点がZ1-Z3の応答確率を説明 IRTモデル 13 潜在変数 潜在変数 潜在変数 Z1 Z2 Z3 ؍ଌม਺Λैଐม਺ͱ͠ જࡏม਺Λಠཱม਺ͱ͢ΔϩδεςΟοΫ ճؼϞσϧ؍ଌม਺Cજࡏม਺ޡࠩ U2 U1 U3 θi

Slide 14

Slide 14 text

IRT model: 3PL 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 14 θj = ݸਓjͷજࡏతೳྗ (Ҽࢠಘ఺) aj = ࣝผ౓฼਺ (discrimination parameter) bj = ࠔ೉౓฼਺ (difficulty parameter) cj = ౰ͯਪྔ฼਺ (paseudoguessing parameter) 3PL IRT model 2PL:3PLからcj なし 1PL / Rasch: 2PLの識別度が項目間で固定

Slide 15

Slide 15 text

IRT model: 2PLの⺟数 15 aj = ࣝผ౓฼਺ (discrimination parameter) bj = ࠔ೉౓฼਺ (difficulty parameter) 2PL IRT model aj = 識別度母数 βj = 困難度母数 その項目が能力値の高低を分けれる程度 その項目がどの程度の能力値の 識別に適しているか

Slide 16

Slide 16 text

IRT model: 1PLの⺟数 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 16 a = ࣝผ౓฼਺ (discrimination parameter) ※ ߲໨ؒͰҰఆ bj = ࠔ೉౓฼਺ (difficulty parameter) 1PL IRT /Rasch model

Slide 17

Slide 17 text

stanでIRTモデル: 3PL 17 Luo, Y., & Jiao, H. (2018). Using the Stan program for Bayesian item response theory. Educational and psychological measurement, 78(3), 384-408. 掲載されているコード 3 PL GRM 段階反応 NRM 名義反応 looとWAICでモデル比較 Rash testlet model Multilevel 3PL

Slide 18

Slide 18 text

stanでIRTモデル: 3PL 18 データブロック パラメータブロック モデルブロック 生成量ブロック Luo, Y., & Jiao, H. (2018). Using the Stan program for Bayesian item response theory. Educational and psychological measurement, 78(3), 384-408.

Slide 19

Slide 19 text

brmsでIRT 19 Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501. 掲載コード 1PL / Rash model 2PL 3PL GRM 反応時間のIRT (diffusion model)

Slide 20

Slide 20 text

brmsでIRT 20 Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501. 論文掲載のIRTモデ ルのコードや、可視 化に使ったコードを まるっと公開

Slide 21

Slide 21 text

brmsでIRTのデータ型 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 21 CSNTͰ͸ɺҰൠԽઢܕࠞ߹Ϟσϧͷ࿮૊ΈͰ *35ϞσϧΛਪఆ͢ΔͷͰɺ߲໨൓Ԡ͕ݸਓͱ ߲໨ʹωετ͞Ε͍ͯΔMPOHܕͷσʔλͰࢦఆ

Slide 22

Slide 22 text

brmsで1PL/Rasch model 22 formula_va_1pl <- bf(r2 ~ 1 + (1 | item) + (1 | id)) prior_va_1pl <- prior("normal(0, 3)", class = "sd", group = "id”)+ prior("normal(0, 3)", class = "sd", group = "item") fit_va_1pl <- brm( formula = formula_va_1pl, data = VerbAgg, family = brmsfamily("bernoulli", "logit"), prior = prior_va_1pl) #モデル式 #事前分布の設定 #Stanによるサンプリングの実行 事前分布設定法には諸説あり 項目母数と特性値を 変量効果として推定 Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.

Slide 23

Slide 23 text

パラメータの事後分布 23 QMPU GJU@WB@QM C@JOUFSDFQU ࠔ೉౓ͷूஂฏۉ ͷࣄޙ෼෍ TE@JE@JOUFSDFQU ಛੑ஋ͷ4% ͷࣄޙ෼෍ TE@JUFN@JUFSDFQU ࠔ೉౓ͷ4% ͷࣄޙ෼෍ Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.

Slide 24

Slide 24 text

困難度の推定結果 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 24 MJCSBSZ CSNTUPPMT GPSFTU GJU@WB@QM HSPVQJOHJUFNz ֤߲໨ͷࠔ೉౓ ͷࣄޙ෼෍ɺࣄޙฏۉɺ ֬৴۠ؒ GPSFTUؔ਺Ͱ͸ࣄޙฏۉͷ ߴ͍ॱʹࣗಈͰ4PSU −0.17 [−0.70, 0.32] −2.90 [−3.37, −2.46] −1.97 [−2.33, −1.62] −1.51 [−1.85, −1.17] −1.48 [−1.80, −1.16] −1.46 [−1.80, −1.13] −1.03 [−1.34, −0.73] −0.86 [−1.16, −0.55] −0.68 [−0.98, −0.37] −0.38 [−0.68, −0.08] −0.35 [−0.64, −0.05] −0.21 [−0.51, 0.08] −0.06 [−0.34, 0.23] 0.01 [−0.28, 0.30] 0.08 [−0.23, 0.38] 0.38 [ 0.09, 0.68] 0.52 [ 0.23, 0.81] 0.56 [ 0.26, 0.86] 0.70 [ 0.39, 1.00] 0.70 [ 0.40, 1.00] 0.86 [ 0.55, 1.17] 1.07 [ 0.76, 1.39] 1.20 [ 0.89, 1.50] 1.21 [ 0.90, 1.53] 1.72 [ 1.38, 2.07] Intercept −4 −2 0 2 Average S3DoShout S4DoShout S3WantShout S3DoScold S2DoShout S4WantShout S1DoShout S3WantScold S4DoScold S4WantScold S3DoCurse S2DoScold S2WantShout S1WantShout S1DoScold S3WantCurse S1WantScold S4DoCurse S2WantScold S2DoCurse S4wantCurse S1WantCurse S1DoCurse S2WantCurse

Slide 25

Slide 25 text

特性値の推定結果 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 25 MJCSBSZ CSNTUPPMT GPSFTU GJU@WB@QM HSPVQJOHJE ݸਓͷಛੑ஋ͷࣄ ޙฏۉͱ֬৴ ۠ؒ ݸਓΛಛੑ஋ͷେ ͖͞ॱʹ4PSU

Slide 26

Slide 26 text

brmsで1PL/Rasch model •  共変量を含んだモデル 26 modeによって、特性値が異なる Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501. 二項分布, ロジットリンク

Slide 27

Slide 27 text

brmsでbrmsで1PL/Rasch model •  modeによって、特性値が異なる 27 marginal_effects(fit_va_1pl_cov1, effects = "Anger", categorical = TRUE) Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.

Slide 28

Slide 28 text

brmsで1PL/Rasch model •  共変量を含んだモデル 28 modeによって、特性値が異なる Genderによって、項目機能が異なる ߲໨ͷมྔޮՌͷઆ໌ม਺ʹม਺Λ౤ೖ͢Δ͜ͱͰ%*'ͷݕग़͕Մೳ %*'ಛҟ߲໨ػೳ͸ಛఆͷ৚݅ؒͰ߲໨൓Ԡ͕ҟͳΔ͜ͱ Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.

Slide 29

Slide 29 text

brmsでbrmsで1PL/Rasch model •  genderによって、項⽬反応が異なる •  項⽬反応にGenderとmodeの交互作⽤がありそう 29 NBSHJOBM@FGGFDUT GJU@WB@QM@DPW FGGFDUT"OHFS DBUFHPSJDBM536& Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.

Slide 30

Slide 30 text

brmsで2PL model 30 Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.

Slide 31

Slide 31 text

brmsで2PL model 31 |i| は、困難度と識別度の相関を推定するおまじない (ここでは個々の項目で推定) Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.

Slide 32

Slide 32 text

brmsで2PL 32 MJCSBSZ CSNTUPPMT TVNNBSZ GJU@WB@QM GPSFTU GJU@WB@QM HSPVQJOHJUFNz 識別度 困難度 −0.41 [ −1.88, 0.83] −6.86 [−13.90, −2.25] −4.62 [ −9.35, −1.50] −3.70 [ −7.62, −1.18] −3.41 [ −7.02, −1.06] −3.25 [ −6.55, −1.03] −2.51 [ −5.32, −0.79] −1.93 [ −4.06, −0.59] −1.52 [ −3.41, −0.43] −0.86 [ −2.14, −0.11] −0.75 [ −1.89, −0.08] −0.50 [ −1.51, 0.18] −0.10 [ −0.90, 0.59] 0.03 [ −0.73, 0.86] 0.18 [ −0.51, 1.03] 0.82 [ 0.12, 2.04] 1.23 [ 0.27, 2.93] 1.24 [ 0.30, 2.85] 1.54 [ 0.42, 3.36] 1.56 [ 0.42, 3.45] 1.91 [ 0.55, 4.07] 2.43 [ 0.73, 5.08] 2.59 [ 0.80, 5.28] 2.67 [ 0.82, 5.57] 3.75 [ 1.19, 7.50] −0.71 [ −1.49, 0.30] −0.84 [ −1.67, 0.19] −0.83 [ −1.65, 0.21] −0.82 [ −1.64, 0.20] −0.79 [ −1.61, 0.23] −0.78 [ −1.58, 0.24] −0.78 [ −1.59, 0.25] −0.75 [ −1.56, 0.29] −0.73 [ −1.54, 0.30] −0.73 [ −1.54, 0.29] −0.72 [ −1.51, 0.31] −0.72 [ −1.52, 0.31] −0.71 [ −1.51, 0.31] −0.70 [ −1.49, 0.32] −0.69 [ −1.51, 0.34] −0.69 [ −1.50, 0.35] −0.68 [ −1.50, 0.32] −0.68 [ −1.48, 0.35] −0.67 [ −1.47, 0.35] −0.67 [ −1.48, 0.35] −0.66 [ −1.45, 0.36] −0.65 [ −1.46, 0.39] −0.63 [ −1.42, 0.42] −0.62 [ −1.42, 0.42] −0.56 [ −1.38, 0.49] eta_Intercept logalpha_Intercept −20 −10 0 10 −2 −1 0 1 Average S3WantShout S4WantShout S3WantCurse S3DoShout S3DoCurse S4DoShout S3DoScold S4wantCurse S2WantShout S4DoScold S1DoShout S1WantShout S3WantScold S4DoCurse S2DoShout S1WantCurse S2DoCurse S4WantScold S1WantScold S2WantScold S2WantCurse S1DoCurse S2DoScold S1DoScold Average S3DoShout S4DoShout S3WantShout S3DoScold S2DoShout S4WantShout S1DoShout S3WantScold S4DoScold S4WantScold S3DoCurse S2DoScold S2WantShout S1WantShout S1DoScold S3WantCurse S1WantScold S2WantScold S4DoCurse S2DoCurse S4wantCurse S1DoCurse S1WantCurse S2WantCurse

Slide 33

Slide 33 text

brmsでGRM 33 累積分布, ロジットリンク Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.

Slide 34

Slide 34 text

brmsでGRM 34 ࣝผྗͷਪఆ஋͕ϙδςΟϒʹͳΔΑ͏ɺ EJTDdͷϞσϧࣜͰϩάεέʔϧԽ Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.

Slide 35

Slide 35 text

brmsでGRM 35 −0.89 [−1.59, 0.02] −0.92 [−1.62, −0.01] −0.92 [−1.62, −0.01] −0.91 [−1.61, 0.00] −0.91 [−1.62, 0.00] −0.91 [−1.61, −0.01] −0.90 [−1.61, 0.00] −0.90 [−1.60, 0.01] −0.90 [−1.59, 0.02] −0.90 [−1.59, 0.01] −0.90 [−1.60, 0.01] −0.89 [−1.59, 0.02] −0.89 [−1.59, 0.02] −0.89 [−1.58, 0.02] −0.88 [−1.57, 0.02] −0.88 [−1.58, 0.03] −0.88 [−1.59, 0.03] −0.88 [−1.58, 0.04] −0.88 [−1.58, 0.04] −0.88 [−1.57, 0.04] −0.87 [−1.57, 0.05] −0.87 [−1.58, 0.03] −0.87 [−1.57, 0.05] −0.87 [−1.57, 0.05] −0.86 [−1.57, 0.05] 0.38 [−0.96, 2.01] −4.08 [−7.69, −1.50] −3.37 [−6.42, −1.24] −2.98 [−5.69, −1.06] −2.38 [−4.57, −0.84] −2.23 [−4.33, −0.78] −2.04 [−4.09, −0.69] −1.89 [−3.86, −0.64] −1.42 [−2.91, −0.44] −1.07 [−2.40, −0.26] −0.95 [−2.20, −0.19] −0.32 [−1.28, 0.41] −0.11 [−0.89, 0.69] 0.09 [−0.65, 0.93] 0.88 [ 0.12, 2.12] 0.90 [ 0.16, 2.19] 1.01 [ 0.20, 2.32] 1.95 [ 0.66, 3.99] 2.15 [ 0.74, 4.31] 2.57 [ 0.90, 5.07] 3.63 [ 1.32, 7.07] 3.79 [ 1.39, 7.31] 3.87 [ 1.41, 7.42] 4.94 [ 1.80, 9.48] 7.24 [ 2.66, 13.74] 5.25 [ 1.90, 10.18] 0.79 [ 0.08, 1.94] 1.50 [ 0.46, 3.18] 1.89 [ 0.65, 3.88] 2.49 [ 0.89, 4.84] 2.64 [ 0.96, 5.15] 2.83 [ 1.00, 5.51] 2.98 [ 1.08, 5.72] 3.46 [ 1.27, 6.63] 3.80 [ 1.41, 7.16] 3.92 [ 1.44, 7.39] 4.55 [ 1.70, 8.57] 4.77 [ 1.78, 8.95] 4.96 [ 1.84, 9.33] 5.75 [ 2.16, 10.78] 5.77 [ 2.20, 10.81] 5.88 [ 2.17, 10.96] 6.82 [ 2.57, 12.83] 7.02 [ 2.64, 13.10] 7.44 [ 2.76, 13.92] 8.50 [ 3.17, 16.00] 8.66 [ 3.21, 16.14] 8.74 [ 3.27, 16.24] 9.81 [ 3.65, 18.40] 12.12 [ 4.50, 22.63] disc_Intercept Intercept[1] Intercept[2] −2 −1 0 1 −10 0 10 20 0 10 20 30 Average S2WantCurse S1WantCurse S1DoCurse S2DoCurse S4wantCurse S2WantScold S1WantScold S4DoCurse S1DoScold S3WantCurse S2WantShout S1WantShout S2DoScold S4WantScold S3DoCurse S4DoScold S3WantScold S1DoShout S4WantShout S2DoShout S3DoScold S3WantShout S4DoShout S3DoShout Average S2WantCurse S1WantCurse S1DoCurse S2DoCurse S4wantCurse S2WantScold S1WantScold S4DoCurse S1DoScold S3WantCurse S2WantShout S1WantShout S2DoScold S4WantScold S3DoCurse S4DoScold S3WantScold S1DoShout S4WantShout S2DoShout S3DoScold S3WantShout S4DoShout S3DoShout Average S1WantCurse S2WantScold S1WantScold S4WantShout S2WantShout S1WantShout S2DoCurse S3WantCurse S2WantCurse S1DoShout S4wantCurse S1DoCurse S4DoCurse S4WantScold S2DoShout S4DoShout S4DoScold S3WantShout S2DoScold S1DoScold S3DoCurse S3WantScold S3DoShout S3DoScold MJCSBSZ CSNTUPPMT TVNNBSZ GJU@WB@PSE@QM GPSFTU GJU@WB@PSE@QM HSPVQJOHJUFNz

Slide 36

Slide 36 text

brmsでGRM 36 •  共変量を含んだモデル Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.

Slide 37

Slide 37 text

brmsでGRM 37 •  共変量を含んだモデル marginal_effects(fit_va_ord_cov1, effects = "Anger", categorical = TRUE) Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.

Slide 38

Slide 38 text

ここまで •  2値の3PL IRT、多値のGRMを⼀般化線型混合 モデルの枠組みで実施可能 •  共変量もモデルに含み、DIFFの検討など個⼈ 差に⼀歩踏み込んだモデリングが可能 •  今回は扱ってないが適切な事前分布の情報を 組み込むことで、少ないサンプルサイズでも 妥当な推定が可能に。 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 38

Slide 39

Slide 39 text

事前分布設定の1オプション 39 Natesan, P., Nandakumar, R., Minka, T., & Rubright, J. D. (2016). Bayesian prior choice in IRT estimation using MCMC and variational Bayes. Frontiers in psychology, 7, 1422. •  変分ベイズ推定の結果を事前分布に活⽤する brmsでは引数algorithmで指定可能 #HMC algorithm = c("sampling”) #Variational bayes with independent normal distribution algorithm = c("meanfield”) #Variational bayes with multivariate normal distribution algorithm = c("fullrank”)

Slide 40

Slide 40 text

brmsでIRT系モデルできること 40 જࡏΫϥεϞσϧܥͱ ίϐϡϥܥҎ֎ϑϧରԠ Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.

Slide 41

Slide 41 text

brmsでIRT系モデルできること •  他の多値モデルももちろん可能 –  GPCM, Nominal Response Model •  Count modelも可能 – Rasch count modelなど •  特殊な分布も可能 – 指数ガウス (ex-gaussian)分布を使った反応時間 のIRTモデルも可能 – ということはbrmsでdrift Diffusion modelも可能 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 41

Slide 42

Slide 42 text

⼼的回転データでdrift diffusion model 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 42 time: 反応時間 rotate: 回転 wiener processが指定できる! (*´д`*)ハァハァ

Slide 43

Slide 43 text

中央回答の項⽬反応の歪みに対 処する 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 43

Slide 44

Slide 44 text

ところで 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 44 •  他の多値モデルも可能 –  GPCM, Nominal Response Model ↑ 使い道がよくわからなかった僕 GPCMとGRMは出⾃が違うが似たようなパフォーマ ンスを⽰す。論⽂ではGRMをよく⽬にする。

Slide 45

Slide 45 text

IRT model: Nominal model 45 /3.͸(1$.ͷԼҐϞσϧ (1$.ͱ(3.͸ಉ౳ͷਪఆ݁Ռ ʹͳΔ͜ͱ͕͓͓͍ /PNJOBMSFTQPOTFNPEF /3. (1$.NPEFM ճ౴ΧςΰϦؒʹॱংੑΛԾఆ͠ͳ͍ଟ஋ܕ*35Ϟσϧ /3.ͱ(1$.͕ϞσϧൺֱՄೳൺֱ͢Δ͜ͱͰ߲໨൓ԠͷॱংͷԾఆΛݕ౼Ͱ͖Δ ճ౴ΧςΰϦؒʹॱংੑΛԾఆ͢Δଟ஋ܕ*35Ϟσϧ

Slide 46

Slide 46 text

中間反応の歪み •  ஈ֊൓ԠϞσϧ΍(1$.ͰѻΘΕΔई౓ͷ൓ ԠΧςΰϦʹ͸ॱংੑ͕͋Δ – ྫ͑͹ɺ ɹ •  ౰ͯ͸·Βͳ͍ •  ͋·Γ౰ͯ͸·Βͳ͍ •  ͲͪΒͱ΋ݴ͑ͳ͍ •  ΍΍౰ͯ͸·Δ •  ౰ͯ͸·Δ 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 46 જࡏಛੑͷதؒΛ൓ө͍ͯ͠Δ ͜ͷॱংੑͷҳ୤͸ɺॏཁͳ໰୊ͱͳΔɻ

Slide 47

Slide 47 text

中間反応の歪み 47 閾値の歪み (中間反応が他の反応と区別できない) 識別度の歪み (中間反応の次の段階の反応の順序が入れ違ってる) Murray, A. L., Booth, T., & Molenaar, D. (2016). When middle really means “Top” or “Bottom”: An analysis of the 16PF5 using Bock's nominal response model. Journal of personality assessment, 98(3), 319-331.

Slide 48

Slide 48 text

中間反応が歪む理由は多様 •  葛藤または無関⼼ •  質問の理解不⾜ •  特性を表明することへの抵抗(社会的に望まし くない⾏動など) •  判断に必要な情報が⼗分にない •  質問に明確に答えることに馴染みがない 48 Romá, V. G., & Espejo, B. (2003). Testing the middle response categories «Not sure»,«In between» and «?» in polytomous items. Psicothema, 15(2), 278-284. ଌఆΛ܁Γฦͨ͢ͼʹෆ҆ఆ

Slide 49

Slide 49 text

反応段階の順序が崩れると •  合計点として単純加算できない – 例えば、先のように、中間と次の段階の順序性が ⼊れ替わっている項⽬をそのまま他の項⽬と加算 すると、合計点が実際の得点よりも低くなる – 潜在特性の⾼さが中間反応と関連する場合、特性 値と反応の順序の乖離が⼤きくなる。 •  例えば、神経症傾向の⼈は優柔不断で真ん中反応になり がち。もし神経症と関係する特性を測定していたとする と、真ん中反応と次の段階の順序が⼊れ替わる場合が出 てくる。 49 Romá, V. G., & Espejo, B. (2003). Testing the middle response categories «Not sure»,«In between» and «?» in polytomous items. Psicothema, 15(2), 278-284.

Slide 50

Slide 50 text

中間反応の歪み検討 •  GPCMとNominal Response Modelを⽐較 – NRMはGPCMの下位モデル – GPCMは項⽬反応の順序性を仮定 – NRMは項⽬反応の順序性を仮定していない •  Wald検定やモデル⽐較に指標で検討 •  ベイズであればベイズファクターやWAIC 50 Murray, A. L., Booth, T., & Molenaar, D. (2016). When middle really means “Top” or “Bottom”: An analysis of the 16PF5 using Bock's nominal response model. Journal of personality assessment, 98(3), 319-331. /3.ͷํ͕౰ͯ͸·Γ͕ྑ͍৔߹ɺ தؒ൓Ԡͷ࿪Έ͋Γɻ

Slide 51

Slide 51 text

Nominal > GPCM modelの場合 Murry (2016) -  全158項⽬からなるパーソナリティ尺度16PF5につ いて、NRSとGPCMを適⽤ (UKとUSの⼤規模コミュニティサンプル) -  USサンプルで22項⽬が順序が不正確 (Nominal >GPCM) -  UKサンプルで50項⽬が順序が不正確 特にQ1尺度が両サンプルで問題で、ほぼ全ての項⽬が、 中間反応が、最も低い閾値の順序になっていた (1,0,2)の順に なっていた 51 Murray, A. L., Booth, T., & Molenaar, D. (2016). When middle really means “Top” or “Bottom”: An analysis of the 16PF5 using Bock's nominal response model. Journal of personality assessment, 98(3), 319-331.

Slide 52

Slide 52 text

Q1 (経験への開放性)の歪み 52 Murray, A. L., Booth, T., & Molenaar, D. (2016). When middle really means “Top” or “Bottom”: An analysis of the 16PF5 using Bock's nominal response model. Journal of personality assessment, 98(3), 319-331. (0)ネガティブと(1) ?の順序が入れ替わってる!!

Slide 53

Slide 53 text

Nominal > GPCM modelの場合 Q1尺度でNRMの因⼦得点を算出し下記の4つのスコア リングとの相関係数を⽐較 1. 単純加算: r = .83 2. 中間反応をNAとして除いた得点で特性を推定 :r =.77 3. 中間反応を2として加算(⼀番⾼い段階にする) :r=.62 4. 中間反応を0として加算 (⼀番低い段階にする):r=.95 53 1 2 3 4 Murray, A. L., Booth, T., & Molenaar, D. (2016). When middle really means “Top” or “Bottom”: An analysis of the 16PF5 using Bock's nominal response model. Journal of personality assessment, 98(3), 319-331.

Slide 54

Slide 54 text

推奨 54 NRMで中間反応が⼀番低い順序だと⽰された項⽬を1から0に変 換して加算する いいえ(0)、わからない(1)、はい(2) いいえ(0)、わからない(0)、はい(2) ↓ Murray, A. L., Booth, T., & Molenaar, D. (2016). When middle really means “Top” or “Bottom”: An analysis of the 16PF5 using Bock's nominal response model. Journal of personality assessment, 98(3), 319-331.

Slide 55

Slide 55 text

brms以外/⾮ベイズではmirtパッケージ推し 55 Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501. ΧςΰϦΧϧҼࢠ෼ੳͷ࿮ ૊ΈͰݕূతɺ୳ࡧతͳ *35ϞσϧΛਪఆ .FUSPQPMJT)BTUJOHT 3PCCJOT.POSP .)3. BMHPSJUIN &.ΞϧΰϦζ Ϝʹجͮ͘࠷໬ਪఆ ରԠՄೳͳϞσϧͷൣғ޿ ͍ ϕΠζͱൺ΂ͯਪఆ͕ૣ͍

Slide 56

Slide 56 text

mirt(): 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 56 #GPCM, NRMの実行 gpcm.irt <- mirt(data,1,itemtype="gpcm") nominal.irt <- mirt(data,1,itemtype="nominal") #尤度比検定 anova(gpcm.irt,nominal.irt) ちなみに他のモデルはitemtypeを変えて指定 rasch.irt <- mirt(data,1,itemtype=”rasch") 2pl.irt <- mirt(data,1,itemtype=”2PL") 3pl.irt <- mirt(data,1,itemtype=”3PL") grm.irt <- mirt(data,1,itemtype=”graded") データの次の引数の 数値を変えると、 探索的因子分析を 実行してくれる モデルを指定してCFAも可

Slide 57

Slide 57 text

anova(): モデル⽐較 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 57 一般成人 XXX名のネット調査: XXX尺度 43項目 圧倒的にnominal支持

Slide 58

Slide 58 text

itemplot(): 項⽬特性曲線 58 入れ替えがおこってる 代表項目 この3つ以外にもたくさん入れ替わってる itemplot(nominal.irt,5) itemplot(nominal.irt,8) itemplot(nominal.irt,17)

Slide 59

Slide 59 text

summary(): 因⼦負荷の出⼒ 59 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学

Slide 60

Slide 60 text

coef(): 項⽬⺟数の出⼒ 60 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 dの値で順序性を確認

Slide 61

Slide 61 text

testinfo():テスト情報関数 61 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 plot(seq(-4,4,0.001), testinfo(nominal.irt,seq(-4,4,0.001)), type="l")

Slide 62

Slide 62 text

fscores(): 因⼦得点 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 62 hist(fscores(nominal.irt),breaks=15)

Slide 63

Slide 63 text

ゼロ分布に対応する ZERO-INFLATED MIXTURE IRT MODEL 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 63

Slide 64

Slide 64 text

IRTモデルの前提と逸脱 64 IRTϞσϧͷલఏ a.  ߲໨൓Ԡ(Zi )͸ਖ਼ن෼෍ b.  ಛੑ஋(θ)͸ਖ਼ن෼෍ c.  ޡࠩ͸ɺਖ਼ن෼෍ɺ౳෼ࢄ c. ޡࠩ෼ࢄ͕heteroscedastic b. ಛੑ஋(θ)͕࿪ΜͰ͍Δ a. ߲໨൓Ԡ(Zi )͕࿪ΜͰΔ લఏҳ୤ͷΠϝʔδ 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学

Slide 65

Slide 65 text

IRT: 前提のチェック •  単⼀次元性 (unidimensionality) –  指標内の各項⽬で測定している潜在特性は⼀つ →因⼦分析でチェック (1因⼦モデルの妥当性) •  局所独⽴性 (local independence) –  ある項⽬への反応と他の項⽬への反応は、同じ潜在変数で各項⽬を説明した場合に独⽴ となる →残差相関をチェック •  単調性 (monotonicity) –  カーネル平滑化IRT –  mokkenʼs rule –  IRTパラメータのチェック •  項⽬の不分散性 (heteroskedasticity) –  下位集団で項⽬反応が不変 –  DIFの検出 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 65

Slide 66

Slide 66 text

歪んだ分布 66 Wright, A. G., Pincus, A. L., & Lenzenweger, M. F. (2012). An empirical examination of distributional assumptions underlying the relationship between personality disorder symptoms and personality traits. Journal of abnormal psychology, 121(3), 699. •  unipolar trait, quasi trait •  ঱ঢ়ͳ͠ (0)͔Βॏ঱ͷε έʔϧͰɺθϩ͕ଟ͘঱ ঢ়͕ॏ͘ͳΔʹͭΕͯɺ ස౓͕গͳ͘ͳΔɻ •  ਫ਼ਆՊྖҬͷ࣬ױͷ঱ঢ় ʹؔ͢ΔίϛϡχςΟௐ ࠪͳͲͰΑ͘؍࡯͞ΕΔ ෼෍ (ਫ਼ਆ࣬ױͷ༗ප཰͕ ௿͍ͷͰɺଟ͘ͷਓ͸঱ ঢ়͕θϩʹدΔ)ɻ ࣗݾѪਓ֨ো֐ͷ঱ঢ়߲໨ͷ ୯७Ճࢉಘ఺ͷ෼෍

Slide 67

Slide 67 text

歪みの影響 •  潜在特性がゼロ過剰な分布に(特性値に)正規分布を仮定した 推定を⾏うと、困難度・識別度のパラメータ推定にバイアス (過剰推定) •  能⼒値(因⼦得点)の平均が過剰に推定 (0過剰分が中央に よってしまう) 67 Wall, M. M., Park, J. Y., & Moustaki, I. (2015). IRT modeling in the presence of zero-inflation with application to psychiatric disorder severity. Applied psychological measurement, 39(8), 583-597. シミューレーションデータ

Slide 68

Slide 68 text

歪みの影響 •  જࡏಛੑͷ෼෍͕θϩ ա৒Ͱ࿪ΜͰ͍Δͱɺ αϯϓϧαΠζ͕૿͑ ͯ΋ɺࠔ೉౓ɾࣝผ౓ ͷύϥϝʔλਪఆʹό ΠΞε͔͔Δɻ •  ͦͷόΠΞε͸αϯϓ ϧαΠζ͕૿͑ͯ΋ղ ফ͞Εͳ͍ɻ 68 Wall, M. M., Guo, J., & Amemiya, Y. (2012). Mixture factor analysis for approximating a nonnormally distributed continuous latent factor with continuous and dichotomous observed variables. Multivariate Behavioral Research, 47(2), 276-313.

Slide 69

Slide 69 text

zero-inflated mixture model 69 જࡏಛੑʹਖ਼نੑΛԾఆ͢Δ୅ΘΓʹɺજࡏ ಛੑͷ෼෍ʹ෦෼฼ूஂΛԾఆ͢Δ ඇපཧ܈͸঱ঢ়ͳ͠ɺθϩείΞͱͯ͠ݻఆ ͠ɺύϥϝʔλͷਪఆΛߦΘͣɺθϩҎ֎ͷ ूஂʹਖ਼ن෼෍Λ૝ఆͯ͠ਪఆΛߦ͏ *35ͷࠞ߹෼෍Ϟσϧ .QMVTͰ࣮ߦՄೳ ͬͦ͜ΓNJSUͰ΋࣮ߦՄೳ Wall, M. M., Park, J. Y., & Moustaki, I. (2015). IRT modeling in the presence of zero-inflation with application to psychiatric disorder severity. Applied psychological measurement, 39(8), 583-597.

Slide 70

Slide 70 text

zero-inflated mixture IRT ਖ਼ن෼෍ΛԾఆ͢Δ௨ৗͷIRT ΑΓɺ2-Ϋϥεͷθϩա৒ࠞ߹ ෼෍IRTͷద߹͕ྑ͍ 2-Ϋϥεͷθϩա৒ ࠞ߹෼෍ IRTϞσϧʹΑͬͯɺ ա৒ਪఆͷόΠΞε͕ิਖ਼ Wall, M. M., Park, J. Y., & Moustaki, I. (2015). IRT modeling in the presence of zero-inflation with application to psychiatric disorder severity. Applied psychological measurement, 39(8), 583-597. National representative sample N = 43,093ͷ͏ͪҿञश׳ͷ͋ΔN =26946 DSM-IVͷΞϧίʔϧґଘ঱11߲໨ (2஋) ୯७Ճࢉͷ48%͕θϩ 70

Slide 71

Slide 71 text

zero-inflated mixture IRT 71 DSM-5 ADHD঱ঢ়18߲໨ ୯७Ճࢉಘ఺ͷ෼෍ (N = 2,869) 25%͕঱ঢ়θϩ Cotton, J., & Baker, S. T. (2019). A data mining and item response mixture modeling method to retrospectively measure Diagnostic and Statistical Manual of Mental Disorders‐5 attention deficit hyperactivity disorder in the 1970 British Cohort Study. International journal of methods in psychiatric research, 28(1), e1753.

Slide 72

Slide 72 text

mirt(): 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 72 NJSUNVMUJQMF(SPVQ 1-Ͱͷ࣮ߦྫ ແ঱ঢ়ूஂͷಛੑ஋ͷฏۉΛஶ͘͠௿͍஋ ʹ ෼ࢄΛஶ͘͠খ͍͞஋ ʹ EFOUZQFlNJYUVSFz EFOUZQFlNJYUVSFzΫϥε·Ͱ͍͚Δ

Slide 73

Slide 73 text

mirt(): 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 73 ूஂ͸߲໨฼਺ਪఆ͞Εͣ ूஂͷΈਪఆ͞ΕΔ

Slide 74

Slide 74 text

潜在特性の歪みに対処する RAMSAY CURVE IRT 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 74

Slide 75

Slide 75 text

潜在特性の歪み 75 明らかに、部分母集団が存在する Reise, S. P., Rodriguez, A., Spritzer, K. L., & Hays, R. D. (2018). Alternative approaches to addressing non-normal distributions in the application of IRT models to personality measures. Journal of personality assessment, 100(4), 363-374.

Slide 76

Slide 76 text

Ramsay Curve IRT 76 જࡏม਺ͷ෼෍Λ߲໨฼਺ͱಉ࣌ʹਪఆ͢Δɻ ࣄલʹಛఆͷ෼෍Λ૝ఆͤͣɺσʔλɾυϦϒϯ ʹɺηϛύϥϝτϦοΫͳख๏Ͱ෼෍ܕΛΛਪఆɻ ෼෍ͷܗঢ়ਪఆʹ͸ɺ#4QMJOFΛ࢖༻ જࡏಛੑͷ෼෍Λ3BNTBZDVSWFͱͯ͠ &.ΞϧΰϦζϜͷ&εςοϓΛ࢖ͬͯਪఆ͍ͯ͠ ͘Β͍͠ Woods, C. M. (2006). Ramsay-curve item response theory (RC-IRT) to detect and correct for nonnormal latent variables. Psychological methods, 11(3), 253.

Slide 77

Slide 77 text

万能のmirt() •  Ramsay Curveと明⽰されていないが確かに ある。 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 77 ?mirt::mirt() dentype = “EHW” dentype = “Davidian-#” この二つがRamsay Curveで データ・ドリブンに潜在特性 の分布を推定

Slide 78

Slide 78 text

mirt 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 78 Ramsay curve GRM GRM 素得点との相関 r = 95 素得点との相関 r = 93

Slide 79

Slide 79 text

mirt 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 79 Ramsay Curve modelだと 項目母数は全体的に下方修正?

Slide 80

Slide 80 text

結論 mirt は しゅごい (語彙⼒) 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 80

Slide 81

Slide 81 text

Take Home Message •  柔軟なIRTモデルを実⾏するために、brmsや mirtパッケージは便利。 •  brmsは⾃由に分布型を指定できるので、想像 ⼒次第で様々な⽂脈のデータにIRTを適⽤可能 (反応速度とか) •  項⽬特性曲線、特性値の分布、観測変数の分 布など、細く⽬を配り、適切な対処をより良 い測定モデルへ (推定⽅法に限らない) 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 81