Upgrade to Pro — share decks privately, control downloads, hide ads and more …

しなやかな項目反応モデル

 しなやかな項目反応モデル

第28回パーソナリティ心理学会大会講習会1

Yoshitake Takebayashi

August 28, 2019
Tweet

More Decks by Yoshitake Takebayashi

Other Decks in Research

Transcript

  1. 今⽇の話題 3 •  brmsでベイジアン項⽬反応モデル →線型モデルによる理解と拡張 •  中間反応による歪みの検出と対処 →GPCM-IRTとNRM-IRTの活⽤ •  ゼロ過剰データへの対処

    →ゼロ過剰混合IRT •  潜在特性分布の歪みへの対処 →Ramsay curve IRT 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学
  2. brms 5 #BZFTJBO3FHSFTTJPO.PEFMVTJOH4UBO ϕΠζͰʢ#BZFTJBOʣ ճؼϞσϧʢ3FHSFTTJPO.PEFMʣ 4UBO࢖ͬͯʢVTJOH4UBOʣ   4UBOͷϥούʔ3ύοέʔδ Ϣʔβ͸ࣗ਎Ͱ4UBOίʔυΛॻ͘ඞཁ͸ͳ͘ɺ

    ϞσϧΛࢦఆ͢Δͱࣗಈతʹ಺෦Ͱ4UBOίʔυ͕ੜ੒͞Εɺα ϯϓϦϯά͕࣮ߦ͞ΕΔɻ     https://das-kino.hatenablog.com/entry/2018/12/15/230938 https://github.com/paul-buerkner/brms
  3. brms 6 https://das-kino.hatenablog.com/entry/2018/12/15/230938 ҰൠԽઢܕࠞ߹ϞσϧͷMNF ύοέʔδͷHMNFSؔ਺ͱಉ༷ͷ ϞσϧࣜͰ࣮ߦՄೳ MNFHMNFS ZdY  cHSPVQ

    GBNJMZzHBVTTJBOl EBUBEBU ઢܕࠞ߹Ϟσϧ MNFHMNFS ZdY  cHSPVQ GBNJMZzCJOPNJBMl EBUBEBU ҰൠԽઢܕࠞ߹Ϟσϧ MNFHMNFS ZdY  cHSPVQ GBNJMZzQPJTTPO EBUBEBU ҰൠԽઢܕࠞ߹Ϟσϧ   CSNTCSN ZdY  cHSPVQ GBNJMZzHBVTTJBOl EBUBEBU ઢܕࠞ߹Ϟσϧ CSNTCSN ZdY  cHSPVQ GBNJMZzCJOPNJBMl EBUBEBU ҰൠԽઢܕࠞ߹Ϟσϧ CSNTCSNS ZdY  cHSPVQ GBNJMZzQPJTTPOl EBUBEBU ҰൠԽઢܕࠞ߹Ϟσϧ
  4. ؍ଌม਺ؒͷؔ܎Λજࡏม਺Λಋೖͯ͠આ໌͢ΔϞσϧ 潜在変数モデル 8 X1 X2 X3 જࡏ ม਺ e 1

    e 2 e 3 જࡏม਺ɿ ௚઀ଌఆෆೳͳม਺ FH ஌ೳ ੑ֨ ͏ͭප ؍ଌม਺ ௚઀ଌఆՄೳͳม਺ FH ஌ೳݕࠪͷ߲໨  ɹɹੑ֨ݕࠪͷ߲໨  ͏ͭප
  5. reflective vs formative   9 Terwee, C. B., Prinsen, C.

    A., Chiarotto, A., Westerman, M. J., Patrick, D. L., Alonso, J., ... & Mokkink, L. B. (2018). COSMIN methodology for evaluating the content validity of patient-reported outcome measures: a Delphi study. Quality of Life Research, 27(5), 1159-1170. formative model reflective model :69 78;7 ' &!$ 0  &"$ 20 &#$ 0 :69 78;7 ' %!$ 0 %"$ 0 %#$ ε ε ε ε formative reflective  ⇒ ⇒      CTT, IRT 01,0/ 5)4 0/<,00 * +4-13.(
  6. 潜在変数モデルの種類 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 10 જࡏม਺ ࿈ଓ ΧςΰϦΧϧ ؍ ଌ

    ม ਺ ࿈ ଓ Ҽࢠ෼ੳϞσϧ જࡏϓϩϑΟϧϞσϧ Χ ς ΰ Ϧ Χ ϧ ߲໨൓ԠϞσϧ જࡏΫϥεɾϥϯΫϞσϧ X2 X1 X3 θi X2 X1 X3 Ci U2 U1 U3 θi U2 U1 U3 Ci
  7. CFA / IRT 11 X5 X6 X2 X1 X3 X4

    θi CFA e5 e6 e2 e1 e3 e4 IRT Z5 Z6 Z2 Z1 Z3 Z4 θi CTT IRT Xij : 個人iの項目jの反応 (連続) μj : 項目jの切片 αj : 項目jの因子負荷量 Θi : 個人iの因子得点 ej : 項目jの誤差 Zij : 個人iの項目jの反応 (2値/順序) αj : 項目jの困難度 (切片) βj : 項目jの識別力 Θi : 個人iの因子得点 (能力値) ej : 項目jの誤差 因子得点で観測変数を説明する線形回帰モデル Xij = µj +αj θi + eij α1 α2 α3 α4 α5 α6 β1 β2 β3 β4 β5 β6 e5 e6 e2 e1 e3 e4 Zij = -αj +βj θi + eij 因子得点で観測変数を説明するロジスティック回帰モデル 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学
  8. 潜在変数の得点がX1-X3の観測変数を説明 CFAモデル 12 潜在変数 潜在変数 潜在変数 X1 X2 X3 ؍ଌม਺Λैଐม਺ͱ͠

    જࡏม਺Λಠཱม਺ͱ͢ΔઢܗճؼϞσϧ ؍ଌม਺C જࡏม਺ ޡࠩ X2 X1 X3 θi
  9. 潜在変数の得点がZ1-Z3の応答確率を説明 IRTモデル 13 潜在変数 潜在変数 潜在変数 Z1 Z2 Z3 ؍ଌม਺Λैଐม਺ͱ͠

    જࡏม਺Λಠཱม਺ͱ͢ΔϩδεςΟοΫ ճؼϞσϧ؍ଌม਺C જࡏม਺ ޡࠩ U2 U1 U3 θi
  10. IRT model: 3PL 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 14 θj = ݸਓjͷજࡏతೳྗ

    (Ҽࢠಘ఺) aj = ࣝผ౓฼਺ (discrimination parameter) bj = ࠔ೉౓฼਺ (difficulty parameter) cj = ౰ͯਪྔ฼਺ (paseudoguessing parameter) 3PL IRT model 2PL:3PLからcj なし 1PL / Rasch: 2PLの識別度が項目間で固定
  11. IRT model: 2PLの⺟数 15 aj = ࣝผ౓฼਺ (discrimination parameter) bj

    = ࠔ೉౓฼਺ (difficulty parameter) 2PL IRT model aj = 識別度母数 βj = 困難度母数 その項目が能力値の高低を分けれる程度 その項目がどの程度の能力値の 識別に適しているか
  12. IRT model: 1PLの⺟数 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 16 a = ࣝผ౓฼਺

    (discrimination parameter) ※ ߲໨ؒͰҰఆ bj = ࠔ೉౓฼਺ (difficulty parameter) 1PL IRT /Rasch model
  13. stanでIRTモデル: 3PL 17 Luo, Y., & Jiao, H. (2018). Using

    the Stan program for Bayesian item response theory. Educational and psychological measurement, 78(3), 384-408. 掲載されているコード 3 PL GRM 段階反応 NRM 名義反応 looとWAICでモデル比較 Rash testlet model Multilevel 3PL
  14. stanでIRTモデル: 3PL 18 データブロック パラメータブロック モデルブロック 生成量ブロック Luo, Y., &

    Jiao, H. (2018). Using the Stan program for Bayesian item response theory. Educational and psychological measurement, 78(3), 384-408.
  15. brmsでIRT 19 Bürkner, P. C. (2019). Bayesian Item Response Modelling

    in R with brms and Stan. arXiv preprint arXiv:1905.09501. 掲載コード 1PL / Rash model 2PL 3PL GRM 反応時間のIRT (diffusion model)
  16. brmsでIRT 20 Bürkner, P. C. (2019). Bayesian Item Response Modelling

    in R with brms and Stan. arXiv preprint arXiv:1905.09501. 論文掲載のIRTモデ ルのコードや、可視 化に使ったコードを まるっと公開
  17. brmsで1PL/Rasch model 22 formula_va_1pl <- bf(r2 ~ 1 + (1

    | item) + (1 | id)) prior_va_1pl <- prior("normal(0, 3)", class = "sd", group = "id”)+ prior("normal(0, 3)", class = "sd", group = "item") fit_va_1pl <- brm( formula = formula_va_1pl, data = VerbAgg, family = brmsfamily("bernoulli", "logit"), prior = prior_va_1pl) #モデル式 #事前分布の設定 #Stanによるサンプリングの実行 事前分布設定法には諸説あり 項目母数と特性値を 変量効果として推定 Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.
  18. パラメータの事後分布 23 QMPU GJU@WB@QM  C@JOUFSDFQU ࠔ೉౓ͷूஂฏۉ ͷࣄޙ෼෍  TE@JE@JOUFSDFQU

    ಛੑ஋ͷ4% ͷࣄޙ෼෍  TE@JUFN@JUFSDFQU ࠔ೉౓ͷ4% ͷࣄޙ෼෍  Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.
  19. 困難度の推定結果 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 24 MJCSBSZ CSNTUPPMT   

      GPSFTU GJU@WB@QM HSPVQJOHJUFNz  ֤߲໨ͷࠔ೉౓ ͷࣄޙ෼෍ɺࣄޙฏۉɺ ֬৴۠ؒ  GPSFTUؔ਺Ͱ͸ࣄޙฏۉͷ ߴ͍ॱʹࣗಈͰ4PSU  −0.17 [−0.70, 0.32] −2.90 [−3.37, −2.46] −1.97 [−2.33, −1.62] −1.51 [−1.85, −1.17] −1.48 [−1.80, −1.16] −1.46 [−1.80, −1.13] −1.03 [−1.34, −0.73] −0.86 [−1.16, −0.55] −0.68 [−0.98, −0.37] −0.38 [−0.68, −0.08] −0.35 [−0.64, −0.05] −0.21 [−0.51, 0.08] −0.06 [−0.34, 0.23] 0.01 [−0.28, 0.30] 0.08 [−0.23, 0.38] 0.38 [ 0.09, 0.68] 0.52 [ 0.23, 0.81] 0.56 [ 0.26, 0.86] 0.70 [ 0.39, 1.00] 0.70 [ 0.40, 1.00] 0.86 [ 0.55, 1.17] 1.07 [ 0.76, 1.39] 1.20 [ 0.89, 1.50] 1.21 [ 0.90, 1.53] 1.72 [ 1.38, 2.07] Intercept −4 −2 0 2 Average S3DoShout S4DoShout S3WantShout S3DoScold S2DoShout S4WantShout S1DoShout S3WantScold S4DoScold S4WantScold S3DoCurse S2DoScold S2WantShout S1WantShout S1DoScold S3WantCurse S1WantScold S4DoCurse S2WantScold S2DoCurse S4wantCurse S1WantCurse S1DoCurse S2WantCurse
  20. 特性値の推定結果 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 25 MJCSBSZ CSNTUPPMT  GPSFTU GJU@WB@QM

    HSPVQJOHJE  ݸਓͷಛੑ஋ͷࣄ ޙฏۉͱ֬৴ ۠ؒ  ݸਓΛಛੑ஋ͷେ ͖͞ॱʹ4PSU
  21. brmsで1PL/Rasch model •  共変量を含んだモデル 26 modeによって、特性値が異なる Bürkner, P. C. (2019).

    Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501. 二項分布, ロジットリンク
  22. brmsでbrmsで1PL/Rasch model •  modeによって、特性値が異なる 27 marginal_effects(fit_va_1pl_cov1, effects = "Anger", categorical

    = TRUE) Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.
  23. brmsでbrmsで1PL/Rasch model •  genderによって、項⽬反応が異なる •  項⽬反応にGenderとmodeの交互作⽤がありそう 29 NBSHJOBM@FGGFDUT GJU@WB@QM@DPW 

             FGGFDUT"OHFS DBUFHPSJDBM536&  Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.
  24. brmsで2PL model 30 Bürkner, P. C. (2019). Bayesian Item Response

    Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.
  25. brmsで2PL 32 MJCSBSZ CSNTUPPMT  TVNNBSZ GJU@WB@QM   

      GPSFTU GJU@WB@QM HSPVQJOHJUFNz  識別度 困難度 −0.41 [ −1.88, 0.83] −6.86 [−13.90, −2.25] −4.62 [ −9.35, −1.50] −3.70 [ −7.62, −1.18] −3.41 [ −7.02, −1.06] −3.25 [ −6.55, −1.03] −2.51 [ −5.32, −0.79] −1.93 [ −4.06, −0.59] −1.52 [ −3.41, −0.43] −0.86 [ −2.14, −0.11] −0.75 [ −1.89, −0.08] −0.50 [ −1.51, 0.18] −0.10 [ −0.90, 0.59] 0.03 [ −0.73, 0.86] 0.18 [ −0.51, 1.03] 0.82 [ 0.12, 2.04] 1.23 [ 0.27, 2.93] 1.24 [ 0.30, 2.85] 1.54 [ 0.42, 3.36] 1.56 [ 0.42, 3.45] 1.91 [ 0.55, 4.07] 2.43 [ 0.73, 5.08] 2.59 [ 0.80, 5.28] 2.67 [ 0.82, 5.57] 3.75 [ 1.19, 7.50] −0.71 [ −1.49, 0.30] −0.84 [ −1.67, 0.19] −0.83 [ −1.65, 0.21] −0.82 [ −1.64, 0.20] −0.79 [ −1.61, 0.23] −0.78 [ −1.58, 0.24] −0.78 [ −1.59, 0.25] −0.75 [ −1.56, 0.29] −0.73 [ −1.54, 0.30] −0.73 [ −1.54, 0.29] −0.72 [ −1.51, 0.31] −0.72 [ −1.52, 0.31] −0.71 [ −1.51, 0.31] −0.70 [ −1.49, 0.32] −0.69 [ −1.51, 0.34] −0.69 [ −1.50, 0.35] −0.68 [ −1.50, 0.32] −0.68 [ −1.48, 0.35] −0.67 [ −1.47, 0.35] −0.67 [ −1.48, 0.35] −0.66 [ −1.45, 0.36] −0.65 [ −1.46, 0.39] −0.63 [ −1.42, 0.42] −0.62 [ −1.42, 0.42] −0.56 [ −1.38, 0.49] eta_Intercept logalpha_Intercept −20 −10 0 10 −2 −1 0 1 Average S3WantShout S4WantShout S3WantCurse S3DoShout S3DoCurse S4DoShout S3DoScold S4wantCurse S2WantShout S4DoScold S1DoShout S1WantShout S3WantScold S4DoCurse S2DoShout S1WantCurse S2DoCurse S4WantScold S1WantScold S2WantScold S2WantCurse S1DoCurse S2DoScold S1DoScold Average S3DoShout S4DoShout S3WantShout S3DoScold S2DoShout S4WantShout S1DoShout S3WantScold S4DoScold S4WantScold S3DoCurse S2DoScold S2WantShout S1WantShout S1DoScold S3WantCurse S1WantScold S2WantScold S4DoCurse S2DoCurse S4wantCurse S1DoCurse S1WantCurse S2WantCurse
  26. brmsでGRM 33 累積分布, ロジットリンク Bürkner, P. C. (2019). Bayesian Item

    Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.
  27. brmsでGRM 35 −0.89 [−1.59, 0.02] −0.92 [−1.62, −0.01] −0.92 [−1.62,

    −0.01] −0.91 [−1.61, 0.00] −0.91 [−1.62, 0.00] −0.91 [−1.61, −0.01] −0.90 [−1.61, 0.00] −0.90 [−1.60, 0.01] −0.90 [−1.59, 0.02] −0.90 [−1.59, 0.01] −0.90 [−1.60, 0.01] −0.89 [−1.59, 0.02] −0.89 [−1.59, 0.02] −0.89 [−1.58, 0.02] −0.88 [−1.57, 0.02] −0.88 [−1.58, 0.03] −0.88 [−1.59, 0.03] −0.88 [−1.58, 0.04] −0.88 [−1.58, 0.04] −0.88 [−1.57, 0.04] −0.87 [−1.57, 0.05] −0.87 [−1.58, 0.03] −0.87 [−1.57, 0.05] −0.87 [−1.57, 0.05] −0.86 [−1.57, 0.05] 0.38 [−0.96, 2.01] −4.08 [−7.69, −1.50] −3.37 [−6.42, −1.24] −2.98 [−5.69, −1.06] −2.38 [−4.57, −0.84] −2.23 [−4.33, −0.78] −2.04 [−4.09, −0.69] −1.89 [−3.86, −0.64] −1.42 [−2.91, −0.44] −1.07 [−2.40, −0.26] −0.95 [−2.20, −0.19] −0.32 [−1.28, 0.41] −0.11 [−0.89, 0.69] 0.09 [−0.65, 0.93] 0.88 [ 0.12, 2.12] 0.90 [ 0.16, 2.19] 1.01 [ 0.20, 2.32] 1.95 [ 0.66, 3.99] 2.15 [ 0.74, 4.31] 2.57 [ 0.90, 5.07] 3.63 [ 1.32, 7.07] 3.79 [ 1.39, 7.31] 3.87 [ 1.41, 7.42] 4.94 [ 1.80, 9.48] 7.24 [ 2.66, 13.74] 5.25 [ 1.90, 10.18] 0.79 [ 0.08, 1.94] 1.50 [ 0.46, 3.18] 1.89 [ 0.65, 3.88] 2.49 [ 0.89, 4.84] 2.64 [ 0.96, 5.15] 2.83 [ 1.00, 5.51] 2.98 [ 1.08, 5.72] 3.46 [ 1.27, 6.63] 3.80 [ 1.41, 7.16] 3.92 [ 1.44, 7.39] 4.55 [ 1.70, 8.57] 4.77 [ 1.78, 8.95] 4.96 [ 1.84, 9.33] 5.75 [ 2.16, 10.78] 5.77 [ 2.20, 10.81] 5.88 [ 2.17, 10.96] 6.82 [ 2.57, 12.83] 7.02 [ 2.64, 13.10] 7.44 [ 2.76, 13.92] 8.50 [ 3.17, 16.00] 8.66 [ 3.21, 16.14] 8.74 [ 3.27, 16.24] 9.81 [ 3.65, 18.40] 12.12 [ 4.50, 22.63] disc_Intercept Intercept[1] Intercept[2] −2 −1 0 1 −10 0 10 20 0 10 20 30 Average S2WantCurse S1WantCurse S1DoCurse S2DoCurse S4wantCurse S2WantScold S1WantScold S4DoCurse S1DoScold S3WantCurse S2WantShout S1WantShout S2DoScold S4WantScold S3DoCurse S4DoScold S3WantScold S1DoShout S4WantShout S2DoShout S3DoScold S3WantShout S4DoShout S3DoShout Average S2WantCurse S1WantCurse S1DoCurse S2DoCurse S4wantCurse S2WantScold S1WantScold S4DoCurse S1DoScold S3WantCurse S2WantShout S1WantShout S2DoScold S4WantScold S3DoCurse S4DoScold S3WantScold S1DoShout S4WantShout S2DoShout S3DoScold S3WantShout S4DoShout S3DoShout Average S1WantCurse S2WantScold S1WantScold S4WantShout S2WantShout S1WantShout S2DoCurse S3WantCurse S2WantCurse S1DoShout S4wantCurse S1DoCurse S4DoCurse S4WantScold S2DoShout S4DoShout S4DoScold S3WantShout S2DoScold S1DoScold S3DoCurse S3WantScold S3DoShout S3DoScold MJCSBSZ CSNTUPPMT  TVNNBSZ GJU@WB@PSE@QM       GPSFTU GJU@WB@PSE@QM HSPVQJOHJUFNz 
  28. brmsでGRM 36 •  共変量を含んだモデル Bürkner, P. C. (2019). Bayesian Item

    Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.
  29. brmsでGRM 37 •  共変量を含んだモデル marginal_effects(fit_va_ord_cov1, effects = "Anger", categorical =

    TRUE) Bürkner, P. C. (2019). Bayesian Item Response Modelling in R with brms and Stan. arXiv preprint arXiv:1905.09501.
  30. 事前分布設定の1オプション 39 Natesan, P., Nandakumar, R., Minka, T., & Rubright,

    J. D. (2016). Bayesian prior choice in IRT estimation using MCMC and variational Bayes. Frontiers in psychology, 7, 1422. •  変分ベイズ推定の結果を事前分布に活⽤する brmsでは引数algorithmで指定可能 #HMC algorithm = c("sampling”) #Variational bayes with independent normal distribution algorithm = c("meanfield”) #Variational bayes with multivariate normal distribution algorithm = c("fullrank”)
  31. brmsでIRT系モデルできること •  他の多値モデルももちろん可能 –  GPCM, Nominal Response Model •  Count

    modelも可能 – Rasch count modelなど •  特殊な分布も可能 – 指数ガウス (ex-gaussian)分布を使った反応時間 のIRTモデルも可能 – ということはbrmsでdrift Diffusion modelも可能 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 41
  32. ところで 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 44 •  他の多値モデルも可能 –  GPCM, Nominal

    Response Model ↑ 使い道がよくわからなかった僕 GPCMとGRMは出⾃が違うが似たようなパフォーマ ンスを⽰す。論⽂ではGRMをよく⽬にする。
  33. IRT model: Nominal model 45 /3.͸(1$.ͷԼҐϞσϧ (1$.ͱ(3.͸ಉ౳ͷਪఆ݁Ռ ʹͳΔ͜ͱ͕͓͓͍  /PNJOBMSFTQPOTFNPEF

    /3.  (1$.NPEFM ճ౴ΧςΰϦؒʹॱংੑΛԾఆ͠ͳ͍ଟ஋ܕ*35Ϟσϧ /3.ͱ(1$.͕ϞσϧൺֱՄೳൺֱ͢Δ͜ͱͰ߲໨൓ԠͷॱংͷԾఆΛݕ౼Ͱ͖Δ ճ౴ΧςΰϦؒʹॱংੑΛԾఆ͢Δଟ஋ܕ*35Ϟσϧ
  34. 中間反応の歪み •  ஈ֊൓ԠϞσϧ΍(1$.ͰѻΘΕΔई౓ͷ൓ ԠΧςΰϦʹ͸ॱংੑ͕͋Δ – ྫ͑͹ɺ ɹ •  ౰ͯ͸·Βͳ͍  

    •  ͋·Γ౰ͯ͸·Βͳ͍   •  ͲͪΒͱ΋ݴ͑ͳ͍   •  ΍΍౰ͯ͸·Δ   •  ౰ͯ͸·Δ   19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 46 જࡏಛੑͷதؒΛ൓ө͍ͯ͠Δ ͜ͷॱংੑͷҳ୤͸ɺॏཁͳ໰୊ͱͳΔɻ
  35. 中間反応の歪み 47 閾値の歪み (中間反応が他の反応と区別できない) 識別度の歪み (中間反応の次の段階の反応の順序が入れ違ってる) Murray, A. L., Booth,

    T., & Molenaar, D. (2016). When middle really means “Top” or “Bottom”: An analysis of the 16PF5 using Bock's nominal response model. Journal of personality assessment, 98(3), 319-331.
  36. 中間反応が歪む理由は多様 •  葛藤または無関⼼ •  質問の理解不⾜ •  特性を表明することへの抵抗(社会的に望まし くない⾏動など) •  判断に必要な情報が⼗分にない

    •  質問に明確に答えることに馴染みがない 48 Romá, V. G., & Espejo, B. (2003). Testing the middle response categories «Not sure»,«In between» and «?» in polytomous items. Psicothema, 15(2), 278-284. ଌఆΛ܁Γฦͨ͢ͼʹෆ҆ఆ
  37. 反応段階の順序が崩れると •  合計点として単純加算できない – 例えば、先のように、中間と次の段階の順序性が ⼊れ替わっている項⽬をそのまま他の項⽬と加算 すると、合計点が実際の得点よりも低くなる – 潜在特性の⾼さが中間反応と関連する場合、特性 値と反応の順序の乖離が⼤きくなる。 •  例えば、神経症傾向の⼈は優柔不断で真ん中反応になり

    がち。もし神経症と関係する特性を測定していたとする と、真ん中反応と次の段階の順序が⼊れ替わる場合が出 てくる。 49 Romá, V. G., & Espejo, B. (2003). Testing the middle response categories «Not sure»,«In between» and «?» in polytomous items. Psicothema, 15(2), 278-284.
  38. 中間反応の歪み検討 •  GPCMとNominal Response Modelを⽐較 – NRMはGPCMの下位モデル – GPCMは項⽬反応の順序性を仮定 – NRMは項⽬反応の順序性を仮定していない •  Wald検定やモデル⽐較に指標で検討

    •  ベイズであればベイズファクターやWAIC 50 Murray, A. L., Booth, T., & Molenaar, D. (2016). When middle really means “Top” or “Bottom”: An analysis of the 16PF5 using Bock's nominal response model. Journal of personality assessment, 98(3), 319-331. /3.ͷํ͕౰ͯ͸·Γ͕ྑ͍৔߹ɺ தؒ൓Ԡͷ࿪Έ͋Γɻ
  39. Nominal > GPCM modelの場合 Murry (2016) -  全158項⽬からなるパーソナリティ尺度16PF5につ いて、NRSとGPCMを適⽤ (UKとUSの⼤規模コミュニティサンプル)

    -  USサンプルで22項⽬が順序が不正確 (Nominal >GPCM) -  UKサンプルで50項⽬が順序が不正確 特にQ1尺度が両サンプルで問題で、ほぼ全ての項⽬が、 中間反応が、最も低い閾値の順序になっていた (1,0,2)の順に なっていた 51 Murray, A. L., Booth, T., & Molenaar, D. (2016). When middle really means “Top” or “Bottom”: An analysis of the 16PF5 using Bock's nominal response model. Journal of personality assessment, 98(3), 319-331.
  40. Q1 (経験への開放性)の歪み 52 Murray, A. L., Booth, T., & Molenaar,

    D. (2016). When middle really means “Top” or “Bottom”: An analysis of the 16PF5 using Bock's nominal response model. Journal of personality assessment, 98(3), 319-331. (0)ネガティブと(1) ?の順序が入れ替わってる!!
  41. Nominal > GPCM modelの場合 Q1尺度でNRMの因⼦得点を算出し下記の4つのスコア リングとの相関係数を⽐較 1. 単純加算: r =

    .83 2. 中間反応をNAとして除いた得点で特性を推定 :r =.77 3. 中間反応を2として加算(⼀番⾼い段階にする) :r=.62 4. 中間反応を0として加算 (⼀番低い段階にする):r=.95 53 1 2 3 4 Murray, A. L., Booth, T., & Molenaar, D. (2016). When middle really means “Top” or “Bottom”: An analysis of the 16PF5 using Bock's nominal response model. Journal of personality assessment, 98(3), 319-331.
  42. 推奨 54 NRMで中間反応が⼀番低い順序だと⽰された項⽬を1から0に変 換して加算する いいえ(0)、わからない(1)、はい(2) いいえ(0)、わからない(0)、はい(2) ↓ Murray, A. L.,

    Booth, T., & Molenaar, D. (2016). When middle really means “Top” or “Bottom”: An analysis of the 16PF5 using Bock's nominal response model. Journal of personality assessment, 98(3), 319-331.
  43. brms以外/⾮ベイズではmirtパッケージ推し 55 Bürkner, P. C. (2019). Bayesian Item Response Modelling

    in R with brms and Stan. arXiv preprint arXiv:1905.09501. ΧςΰϦΧϧҼࢠ෼ੳͷ࿮ ૊ΈͰݕূతɺ୳ࡧతͳ *35ϞσϧΛਪఆ  .FUSPQPMJT)BTUJOHT 3PCCJOT.POSP .)3.  BMHPSJUIN &.ΞϧΰϦζ Ϝʹجͮ͘࠷໬ਪఆ   ରԠՄೳͳϞσϧͷൣғ޿ ͍  ϕΠζͱൺ΂ͯਪఆ͕ૣ͍
  44. mirt(): 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 56 #GPCM, NRMの実行 gpcm.irt <- mirt(data,1,itemtype="gpcm")

    nominal.irt <- mirt(data,1,itemtype="nominal") #尤度比検定 anova(gpcm.irt,nominal.irt) ちなみに他のモデルはitemtypeを変えて指定 rasch.irt <- mirt(data,1,itemtype=”rasch") 2pl.irt <- mirt(data,1,itemtype=”2PL") 3pl.irt <- mirt(data,1,itemtype=”3PL") grm.irt <- mirt(data,1,itemtype=”graded") データの次の引数の 数値を変えると、 探索的因子分析を 実行してくれる モデルを指定してCFAも可
  45. IRTモデルの前提と逸脱 64 IRTϞσϧͷલఏ a.  ߲໨൓Ԡ(Zi )͸ਖ਼ن෼෍ b.  ಛੑ஋(θ)͸ਖ਼ن෼෍ c.  ޡࠩ͸ɺਖ਼ن෼෍ɺ౳෼ࢄ

    c. ޡࠩ෼ࢄ͕heteroscedastic b. ಛੑ஋(θ)͕࿪ΜͰ͍Δ a. ߲໨൓Ԡ(Zi )͕࿪ΜͰΔ લఏҳ୤ͷΠϝʔδ 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学
  46. IRT: 前提のチェック •  単⼀次元性 (unidimensionality) –  指標内の各項⽬で測定している潜在特性は⼀つ →因⼦分析でチェック (1因⼦モデルの妥当性) • 

    局所独⽴性 (local independence) –  ある項⽬への反応と他の項⽬への反応は、同じ潜在変数で各項⽬を説明した場合に独⽴ となる →残差相関をチェック •  単調性 (monotonicity) –  カーネル平滑化IRT –  mokkenʼs rule –  IRTパラメータのチェック •  項⽬の不分散性 (heteroskedasticity) –  下位集団で項⽬反応が不変 –  DIFの検出 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 65
  47. 歪んだ分布 66 Wright, A. G., Pincus, A. L., & Lenzenweger,

    M. F. (2012). An empirical examination of distributional assumptions underlying the relationship between personality disorder symptoms and personality traits. Journal of abnormal psychology, 121(3), 699. •  unipolar trait, quasi trait •  ঱ঢ়ͳ͠ (0)͔Βॏ঱ͷε έʔϧͰɺθϩ͕ଟ͘঱ ঢ়͕ॏ͘ͳΔʹͭΕͯɺ ස౓͕গͳ͘ͳΔɻ •  ਫ਼ਆՊྖҬͷ࣬ױͷ঱ঢ় ʹؔ͢ΔίϛϡχςΟௐ ࠪͳͲͰΑ͘؍࡯͞ΕΔ ෼෍ (ਫ਼ਆ࣬ױͷ༗ප཰͕ ௿͍ͷͰɺଟ͘ͷਓ͸঱ ঢ়͕θϩʹدΔ)ɻ ࣗݾѪਓ֨ো֐ͷ঱ঢ়߲໨ͷ ୯७Ճࢉಘ఺ͷ෼෍
  48. 歪みの影響 •  潜在特性がゼロ過剰な分布に(特性値に)正規分布を仮定した 推定を⾏うと、困難度・識別度のパラメータ推定にバイアス (過剰推定) •  能⼒値(因⼦得点)の平均が過剰に推定 (0過剰分が中央に よってしまう) 67

    Wall, M. M., Park, J. Y., & Moustaki, I. (2015). IRT modeling in the presence of zero-inflation with application to psychiatric disorder severity. Applied psychological measurement, 39(8), 583-597. シミューレーションデータ
  49. 歪みの影響 •  જࡏಛੑͷ෼෍͕θϩ ա৒Ͱ࿪ΜͰ͍Δͱɺ αϯϓϧαΠζ͕૿͑ ͯ΋ɺࠔ೉౓ɾࣝผ౓ ͷύϥϝʔλਪఆʹό ΠΞε͔͔Δɻ •  ͦͷόΠΞε͸αϯϓ

    ϧαΠζ͕૿͑ͯ΋ղ ফ͞Εͳ͍ɻ 68 Wall, M. M., Guo, J., & Amemiya, Y. (2012). Mixture factor analysis for approximating a nonnormally distributed continuous latent factor with continuous and dichotomous observed variables. Multivariate Behavioral Research, 47(2), 276-313.
  50. zero-inflated mixture model 69 જࡏಛੑʹਖ਼نੑΛԾఆ͢Δ୅ΘΓʹɺજࡏ ಛੑͷ෼෍ʹ෦෼฼ूஂΛԾఆ͢Δ  ඇපཧ܈͸঱ঢ়ͳ͠ɺθϩείΞͱͯ͠ݻఆ ͠ɺύϥϝʔλͷਪఆΛߦΘͣɺθϩҎ֎ͷ ूஂʹਖ਼ن෼෍Λ૝ఆͯ͠ਪఆΛߦ͏

      *35ͷࠞ߹෼෍Ϟσϧ .QMVTͰ࣮ߦՄೳ ͬͦ͜ΓNJSUͰ΋࣮ߦՄೳ Wall, M. M., Park, J. Y., & Moustaki, I. (2015). IRT modeling in the presence of zero-inflation with application to psychiatric disorder severity. Applied psychological measurement, 39(8), 583-597.
  51. zero-inflated mixture IRT ਖ਼ن෼෍ΛԾఆ͢Δ௨ৗͷIRT ΑΓɺ2-Ϋϥεͷθϩա৒ࠞ߹ ෼෍IRTͷద߹͕ྑ͍ 2-Ϋϥεͷθϩա৒ ࠞ߹෼෍ IRTϞσϧʹΑͬͯɺ ա৒ਪఆͷόΠΞε͕ิਖ਼

    Wall, M. M., Park, J. Y., & Moustaki, I. (2015). IRT modeling in the presence of zero-inflation with application to psychiatric disorder severity. Applied psychological measurement, 39(8), 583-597. National representative sample N = 43,093ͷ͏ͪҿञश׳ͷ͋ΔN =26946 DSM-IVͷΞϧίʔϧґଘ঱11߲໨ (2஋) ୯७Ճࢉͷ48%͕θϩ 70
  52. zero-inflated mixture IRT 71 DSM-5 ADHD঱ঢ়18߲໨ ୯७Ճࢉಘ఺ͷ෼෍ (N = 2,869)

    25%͕঱ঢ়θϩ Cotton, J., & Baker, S. T. (2019). A data mining and item response mixture modeling method to retrospectively measure Diagnostic and Statistical Manual of Mental Disorders‐5 attention deficit hyperactivity disorder in the 1970 British Cohort Study. International journal of methods in psychiatric research, 28(1), e1753.
  53. 潜在特性の歪み 75 明らかに、部分母集団が存在する Reise, S. P., Rodriguez, A., Spritzer, K.

    L., & Hays, R. D. (2018). Alternative approaches to addressing non-normal distributions in the application of IRT models to personality measures. Journal of personality assessment, 100(4), 363-374.
  54. Ramsay Curve IRT 76 જࡏม਺ͷ෼෍Λ߲໨฼਺ͱಉ࣌ʹਪఆ͢Δɻ ࣄલʹಛఆͷ෼෍Λ૝ఆͤͣɺσʔλɾυϦϒϯ ʹɺηϛύϥϝτϦοΫͳख๏Ͱ෼෍ܕΛΛਪఆɻ  ෼෍ͷܗঢ়ਪఆʹ͸ɺ#4QMJOFΛ࢖༻ જࡏಛੑͷ෼෍Λ3BNTBZDVSWFͱͯ͠

      &.ΞϧΰϦζϜͷ&εςοϓΛ࢖ͬͯਪఆ͍ͯ͠ ͘Β͍͠ Woods, C. M. (2006). Ramsay-curve item response theory (RC-IRT) to detect and correct for nonnormal latent variables. Psychological methods, 11(3), 253.
  55. 万能のmirt() •  Ramsay Curveと明⽰されていないが確かに ある。 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 77 ?mirt::mirt()

    dentype = “EHW” dentype = “Davidian-#” この二つがRamsay Curveで データ・ドリブンに潜在特性 の分布を推定
  56. Take Home Message •  柔軟なIRTモデルを実⾏するために、brmsや mirtパッケージは便利。 •  brmsは⾃由に分布型を指定できるので、想像 ⼒次第で様々な⽂脈のデータにIRTを適⽤可能 (反応速度とか)

    •  項⽬特性曲線、特性値の分布、観測変数の分 布など、細く⽬を配り、適切な対処をより良 い測定モデルへ (推定⽅法に限らない) 19/08/28 日本パーソナリティ心理学会大会 @武蔵野美術大学 81