Upgrade to Pro — share decks privately, control downloads, hide ads and more …

統計勉強会2020 統計学の基礎と分析方法

統計勉強会2020 統計学の基礎と分析方法

2020年 10 月 29 日~ 11 月 20 日 広島大学

Daiki Nakamura

October 29, 2020
Tweet

More Decks by Daiki Nakamura

Other Decks in Education

Transcript

  1. 統計勉強会2020
    統計学の基礎と分析方法
    2020年10月29日~11月20日 @広島大学
    広島大学大学院D2
    中村大輝

    View full-size slide

  2. 1
    本勉強会の方針
    目的:
    統計学の基礎と実際の分析方法を習得する
    • 初歩的な統計学の基礎を概説する
    • 架空のデータを用いて、様々な分析の演習
    • 卒論研究に必要な一連の分析技術を習得
    × 〇
    分からない できない できる 分かる

    View full-size slide

  3. 2
    なぜ、いま統計力が必要か
    •EBM(Evidence-based medicine)
    •EBPM(Evidence-based policy making)
    •EBE(Evidence-based education)
    →証拠に基づく意思決定
    •実証研究に必要不可欠
    •調査デザインにも影響
    •統計教育の広がり
    メタ分析
    無作為化比較
    試験(RCT)
    比較実践研究
    要因対照研究
    事例報告
    専門家の意見
    個人の意見(体験談)


    エビデンスピラミッド
    (根拠の信頼性)

    View full-size slide

  4. 3
    SPSS vs R
    • 有料ソフトである
    • ボタンをポチポチして操作
    (GUI)
    • 日本語対応
    • 無料ソフトである
    • コードを入力して操作(CUI)
    • パッケージ(拡張機能)も8000を超
    える
    • Rでしかできない最新手法が多くある
    • 基本英語
    <

    View full-size slide

  5. 4
    Rコミュニティの活発な議論

    View full-size slide

  6. 5
    準備:RとRStudioをインストールしよう
    ◼ R
    CRANからbaseをダウンロード&インストール
    https://cran.ism.ac.jp/
    ◼ RStudio
    Rstudio社のHPからFree版をダウンロード&インストール
    https://rstudio.com/products/rstudio/download/#downl
    oad

    View full-size slide

  7. 6
    RStudioについて
    ⚫RStudioは、Rをより使いやすくするためのソフト(基本無料)
    ⚫この講習会では、すべてRStudioを利用して分析する
    ⚫必ずインストール
    <便利なところ>
    • コードの予測変換や引数リストを表示してくれる
    • 変数の管理が容易

    View full-size slide

  8. Rの使い方の基礎

    View full-size slide

  9. 8
    RStudioの画面
    エディタ
    (コードを書くところ)
    コンソール
    (結果・出力が出るところ)
    パッケージ
    の管理
    図表の出力
    ワークスペース
    (変数の管理)

    View full-size slide

  10. 9
    R Scriptを作成して保存
    R Scriptの作成と保存
    ファイル名に英語を使った方がよい
    例)script1, 190907, code_0907
    コードを書いておく
    メモ帳のようなもの

    View full-size slide

  11. 10
    四則演算
    #四則演算#####
    3+5
    10-3
    2*3
    100/20
    (12+34-56)*78/90
    4^2
    • エディタに書いて実行 or コンソールに直接入力
    実行の方法
    • Ctr+Enterでその行を実行
    • Alt+Enterでその行を実行★
    • 範囲を指定してRunをクリック
    コメントアウト(メモ)
    • #から始めるとその行は読み込
    まれない
    • メモやコメントを残せる
    • コメントの後ろに#を連ねると
    目次代わりになる

    View full-size slide

  12. 11
    変数と代入
    代入演算子「<-」「=」を使って,
    変数にオブジェクトを代入することができる
    x<-3+5
    y<-9
    z = x+y
    z
    オブジェクト
    変数
    (イメージ)
    オブジェクト:データそのもの
    変数:オブジェクトを保管する箱
    代入:オブジェクトを
    箱に保管すること
    本スライドでは・・・
    • コードを灰色四角に表示
    • 代入演算子は「=」を使用
    スペースは無視して
    読み込まれる

    View full-size slide

  13. 12
    関数
    何らかのインプットに対して処理を加え
    アウトプットを返すもの
    アウトプット
    インプット 処理
    関数

    4 処理
    sqrt
    sqrt(4)
    平方根を返す関数「sqrt」

    View full-size slide

  14. 13
    Rによる分析の流れ
    ファイルの
    読み込み
    コードの
    入力
    分析の実行
    分析に使うエクセルファイルを読み込む
    コード(スクリプト)を書いて,
    Rにやってほしいことを命令
    出力を読み取る

    View full-size slide

  15. 14
    今回使用するデータ
    ⚫ 「data1.xlsx」:教育測定に関する架空データ
     ID:通し番号(1~250)
     school:学校名(sakura/kita)
     grade:学年(5~6)
     class:クラス
     number:出席番号
     sex:性別(M男、F女)
     kokugo1~3:国語のテスト結果
     sansu1~3:算数のテスト結果
     rika1~3:理科のテストの結果
     CT1~7:批判的思考質問紙
    Rは変数名を英語にした方が
    エラーが出にくい
    まずはデータを眺めて構造を
    理解しよう。

    View full-size slide

  16. 15
    データの読み込み1(csvから)
    #データの読み込み#####
    #ワーキングディレクトリの確認
    getwd()
    #読み込み方法1 csvから
    setwd(“C:/Users/***/**/practice2019")
    dat1=read.csv("data1.csv")
    ←コメントアウトの後ろに#連打で目次
    ←ワーキングディレクトリ
    :作業スペースの場所(アドレス)
    ←csvデータを事前に作成しておく
    ←ワーキングディレクトリの指定
    ←read.csv(”ファイル名”)で読込み
    dat1にデータセットを格納
    オブジェクト
    dat1
    (イメージ)
    ※csvカンマ区切りで保存を推奨
    ※マウス操作でも変えられる
    ※コンソールにもWDが表示されてる

    View full-size slide

  17. 16
    データの読み込み2(excelから)
    #読み込み方法2 xlsxから
    library(readxl)
    dat1=read_excel("data1.xlsx")
    View(dat1)
    ←下図を参考に、マウス操作でExcel
    ファイルから直接読み込み
    ←read_excel(”ファイル名”)で読込み
    ←dat1を表示してみる
    ※実行されたコードをエディタにも
    コピーしておく。
    こっちの方法の方が手早いし楽。
    一度コードをコピーしておけば
    次回からは、コードを実行する
    だけでOK.

    View full-size slide

  18. 17
    データハンドリング
    #データハンドリング#####
    #行列数
    dim(dat1)
    #先頭6行の表示
    head(dat1)
    head(dat1$rika1)
    ←目次
    ←コメントアウト
    ←dim(データ)で、行数・列数の表示
    ←head(データ)で、先頭6行を表示
    ←データ$変数名で、1つの変数を指定
    250行/22列(250人/22変数)
    正しく読み込めているか確認
    データセット
    変数

    View full-size slide

  19. 18
    変数の型の確認と変更
    #変数の型の確認と変更
    str(dat1)
    dat1$school=as.factor(dat1$school)
    dat1$grade=as.ordered(dat1$grade)
    dat1$sex=as.factor(dat1$sex)
    • int:整数型(integer)であることを示す
    • num:実数型(numeric)であることを示す。小数点を含むもの。
    • Factor:順序なし因子型であることを示す。例)性別
    • Order:順序あり因子型であることを示す。例)学年
    • chr:文字型(character)であることを示す。
    ←str(データ)で構造を確認
    ←データセット$変数名で特定の変数
    を指定。as.factor(変数)で、変数
    を因子型にする。
    サジェスト機能を活用しよう
    変数の型

    Enter
    選択

    View full-size slide

  20. 記述統計学と視覚化
    基礎統計量、ヒストグラム、箱ひげ図、散布図
    19

    View full-size slide

  21. 20
    記述統計学と推測統計学
    ⚫ 記述統計(descriptive statistics):
    得られたデータの特徴や性質を説明・要約する
    ①数値要約:平均値や標準偏差などの代表値
    ②図的要約:ヒストグラム・箱ひげ図・散布図など
    ⚫ 推測統計(inferential statistics):
    得られたデータから,手元にないデータを含めた全データの
    一般的な性質について推測する

    View full-size slide

  22. 21
    尺度水準と計算
    尺度水準 説明 可能な演算 例
    量的変数
    比率尺度
    0が原点であり、間
    隔と比率に意味が
    あるもの
    +-×÷
    重さ、長さ、
    標高
    間隔尺度
    目盛が等間隔に
    なっているもので、
    その間隔に意味が
    あるもの
    +- 気温、西暦
    質的変数
    順序尺度
    順序や大小には意
    味があるが間隔に
    は意味がないもの
    >= 順位
    名義尺度
    他と区別し分類す
    るための記号
    度数カウント
    血液型、郵便
    番号、住所
    名義 順序 間隔 比率
    平均値 ☓ ☓ ◯ ◯
    中央値 ☓ ◯ ◯ ◯
    最頻値 ◯ ◯ ◯ ◯
    尺度水準によって使える分析や指標が
    異なる。

    View full-size slide

  23. 22
    練習問題
    ⚫ 次のデータの尺度水準を答えなさい。
    A) 人間の性別
    B) 身長・体重
    C) 気温(摂氏)
    D) 絶対温度(K)
    E) 成績の順位
    F) 血液型
    G) アンケートで聞いたやる気度(5段階)※
    H) 偏差値
    ⚫ テストの項目として問題があるのは?

    View full-size slide

  24. 23
    代表値の種類
    ◼ 代表値:データの分布の中心的な位置を表す指標値
    ⚫ 平均値(mean)
    ⚫ 中央値(median)
    データを小さい順に並べた時に中央に位置する値。
    データが偶数個の場合は中央の2つの平均を算出。
    ⚫ 最頻値(mode)
    度数の最も多い階級に対する値

    View full-size slide

  25. 24
    散布度の指標
    ◼ 散布度:データのばらつきの度合を表す指標値
    ⚫ 偏差(diviation)
    𝑑𝑖
    = 𝑥𝑖
    − ҧ
    𝑥
    ⚫ 分散(variance)
    𝑠2 =
    1
    𝑛

    𝑖=1
    𝑛
    𝑥𝑖
    − ҧ
    𝑥 2
    ⚫ 標準偏差(standard deviation)
    𝑠 = 𝑠2 =
    1
    𝑛

    𝑖=1
    𝑛
    𝑥𝑖
    − ҧ
    𝑥 2

    View full-size slide

  26. 25
    基礎集計
    #基礎集計#####
    #代表値と散布度
    mean(dat1$rika1) #相加平均
    median(dat1$rika1 ) #中央値
    table(dat1$CT1) #最頻値
    var(dat1$rika1) #不偏分散
    sd(dat1$rika1) #標準偏差
    標準偏差の2乗が分散の値と一致すること
    を確認してみよう

    View full-size slide

  27. 26
    要約
    #要約
    summary(dat1)
    install.packages("psych")
    library(psych)
    describe(dat1)
    ←summary(データ)で、四分位数を表示
    ←psychパッケージをインストール(初回のみ)
    ←psychパッケージを読み込み
    ←describe(データ)で、基礎集計の表示
    追加のパッケージをインストール&読み込むことで、
    様々な分析が可能になる。
    [最小値、第一四分位、中央値、平均、第三四分位、最大値]
    [変数番号、サンプルサイズ、平均、標準偏差、中央値、トリ
    ム平均、中央絶対偏差、最小、最大、レンジ、歪度、尖度、
    標準誤差]

    View full-size slide

  28. 27
    新しい変数の作成
    #新しい変数の作成
    dat1$kokugo_all=apply(dat1[,7:9],1,mean)
    dat1$sansu_all=apply(dat1[,10:12],1,mean)
    dat1$rika_all=apply(dat1[,13:15],1,mean)
    ←国語平均の作成。
    ←算数平均の作成。
    ←理科平均の作成。
    ※0なら列, 1なら行に対して処理。
    新しい変数名=関数による処理
    代入
    新しい変数が増えている

    View full-size slide

  29. 28
    欠損値の除去
    #欠損値除去
    dat1=na.omit(dat1) ←リストワイズ除去(欠損値がある行を1行丸々除去する)
    1. 完全にランダムに欠損→Missing Completely At Random(MCAR)
    2. 観測データに依存する欠損→Missing At Random(MAR)
    3. 欠損データに依存する欠損→Missing Not At Random(MNAR)
    ⚫ 欠損値の種類と対応
    • MCARの場合、ペアワイズ削除(その分析に使う場合のみ除去)でもリストワイ
    ズ削除でもOK
    • MARの場合、完全情報最尤法による推定や、多重代入法による欠損値代入を行う
    • MNARの場合、お手上げ状態
    ※ペアワイズ削除は、多くの関数でデフォルト設定になっている。

    View full-size slide

  30. 29
    視覚化1
    #視覚化#####
    #ヒストグラム
    hist(dat1$rika_all)
    library(lattice)
    histogram(~rika_all | grade+sex, data=dat1)
    ←1変数のヒストグラム
    ←パッケージの読み込み
    ←理科成績を学年と性別ご
    とにヒストグラム化
    何が読み取れる?

    View full-size slide

  31. 30
    視覚化2
    #箱ひげ図
    boxplot(dat1$rika_all,horizontal = T)
    boxplot(rika_all~sex, data = dat1,horizontal = T)
    ←TRUE=横書き, FALSE=縦書き
    ←性別ごとに箱ひげ図をプロット
    • 画像として保存
    • Metafile形式なら、パワポ
    上で細かくいじれる
    f m
    50 60 70 80 90
    rika_all
    sex
    ↓Metafile形式で出力して色を付けた例
    最小値 中央値
    第一四分位/第三四分位
    最大値

    View full-size slide

  32. 31
    視覚化3
    #散布図
    plot(dat1$sansu_all, dat1$rika_all)
    plot(dat1$sansu_all, dat1$rika_all,pch=21,bg=c("blue","red")[unclass(dat1$sex)])
    plot(dat1$sansu_all, dat1$rika_all,pch=as.numeric(dat1$sex), cex=1.5)
    ↑ plot(x軸の変数, y軸の変数)
    ★引数の参考
    http://cse.naro.affrc.go.jp/takezawa/r-
    tips/r/53.html

    View full-size slide

  33. 32
    ハイレベルな視覚化
    #ペアプロット
    library(GGally)
    dat_ksr=dat1[,c("school","grade","sex","kokugo_all","sansu_all","rika_all")]
    dat_ksr=subset(dat1,select=c("school", "grade", "sex", "kokugo_all", "sansu_all",
    "rika_all"))
    colnames(dat_ksr)=c(“学校”,“学年”,“性別”,“国語”,“算数”,“理科”) #日本語化
    ggpairs(dat_ksr, aes_string(colour="学校", alpha=0.5)) #学校ごとに色分け
    ggpairs(dat_ksr, aes_string(colour="学年", alpha=0.5)) #学年ごとに色分け
    ggpairs(dat_ksr, aes_string(colour="性別", alpha=0.5)) #性別ごとに色分け
    同じ
    • 対角行列はその変数の分布
    • 三角行列は変数間の関連
    • 縦と横の変数の重なりを見る

    View full-size slide

  34. 33
    課題
    ⚫ データを視覚化し、どのような傾向がありそうか
    についてディスカッションしましょう。データの
    傾向について見通しを持つことは、その後の分析
    方針を立てる上で役に立ちます。

    View full-size slide

  35. 確率分布
    正規分布を知る

    View full-size slide

  36. 35
    確率変数と確率分布
    ⚫ 確率変数
    取る値の範囲と取る確率だけがわかっている変数
    ➢ 連続確率変数: 例)身長
    ➢ 離散確率変数: 例)コインの表裏
    ⚫ 確率分布
    確率変数がとる値とその値をとる確率の対応の様子
    コインの出る目の確率分布
    コインの表裏 表(=1) 裏(=0)
    確率 0.5 0.5

    View full-size slide

  37. 36
    確率分布の種類
    確率分布
    離散型
    一様分布
    二項分布
    ポアソン分布
    正規分布
    z 分布(標準正規分布)
    t 分布
    χ2分布
    F 分布
    連続型
    χ2分布
    (標準)正規分布 t分布
    F分布
    二項分布 ポアソン分布
    一様分布

    View full-size slide

  38. 37
    正規分布と確率
    ⚫ 正規分布の確率密度関数
    μは平均値(期待値)であり、σ²は分散、xはデータの値
    𝑓(𝑥) =
    1
    2𝜋𝜎2
    𝑒−
    𝑥−𝜇 2
    2𝜎2
    面積が確率を表している。
    区分求積法で計算する。
    68.27%
    95.45%
    μ σ 2σ

    -2σ
    ↑こんな形
    確率分布を決定する統計量を母数(parameter)
    と言う。正規分布の母数は、平均μと分散σ²

    View full-size slide

  39. 38
    正規分布の例
    ⚫ 日本人17歳男性の身長分布
    𝑓(𝑥) =
    1
    2𝜋 ∗ 33
    𝑒−
    𝑥−170 2
    2∗33
    日本の成人男性の
    身長(確率変数)
    170cm 190cm
    150cm
    存在する確率
    (確率密度)
    極端に長身や低身の人は滅多にいない

    View full-size slide

  40. 39
    標準正規分布
    ⚫ 標準正規分布の確率密度関数
    μ=0,σ2=1 であるような正規分布を標準正規分布と呼ぶ。
    𝑓(𝑥) =
    1
    2𝜋
    𝑒𝑥𝑝 −
    𝑥2
    2
    68.27%
    95.45%
    0 1 2
    -1
    -2
    x 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
    0.0 0.500 0.496 0.492 0.488 0.484 0.480 0.476 0.472 0.468 0.464
    0.1 0.460 0.456 0.452 0.448 0.444 0.440 0.436 0.433 0.429 0.425
    0.2 0.421 0.417 0.413 0.409 0.405 0.401 0.397 0.394 0.390 0.386
    0.3 0.382 0.378 0.374 0.371 0.367 0.363 0.359 0.356 0.352 0.348
    0.4 0.345 0.341 0.337 0.334 0.330 0.326 0.323 0.319 0.316 0.312
    0.5 0.309 0.305 0.302 0.298 0.295 0.291 0.288 0.284 0.281 0.278
    0.6 0.274 0.271 0.268 0.264 0.261 0.258 0.255 0.251 0.248 0.245
    0.7 0.242 0.239 0.236 0.233 0.230 0.227 0.224 0.221 0.218 0.215
    0.8 0.212 0.209 0.206 0.203 0.200 0.198 0.195 0.192 0.189 0.187
    0.9 0.184 0.181 0.179 0.176 0.174 0.171 0.169 0.166 0.164 0.161
    1.0 0.159 0.156 0.154 0.152 0.149 0.147 0.145 0.142 0.140 0.138
    1.1 0.136 0.133 0.131 0.129 0.127 0.125 0.123 0.121 0.119 0.117
    1.2 0.115 0.113 0.111 0.109 0.107 0.106 0.104 0.102 0.100 0.099
    1.3 0.097 0.095 0.093 0.092 0.090 0.089 0.087 0.085 0.084 0.082
    1.4 0.081 0.079 0.078 0.076 0.075 0.074 0.072 0.071 0.069 0.068
    1.5 0.067 0.066 0.064 0.063 0.062 0.061 0.059 0.058 0.057 0.056
    表 標準正規分布表(上側確率)
    #正規分布の上側確率
    pnorm(1.00, mean=0, sd=1,
    lower.tail = FALSE)

    View full-size slide

  41. 40
    標準化とz得点
    ⚫ 標準化
    データを平均0、標準偏差(分散)1に変換する作業。
    𝑧 =
    𝑥𝑖
    − 𝜇𝑥
    𝜎𝑥
    • どんな正規分布に従う確率変数でも、標準化すれば標準正
    規分布で表せて便利
    • 変換した後の得点をz得点(標準得点)と呼ぶ。

    View full-size slide

  42. 41
    Rで正規分布を描画してみよう
    #確率分布の描画
    curve(dnorm(x, 0, 1), -5, 5)
    curve(dnorm(x, 50, 10), 0, 100)
    curve (関数の式, 横軸の最小値, 横軸の最大値)
    ←標準正規分布
    ←平均50、標準偏差10の正規分布
    ↑この分布、どこかで見たような…

    View full-size slide

  43. 42
    偏差値
    ⚫ 偏差値
    偏差値 = 50 + 10 ∗ 𝑧得点
    • 平均50、標準偏差10になるように変換
    • 受験者全体の分布の中でどれだけ高いかを反映している
    ⚫ 知能指数(IQ)
    IQ = 100 + 15 ∗ 𝑧得点
    • 平均100、標準偏差15になるように変換
    ※ただし、いくつかのバージョンがあるのと、フリン効果で分布が変化しつつある

    View full-size slide

  44. 43
    練習問題
    ① 偏差値が平均50, 標準偏差10の正規分布に従う場合、
    偏差値60以上は全体の何%であるか。
    ヒント1:偏差値=z得点×10+50
    ヒント2:z得点は標準正規分布に従う
    ③ あなたの理科の試験の得点は80点でした。クラス全体が
    平均60点、標準偏差10点の正規分布に従う場合、あな
    たの得点の標準化した値と偏差値を求めなさい。
    ② IQが平均100, 標準偏差15の正規分布に従う場合、
    IQ130以上は全体の何%であるか。Rで計算せよ。
    pnorm(130, mean=100, sd=15, lower.tail = FALSE)

    View full-size slide

  45. 44
    復習問題
    1. 4つの尺度水準とその具体例を答えよ
    2. 代表値と散布度の指標を2つずつ答えよ
    3. (標本)分散の計算式を答えよ
    4. 標準正規分布の特徴を説明せよ
    5. 標準化とはどのような作業か説明せよ

    View full-size slide

  46. 推測統計学の基礎
    標本分布、標準誤差、中心極限定理

    View full-size slide

  47. 46
    記述統計学と推測統計学
    母集団
    記述統計学・・・サンプルの性質の要約
    推測統計学
    ”標本統計量の値をもとに,
    母数についてできるだけ正確な推測
    をする”
    サンプル
    (標本)
    サンプリング
    ⚫ 記述統計学と推測統計学
    目の前のサンプルに関する
    ことしか言えない

    View full-size slide

  48. 47
    標本統計量と標本誤差
    母集団
    サンプル
    (標本)
    μ
    m 標本統計量(sample statistic)
    母数(parameter)
    標本平均
    母平均
    サンプリング













    標本誤差
    平均や分散
    標本データから母数を推定する場合は必ず
    誤差(標本誤差)が生じる

    View full-size slide

  49. 48
    標本平均と標本分布
    母集団
    (テントウムシの体長)
    標本
    (n=2)
    母平均1.0cm
    (実際は未知)
    標本平均0.9cm
    (実際に観測できる)
    標本平均1.1cm
    標本平均1.3cm
    標本平均○.○cm









    何度でも
    抽出できる
    標本平均の標本分布
    1.0
    繰り返しサンプリングする状況
    を考えてみよう。複数得られた
    統計量の分布をその統計量の
    標本分布という。

    View full-size slide

  50. 49
    標本平均のばらつき(標準誤差)
    母集団
    (テントウムシの体長)
    母平均1cm
    (実際は未知)
    標本平均0.9cm
    標本平均1.1cm
    標本平均0.5cm
    何度でも
    抽出できる
    nの数によって・・・
    標本平均2.5cm
    nが大きいと、
    標本平均のバラツキ
    は小さい
    nが小さいと、
    標本平均のバラツキ
    は大きい
    標本分布の標準偏差を標準誤差と呼ぶ
    nが大きいほど標準誤差は小さくなる
    Standard Error

    View full-size slide

  51. 50
    サンプルサイズと標準誤差
    μ
    母集団の最小値
    (最小個体)
    母集団の最大値
    (最大個体)
    母集団の個体の分布
    標本平均の分布(n=5)
    標本平均の分布(n=10)
    標本平均の分布
    (n=全数N,母平均)
    母標準偏差σ
    母標準誤差σ/√5
    母標準誤差σ/√10
    x
    ➢ 母標準誤差(SE) 𝜎 ҧ
    𝑥
    =
    𝜎𝑥
    𝑛
    ➢ 標本標準誤差(se) 𝑆 ҧ
    𝑥
    =
    𝑆𝑥
    𝑛
    nが大きいほど標準誤差は小さく
    なる→精度良く母集団の平均値
    の推定ができる

    View full-size slide

  52. 51
    大数の法則と中心極限定理
    標本平均の分布(n=1)
    標本平均の分布(n=5)
    標本平均の分布(n=10)
    標本平均の分布
    (n=全数N,母平均)
    x
    • より大きいサイズの標本から標本平均を求めると、
    真の平均に近づく(大数の法則)
    nが大きいほど標準誤差は小さく
    なる→精度良く母集団の平均値
    の推定ができる
    • 標本の大きさnが大きくなると、抽出元の母集団が正規分布でない
    場合も、標本平均は正規分布に従う(中心極限定理)

    View full-size slide

  53. 52
    標本平均の不偏性
    μ
    ⚫ 標本平均
    ⚫ 母平均
    ⚫ 不偏平均(標本から母平均を推定)
    不偏性を持つ(不偏推定量)
    ҧ
    𝑥 =
    1
    𝑛

    𝑖=1
    𝑛
    𝑥𝑖
    𝜇 =
    1
    𝑛

    𝑖=1
    𝑛
    𝑥𝑖
    Ƹ
    𝜇 =
    1
    𝑛

    𝑖=1
    𝑛
    𝑥𝑖
    𝐸 Ƹ
    𝜇 = 𝜇

    View full-size slide

  54. 53
    不偏分散
    ⚫ 標本分散
    𝑠2 =
    1
    𝑛

    𝑖=1
    𝑛
    𝑥𝑖
    − ҧ
    𝑥 2
    ⚫ 母分散
    𝜎2 =
    1
    𝑛

    𝑖=1
    𝑛
    𝑥𝑖
    − 𝜇 2
    ⚫ 不偏分散(標本から母分散を推定)

    𝜎2 =
    1
    𝑛 − 1

    𝑖=1
    𝑛
    𝑥𝑖
    − ҧ
    𝑥 2

    View full-size slide

  55. 54
    練習問題
    1. 標本分布とは何か説明せよ
    2. 標準偏差(sd)と標準誤差(se)の違いについて述べよ
    3. n=100で20代男性のBMIを調べた結果、
    平均22.7、標準偏差4.0であった。この場合の標本平均の
    標準誤差を算出せよ。
    4. 標準誤差を半分にするには、サンプルサイズを何倍にすれ
    ばよいだろうか。(ヒント:標準誤差の計算式の分母に注目)
    5. 前回のRコードをもう一度実行し、“要約”の部分で標準誤
    差(se)が表示されていたことを確認しよう。

    View full-size slide

  56. 区間推定
    95%信頼区間

    View full-size slide

  57. 56
    点推定と区間推定
    ⚫ 点推定
    母数の推定値を1つの値で示す(ex. 母平均の推定値は8.3cm)
    ⚫ 区間推定
    誤差を考慮して、母数の推定値を区間で示す
    (ex. 95%の確率で7.8~8.8cmの間に入る)
    68.27%
    95.45%
    μ σ 2σ

    -2σ
    95%
    平均 +1.96se
    -1.96se
    正規分布 標本分布
    (正規分布)
    上限値
    (upper)
    下限値
    (lower)

    View full-size slide

  58. 57
    95%信頼区間
    ⚫ 95%信頼区間
    サンプリングと95%信頼区間の推定を繰り返せば、95%の
    確率で母平均(真の値)が含まれる区間。
    母平均(真の値)

    95%信頼区間
    失敗

    View full-size slide

  59. 58
    平均値の区間推定
    • ある牛丼屋の店長は、ランダムに100回の調査を行った。
    • 結果、牛肉の重さの平均53g、不偏分散81gであった。
    • 平均値の95%信頼区間を求めよ。
    #95%信頼区間#####
    mu_lower=53-1.96*sqrt(81/100)
    mu_lower
    mu_upper=53+1.96*sqrt(81/100)
    mu_upper

    View full-size slide

  60. 帰無仮説検定の基礎
    決定論的アプローチ

    View full-size slide

  61. 60
    統計的仮説検定の考え方
    ⚫ 統計的仮説検定
    標本を使って、母集団に関する判断を下す手法。
    仮説を立てて、白黒決着をつけたいというお気持ち。
    ⚫ 手順
    ① 仮説の設定(ex. AとBには差がある)
    ② 仮説検定に用いる標本統計量の選択
    ③ 有意水準の設定
    ④ 実際のデータ(標本)から標本統計量を計算
    ⑤ 仮説の正誤の判断(→結論)
    ※ただし、仮説検定は常にギャンブルであることを忘れるな

    View full-size slide

  62. 61
    仮説の設定
    ⚫ 仮説の種類
    ◼ 帰無仮説(本来主張したいこととは反対の内容)
    • AクラスとBクラスの学力には差がない。
    ◼ 対立仮説(本来主張したい内容)
    • AクラスとBクラスの学力には差がある。
    ⚫ 帰無仮説の棄却
    帰無仮説の下では、実際に得られたデータはとても極端な
    値であり、そんな値が出るのは非常にまれな確率だとなれ
    ば、「帰無仮説が正しい」という前提を疑い、帰無仮説を
    棄却する。背理法的な考え方により、対立仮説を採択する。

    View full-size slide

  63. 62
    標本統計量の選択
    ⚫ 検定統計量
    ◼ 標本から計算される統計量を標本統計量と呼ぶ(復習)
    ◼ 仮説検定に用いられる標本統計量を検定統計量と呼ぶ
    ◼ 帰無仮説から離れるほど大きな値を示す指標である
    • t, Χ2, F など
    • データから計算する
    ⚫ 基本コンセプト
    ◼ 帰無仮説の下での標本分布(数理的に導かれる)をもとに、
    データから計算した検定統計量が得られるのは非常に
    まれな確率(有意水準以下)なのかを検討する。
    →慣例的に5%
    ※標本分布は母集団に対して同じ条件でサンプリングを
    繰り返すことを想定していたことに留意せよ

    View full-size slide

  64. 63
    有意水準の設定
    ⚫ リスクをコントロールせよ
    真実
    帰無仮説は正しい
    (差がない)
    帰無仮説は間違い
    (差がある)
    決定
    帰無仮説を棄却
    第1種の誤り
    確率はα(有意水準)
    5%
    正しい決定
    確率は1-β(検定力)
    棄却しない
    正しい決定
    確率は1-α
    95%
    第2種の誤り
    確率はβ
    • 検定力の目安は0.8
    • サンプルサイズを大きくすると、
    検定力は上がる
    • 差が大きいと検定力は上がる

    View full-size slide

  65. 64
    標本統計量(検定統計量)の計算
    ⚫ 基本コンセプト
    ◼ 帰無仮説の下での標本分布(数理的に導かれる)をも
    とに、データから計算した検定統計量が得られるのは
    非常にまれな確率(有意水準以下)なのかを検討する。
    例)学力の差
    ・ AクラスとBクラスの学力には差がない。(帰無仮説)
    ・帰無仮説から離れる=学力の差が大きいほど大きい値を取る検定
    統計量を計算(ex., z=2.33)
    ・標本分布をもとに、その
    検定統計量よりまれな値
    が得られる確率(p値)
    を計算
    →差がないとは言えない
    統計的に意味のある差=有意差がある
    2.5%
    2.5%
    p=0.01

    View full-size slide

  66. 65
    仮説の正誤の判断
    ⚫ 仮説検定
    ◼ p値が有意水準(ex., 5%)を下回った時、検定結果が
    有意であると判断し、帰無仮説を棄却する。
    ⚫ p値とは何であって何でないのか
    ○ 帰無仮説が真であるという仮定の下で、検定統計量が
    データから計算された値以上に甚だしい値となる確率
    × 帰無仮説が真である確率
    × 平均に差がないという仮説が正しい確率
    × 対立仮説が正しい確率は1-p値
    × 帰無仮説が真であるときに、誤って帰無仮説を棄却して
    しまう確率
    × とにかく5%を切ったら嬉しい値

    View full-size slide

  67. 66
    色々な検定統計量

    View full-size slide

  68. 67
    2つの平均値の差の検定
    ●問題
    • Aクラス(n=40)のテストは、平均60.0点、不偏分散20であった。
    • Bクラス(n=40)のテストは、平均58.0点、不偏分散20であった。
    • 2つのクラスの学力に差があるといえるだろうか?
    帰無仮説:μA
    -μB
    =0
    対立仮説: μA
    -μB
    >0
    𝑡 ҧ
    𝑥1− ҧ
    𝑥2
    =
    ҧ
    𝑥1
    − ҧ
    𝑥2
    𝜎2
    1
    𝑛1
    +
    1
    𝑛2
    =
    60 − 58
    20
    1
    40
    +
    1
    40
    = 2
    p=0.0455
    帰無仮説を棄却する
    →差がないとは言えない(差があると判断する)
    68.27%
    95.45%
    0 1 2
    -1
    -2

    View full-size slide

  69. 68
    有意差があればOKなのか?
    ⚫ 検定統計量の式から分かる通り、nが大きければ検定統計
    量も大きくなりやすい=p値が小さくなりやすい
    ⚫ nが大きいということは、自信をもって差を見出せるとい
    うこと
    ⚫ 差があるかどうかだけでなく、差の大きさについても検討
    する必要がある
    ⚫ 標準化した差の大きさを効果量と呼ぶ
    𝑑 =
    𝜇2
    − 𝜇1
    𝜎

    View full-size slide

  70. 2変量解析
    t検定、一元配置分散分析、相関分析、
    クロス集計、カイ二乗検定、残差分析
    69

    View full-size slide

  71. 70
    対応のないt検定1(2群の平均値差)
    #学年間比較
    tapply(dat1$rika_all, dat1$grade, mean) #学年ごとの平均値を見てみる
    t.test(rika_all~grade, data=dat1, var.equal=F) #F=Welchのt検定
    g5=dat1$rika_all[dat1$grade==“5”] #5年の抽出
    g6=dat1$rika_all[dat1$grade==“6”] #6年の抽出
    t.test(g6, g5, var.equal=F) #F=Welchのt検定
    library(effsize)
    cohen.d(g6,g5,hedges.correction = T) #効果量:T=heagesのg, F=cohenのd
    *効果量(Effect Size)
    差の大きさを表す指標。
    平均値の差が標準偏差の何個分に相当するかを計算。
    測定単位が変わっても比較できる。
    様々な種類があるが、代表的なのはCohenのd。
    Headgesのgは、 Cohenのdの補正版。
    同じことの別記法
    有意
    ⚫ 理科の点数に学年間で差はあるだろうか?

    View full-size slide

  72. 71
    対応のないt検定2(2群の平均値差)
    #性別間比較
    tapply(dat1$rika_all, dat1$sex, mean) #性別ごとの平均値
    t.test(rika_all~sex, data=dat1, var.equal=F) #F=Welchのt検定
    m=dat1$rika_all[dat1$sex=="m"] #第1群の指定
    f=dat1$rika_all[dat1$sex=="f"] #第2群の指定
    t.test(m, f, var.equal=F) #Welchのt検定
    library(effsize)
    cohen.d(m, f, hedges.correction = T) #効果量:True=heagesのg, False=cohenのd
    * Cohenの基準(dとgに適応できる)
    d=0.2 小さな効果
    d=0.5 中程度の効果
    d=0.8 大きな効果
    中程度の大きさの差
    有意
    ⚫ 理科の点数に男女間で差はあるだろうか?
    ※どんなに差が小さくても、サンプルサ
    イズが大きければ有意になってしまう。
    効果量も重要。
    同じことの別記法
    95%CI

    View full-size slide

  73. 72
    報告例(対応のないt検定)
    68 70 72 74 76 78
    学年
    理科点数l
    5 6
    n=125 n=125
    ◼ 男子(N=118)と女子(N=132)の理科の点数に差がある
    のかを明らかにするために、Welchのt検定を行った。そ
    の結果、男子(M=76.17, SD=6.88)と女子(M=70.36,
    SD=7.60)の点数には有意な差が見られた(t (247.96) =6.35,
    p < .001, g =0.80 (95%CI [0.54, 1.06]))。
    ◼ 第5学年と第6学年で、理科の点数に差があるのかについ
    て、独立な2群のt検定(Welch’s t-test)を実施したとこ
    ろ、0.1%水準で有意差が認められた(t (247.82)=8.743, p
    < .001, g =1.102 (95%CI [0.836, 1.369]))。

    View full-size slide

  74. 73
    対応のあるt検定(2群の平均値差)
    ##対応のあるt検定(プレ・ポスト)
    t.test(dat1$rika3,dat1$rika1,paired = T) #T=対応あり
    library(effsize)
    cohen.d(dat1$rika3, dat1$rika1, paired = T, hedges.correction = T)
    無視できる差
    有意でない
    ⚫ 理科の点数の1回目と3回目で差はあるだろうか?
    <報告例>
    ◼ 1回目と3回目のテストで児童(N=250)の点数に変化があるかを明
    らかにするために、対応のあるt検定を行った。その結果、1回目
    (M=72.87, SD=11.07)と3回目(M=73.50, SD=10.55)の点数には有意
    な差が見られなかった(t (249) =0.79, p =.433, g =0.06 (95%CI [-0.09,
    0.20]))。

    View full-size slide

  75. 74
    練習問題
    1. t検定を用いて、国語(kokugo_all)と算数(sansu_all)
    の性差を検討せよ
    2. 理科の性差は国語の何倍か概算せよ(ヒント:効果量に基づく
    比較)
    3. 桜小学校と北小学校では、どちらの学力が高いか検討せよ
    (※やり方は1つではないので、問題を自由に解釈してよい。)

    View full-size slide

  76. 75
    復習
    1. 標本分布の標準偏差を何と呼ぶでしょうか
    2. 95%信頼区間について説明せよ
    3. [正誤判定問題]
    ①有意水準αを5%に設定するということは、実際には帰無仮説が正
    しい(差がない)のに、誤って帰無仮説を棄却する確率を5%以下に
    抑えることを意味する。 判定: .
    ②p値とは、帰無仮説が正しい確率であり、低ければ低いほど良い指
    標である。 判定: .
    4. 2群の母平均の差について検討する際に使用する検定を答えよ
    5. 有意差の有無だけでなく、効果量も報告する必要があるのはなぜで
    しょうか?

    View full-size slide

  77. 76
    分散分析
    ⚫ 3群以上の平均値差を比べるにはどうしたらよいだろうか?
    1. t検定を繰り返す → αのインフレを補正
    2. 分散分析を使用する
    ◼ 分散分析
    𝐹 =
    群間変動の分散
    群内変動(誤差)の分散 群間全体で差があるか判断する
    1 − 1 − 𝛼 𝑛

    View full-size slide

  78. 77
    一元配置分散分析(対応なし)
    ##一元配置分散分析
    #学年*性別を組み合わせた変数を作成
    dat1$grade_sex=ifelse(dat1$grade=="5" & dat1$sex=="m", "5m",
    ifelse(dat1$grade=="5" & dat1$sex=="f", "5f",
    ifelse(dat1$grade=="6" & dat1$sex=="m", "6m",
    ifelse(dat1$grade=="6" & dat1$sex=="f", "6f", NA))))
    #1要因4水準の分散分析(対応なし)
    anova(lm(dat1$rika_all~dat1$grade_sex))
    ↑ ifelse(条件式,Trueの場合, Falseの場合)
    ⚫ 4水準の間に全体として差があるか?
    5年男子/5年女子/6年男子/6年女子
    F値が有意
    全体として差がある

    View full-size slide

  79. 78
    多重比較とp値の補正
    ⚫ ボンフェローニの補正法(Bonferroni)
    • 検定の回数分、p値を大きく補正する。
    • 例えば、t検定で得られたp値をp×3(検定の繰り返し数)
    と補正して,補正後のp値がp<0.05となれば有意差ありと
    判断
    ID class score
    1 A 11
    2 A 13
    3 B 12
    4 B 16
    5 C 9
    6 C 14
    ➢ 多群の比較の例 ➢ 多項目の比較の例
    ID Q1 Q2 Q3 Q4 Q5 Q6
    1 2 3 2 4 4 3
    2 6 5 2 5 4 1
    3 4 1 6 3 7 5
    4 4 5 3 7 7 5
    5 3 4 5 4 4 6
    6 6 3 5 1 2 3

    View full-size slide

  80. 79
    多重比較
    ⚫ どの水準間に差があるか?
    5年女子/5年男子/6年女子/6年男子
    #多重比較
    tapply(dat1$rika_all,dat1$grade_sex,mean) #性別*学年ごとの平均値
    sort(tapply(dat1$rika_all,dat1$grade_sex,mean)) #並べ替え
    pairwise.t.test(dat1$rika_all, dat1$grade_sex, p.adj = "bonf") #ボンフェローニ法
    ※検定を繰り返していることになるので、
    ボンフェローニ法などでp値を補正する。
    多重比較 5年女子 5年男子 6年女子
    5年男子 ***
    6年女子 *** p=0.63
    6年男子 *** *** **
    5年女子 5年男子 6年女子 6年男子
    Mean 67.21 72.38 74.38 79.06

    View full-size slide

  81. 80
    報告例(1元配置分散分析)
    ◼ 理科の点数を従属変数、性別と学年(5年男子・5年女子・6
    年男子・6年女子)を要因とする一元配置分散分析を行った
    結果、有意差が見られた(F(3, 246)=41.04, p < .001)。ボン
    フェローニ法による多重比較を行ったところ、6年女子と5
    年男子の間を除くすべての組み合わせで有意差が見られた
    (ps
    < 0.01)。
    ◼ 小学生を対象とした第1回(M=59.10, SD=7.80)、第2回
    (M=68.24, SD=8.52)、第3回(M=73.10, SD=7.81)の理科
    テストデータを用いて反復測定分散分析を行った。その際、
    Mauchlyの検定が有意となり(χ2(2)=39.69, p < 0.001)、球面
    性の仮定が満たされないことが示されたため、Greenhouse-
    Geisserのε =.87を用いて自由度の修正を行った。結果、平均
    値には有意な差が見られた( F(1.74, 249) = 290.41, p < .001,
    η2 =.34)。また、ホルム法による多重比較の結果、すべての
    テスト間で有意差が見られた( ps
    < 0.05)。

    View full-size slide

  82. 81
    相関係数の種類
    ピアソンの積率相関 連続量×連続量(間隔・比率) 線形
    ポリコリック相関 順序尺度×順序尺度 線形
    ポリシリアル相関 順序尺度×連続量 線形
    テトラコリック相関 2値×2値の順序尺度 線形
    スピアマンの順位相関 順序or連続量の相関 単調
    クラメールの連関 名義尺度×名義尺度 ー
    ピアソン = +1、スピアマン = +1
    ピアソン = +0.851、スピアマン = +1
    多変量正規分布
    | r | = 0.7~1.0 強い相関
    | r | = 0.4~0.7 中程度の相関
    | r | = 0.2~0.4 弱い相関
    | r | = 0~0.2 ほとんど相関なし
    ※疑似相関に注意
    例)アイスの売り上げと溺死者数
    線形〇
    単調〇
    線形×(非線形)
    単調〇

    View full-size slide

  83. 82
    ピアソンの積率相関係数
    ⚫ 共分散(Covariance)
    𝑟 =
    𝑠𝑥𝑦
    𝑠𝑥
    𝑠𝑦
    =
    1
    𝑛
    σ𝑖=1
    𝑛 (𝑥𝑖
    − ҧ
    𝑥)(𝑦𝑖
    − ത
    𝑦)
    1
    𝑛
    σ
    𝑖=1
    𝑛 (𝑥𝑖
    − ҧ
    𝑥)2
    1
    𝑛
    σ
    𝑖=1
    𝑛 (𝑦𝑖
    − ത
    𝑦)2
    Cov x, y = 𝑠𝑥𝑦
    =
    1
    𝑛

    𝑖=1
    𝑛
    (𝑥𝑖
    − ҧ
    𝑥)(𝑦𝑖
    − ത
    𝑦)
    x
    y
    ҧ
    𝑥

    𝑦
    𝑥𝑖
    − ҧ
    𝑥
    𝑦𝑖
    − ത
    𝑦
    +
    +


    ⚫ 相関(Correlation) =標準化した共分散
    帰無仮説は相関が無い( r=0 )として、検定をかける。
    有意であれば、相関があると判断。

    View full-size slide

  84. 83
    相関分析1
    #Pearsonの積率相関係数
    cor(dat1$rika1,dat1$rika2) #2変数の相関
    cor(dat_seiseki) #3教科の相関
    plot(dat_seiseki) #散布図
    library(psych)
    corr.test(dat_seiseki) #相関係数の検定
    ⚫ 変数間の関連の強さは?
    すべて有意
    *相関係数の目安
    | r | = 0.7~1.0 強い相関
    | r | = 0.4~0.7 中程度の相関
    | r | = 0.2~0.4 弱い相関
    | r | = 0~0.2 ほとんど相関なし

    View full-size slide

  85. 84
    相関分析2
    #カテゴリカル変数を含む相関
    library(polycor)
    hetcor(dat_ksr, ML=T) #カテゴリカル変数を含めた相関行列 ML=最尤法
    ⚫ 変数間の関連の強さは?
    ポリシリアル相関:順序×連続変数の相関がみられる

    View full-size slide

  86. 85
    クロス集計とカイ二乗検定
    賛成 反対 合計
    男子 a c n1
    女子 b d n2
    合計 m1 m2 N
    賛成 反対
    男子 a`=m1*n1/N c`=m2*n1/N
    女子 b`=m1*n2/N d`=m2*n2/N
    賛成 反対
    男子 A=(a-a`)^2/a` C=(c-c`)^2/c`
    女子 B=(b-b`)^2/b` A=(d-d`)^2/d`
    例 賛成 反対 合計
    男子 70 180 250
    女子 30 120 150
    合計 100 300 400
    例 賛成 反対
    男子 62.5 187.5
    女子 37.5 112.5










    𝜒2 = ෍
    (観測度数 − 期待度数)2
    期待度数
    = 𝐴 + 𝐵 + 𝐶 + 𝐷
    例 賛成 反対
    男子 0.9 0.3
    女子 1.5 0.5

    View full-size slide

  87. 86
    クロス集計
    cross=table(dat1$school,dat1$sex) #クロス集計表の作成
    cross
    prop.table(cross) #全度数を基準にした割合
    library(vcd)
    assocstats(cross) #連関係数 クラメールのV
    chi=chisq.test(cross) #カイ二乗検定(独立性の検定)
    chi
    chi$residuals #残差分析 絶対値1.96以上で有意
    ⚫ 学校と男女の人数には関係がある?
    (人) 女 男
    北小 70 55
    桜小 62 63
    X-squared = 0.786, df = 1, p-value = 0.3752
    有意に多い組み合わせはない
    有意でない
    :2変数に関連があるとは言えない
    ※ただし、2×2のクロス集計の場合は、
    正確確率検定を使用する。

    View full-size slide

  88. 線形モデルの拡張
    単回帰分析、重回帰分析、共分散分析

    View full-size slide

  89. 88
    線形モデルの種類
    分析名 従属変数 独立変数
    一般化線
    形モデル
    一般線形
    モデル
    単回帰分析
    量的データ
    (正規分布)
    量的データ(1つ)
    重回帰分析
    量的データ
    (正規分布)
    量的データ(複数)
    (t検定)
    量的データ
    (正規分布)
    質的データ
    (群=2)
    (分散分析)
    量的データ
    (正規分布)
    質的データ
    (群≧3)
    ロジスティック回帰分析
    質的データ
    (2値)
    何でもOK
    順序ロジスティック
    回帰分析
    質的データ
    (順序尺度)
    何でもOK
    多項ロジスティック
    回帰分析
    質的データ
    (名義尺度)
    何でもOK
    何でもOK 何でもOK

    View full-size slide

  90. 89
    単回帰分析の数式表現
    数学学力(x)
    物理点数(y)

    𝑦 = 𝑎 + 𝑏𝑥
    切片 回帰係数
    従属変数の
    予測値 独立変数
    回帰係数
    1単位

    𝑦 = −0.36 + 0.42𝑥
    𝑦 = 𝑎 + 𝑏𝑥 + 𝑒
    残差(誤差)
    残差
    回帰係数が大きいほど
    その変数の影響が強い
    従属変数
    ◆回帰係数の推定(最小二乗法)
    𝑄 = ෍
    𝑖=1
    𝑁
    𝑒2
    𝑖
    = ෍
    𝑖=1
    𝑁
    (𝑦𝑖
    − ො
    𝑦𝑖
    )2 = ෍
    𝑖=1
    𝑁
    𝑦𝑖
    − (𝑎 + 𝑏𝑥𝑖
    ) 2
    Qを最小化する
    aとbを求める

    View full-size slide

  91. 90
    単回帰分析
    #単回帰分析
    res1=lm(dat1$rika_all~dat1$sansu_all)
    summary(res1)
    ⚫ 理科の成績を算数の成績で説明(予測)する。
    有意
    係数が0を上回る
    切片
    係数
    決定係数
    35%説明できる

    View full-size slide

  92. 91
    重回帰分析の数式表現
    読解力
    数学力





    𝑦 = 𝑎 + 𝑏1
    𝑥1
    + ⋯
    +𝑏𝑝
    𝑥𝑝
    偏回帰係数
    偏回帰係数=他の独立変数の影響を取り除いたある独立変数の回帰係数
    (b)
    標準偏回帰係数=標準化した偏回帰係数。測定単位に依存しないので、
    (β) 比較が容易。
    標準化(すべての変数を平均0、分散1にそろえる)

    View full-size slide

  93. 92
    (標準)偏回帰係数の解釈
    ⚫ 偏回帰係数
    他の独立変数を一定(同程度)としたとき、
    𝑥𝑝
    が1単位増えればyが平均的に𝑏𝑝
    増える
    ⚫ 標準偏回帰係数
    他の独立変数を一定(同程度)としたとき、
    𝑥𝑝
    が1標準偏差増えればyが平均的に𝛽𝑝
    標準偏差増える
    年収=322.9+1.2*年齢+8.7*勤続年数という重回帰式か
    ら年収(万円)に対する年齢(歳)と勤続年数(年)
    の影響はどのように解釈できるでしょうか。
    年収=0.07*年齢+0.52*勤続年数という標準偏回帰係数
    を用いた重回帰式から年収(万円)に対する年齢
    (歳)と勤続年数(年)の影響はどのように解釈でき
    るでしょうか。また、年齢と勤続年数のどちらが大き
    な影響をもっているでしょうか。

    View full-size slide

  94. 93
    その他の指標
    ⚫ 決定係数(R2)
    観測値の散らばりに占める予測値の散らばりの割合
    0 ≤ 𝑅2 ≤ 1
    回帰モデルで従属変数の𝑅2 × 100%が説明できた
    ⚫ 多重共線性の指標(VIF)
    独立変数間の相関が強い→回帰係数の推定値の信頼性が低く
    なる=重回帰分析の使用が不適切
    𝑉𝐼𝐹 > 10 →多重共線性発生していると解釈

    View full-size slide

  95. 94
    #重回帰分析
    res2.1=lm(rika_all~sansu_all+kokugo_all,data = dat1)
    summary(res2.1) #偏回帰係数
    dat_z=scale(dat_seiseki) #標準化
    dat_z=data.frame(dat_z)
    res2.2=lm(rika_all~sansu_all+kokugo_all,data = dat_z)
    summary(res2.2) #標準偏回帰係数
    library(car)
    vif(res2.2) # VIF
    重回帰分析
    ⚫ 理科の成績を算数と国語の成績で説明(予測)する。
    有意
    VIF>10だと多重共線性に問題あり。
    VIF<2なら問題なし。
    ↑どうやって解釈する?

    View full-size slide

  96. 95
    一般線形モデル
    #一般線形モデル
    res3=lm(rika_all~sansu_all+grade+sex,data = dat1)
    summary(res3)
    ⚫ 理科の成績を算数の成績と学年・性別で説明(予測)する。
    有意
    決定係数も増加している

    View full-size slide

  97. 96
    共分散分析
    #共分散分析
    res4=lm(rika2~rika1+school,data = dat1)
    summary(res4)
    ⚫ 理科1回目を統制した場合、理科2回目の点数には実験群と統制群で差があるか
    有意でない
    1回目の点数を統制すると、2回目の点数は桜小学校
    の方が、平均0.716点高い(有意ではない)
    ※交互作用はない前提での分析
    実験群:桜小
    統制群:北小

    View full-size slide

  98. 97
    因果関係を示すためには?
    ⚫ ミルの三原則
    1. 原因は結果よりも時間的に先行していること
    2. 原因と結果の間には関連があること
    3. 他の因果的説明が排除されていること
    • 回帰分析やパス解析で示せるのは2.のみ。
    • 因果関係を示すためには、実験計画法や縦断調査が必要。

    View full-size slide

  99. 98
    練習問題
    1. t検定をそのまま繰り返してはいけないのはなぜか
    説明せよ
    2. 標準化した共分散を何と呼ぶだろうか
    3. 偏回帰係数と標準偏回帰係数の違いを説明せよ

    View full-size slide

  100. 99
    復習
    1. 3群の平均値の差を検討する際,分散分析が有意であった
    ことからどのようなことが言えるだろうか。
    2. ピアソンの積率相関係数が取り得る値の範囲を答えよ。
    3. 重回帰回帰分析において、独立変数間の影響の強さを比較
    したい場合、偏回帰係数と標準偏回帰係数のどちらを用い
    るべきか。

    View full-size slide

  101. 多変量解析
    探索的因子分析、確認的因子分析、
    構造方程式モデリング、クラスター分析
    100

    View full-size slide

  102. 101
    構成概念
    ⚫ 人に関する現象を説明するために、研究者によって人為的
    に構成された概念
    例)思いやり、社交性、理解度、科学的思考力、批判的思考態度
    ⚫ 構成概念の影響を受けるであろう複数の行動や態度を測定
    し、構成概念の存在を検証する
    マンガ
    好き
    行動1
    (読む)
    行動2
    (買う)
    行動3
    (話す)
    理論世界
    現実世界

    View full-size slide

  103. 102
    心理尺度の測定法
    ⚫ 言葉による質問によって行動や考え方を測るものを
    心理尺度と呼ぶ
    ◆ 様々な測定法がある
    ★リッカート法(評定総和法)
    Q1. このマンガについてよく知っている











































    ★サーストン法(等現間隔法)
    そのマンガについて知らないことはない
    そのマンガを週刊誌で毎週読んでいる
    そのマンガの単行本が出たら読む
    そのマンガを読もうと思ったことがある
    そのマンガの名前も聞いたことが無い
    5.12点
    4.05点
    3.24点
    1.93点
    1.13点
    ※最も近い項目を選ぶ
    ★ガットマン法(強度分析法)
    ★SD法(意味微分法)
    1 2 3 4 5

    View full-size slide

  104. 103
    構成概念妥当性 construct validity
    ⚫ 構成概念妥当性(=測りたいものを測れているか)
    1. 内容的な側面
    :項目内容が構成概念の定義と比べて適切か(網羅しているか)
    2. 本質的な側面
    :反応プロセスが想定通りか
    3. 構造的な側面
    :内的なまとまり(因子構造)が理論や仮説と一致しているか
    4. 一般化可能性の側面(信頼性)
    :測定誤差が小さいか(繰り返し同じ結果になるか)
    5. 外的な側面
    :外的変数との間に予測通りの関係(相関)が見られるか

    View full-size slide

  105. 104
    因子分析の基礎 (factor analysis)
    ⚫ 観測変数の背後にある因子(構成概念, 潜在変数)を探る
    ★探索的因子分析
    (exploratory factor analysis: EFA)
    ★確認的因子分析
    (confirmatory factor analysis: CFA)
    親しみやすい
    人懐っこい
    有能な
    知的な
    温かさ
    因子
    有能さ
    因子
    理科
    数学
    国語
    社会
    理系
    因子
    文系
    因子
    観測変数1 = 𝑎1 ∗ 𝐹1 + 𝑏1 ∗ 𝐹2+誤差e1
    𝑎1
    𝑎2
    𝑎3 𝑎4
    𝑏1
    𝑏2
    𝑏3
    𝑏4
    𝐹1
    𝐹2

    第1因子の影響 第2因子の影響

    View full-size slide

  106. 105
    因子負荷量
    ⚫ 因子負荷量:因子から観測変数への影響力の強さ
    ⚫ 共通性:因子によって説明される要素
    ⚫ 独自性:各項目が持つ独自の要素(因子によって説明されない
    部分)
    因子
    共通性 独自性
    共通性 独自性
    共 独自性
    共通性 独
    ◼ 因子分析の結果の例(1因子・2因子)
    項目 因子負荷量 共通性
    物理が好き .90 .80
    化学が好き .82 .66
    生物が好き 74 .53
    地学が好き .68 .48
    項目 F1 F2 共通性
    親しみやすい .68 .29 .55
    人懐っこい .79 .15 .65
    有能な .20 .81 .69
    知的な .22 .88 .82

    View full-size slide

  107. 106
    因子軸の回転
    ⚫ 特別な処理をせずに求めた因子負荷量を初期解と呼ぶ
    ⚫ 初期解の解釈が難しい場合、因子軸を回転させる(因子負荷
    量を変換する)ことで因子が識別しやすくなる(※2因子以上の
    時)
    ★斜交回転
    例)プロマックス回転
    ★直行回転
    例)バリマックス回転
    因子1 因子1
    因子2
    項目 F1 F2 共
    親しみやすい .70 -.24 .55
    人懐っこい .69 -.41 .65
    有能な .68 .47 .69
    知的な .75 .51 .82
    項目 F1 F2 共
    親しみやすい .68 .29 .55
    人懐っこい .79 .15 .65
    有能な .20 .81 .69
    知的な .22 .88 .82
    ◼ 回転前(初期解)
    ◼ 回転後

    View full-size slide

  108. 107
    探索的因子分析の手順
    1. 因子数のあたりをつける
    ➢ 平行分析、ガットマン基準、スクリーテスト
    2. 候補の因子数で因子分析を行う
    3. 複数因子で初期解の解釈が難しい場合は、回転を行う
    4. 因子負荷量が低い項目(0.4以下)などは外し、再度、因
    子分析を繰り返す
    5. 信頼性係数を確認する
    6. 因子構造を解釈し、因子名を付ける

    View full-size slide

  109. 108
    探索的因子分析1
    #探索的因子分析#####
    #データの取り出し
    dat_CT=dat1[,c(16:22)] #16~22列目の取り出し
    ⚫ 批判的思考:何を信じ、何を行うかの決定に焦点を当てた、合理的で
    省察的な思考(Ennis, 1987)。
    ←Q1~Q7(7件法)
    1 いつも偏りのない判断をしようとする
    2 物事を決めるときには、客観的な態度を心がける
    3 できるだけ多くの立場から考えようとする
    4 自分が偏った見方をしていないかふり返るように
    している
    5 たとえ意見が合わない人の話にも耳を傾ける
    6 自分のと異なる考えの人とも議論する
    7 物事を見るときは様々な立場から見る

    View full-size slide

  110. 109
    探索的因子分析2
    #平行分析
    fa.parallel(dat_CT)
    ⚫ 何因子構造だろう? →平行分析/ガットマン基準/スクリーテスト
    1因子構造を示唆
    1~2の間で線が重なっている→1因子構造
    △がFA(Factor Analysis)

    View full-size slide

  111. 110
    探索的因子分析3
    #スクリープロット
    cor=cor(dat_CT)
    eigen=eigen(cor)$values #固有値
    eigen
    plot(eigen, type="b", main="Scree Plot",xlab="Number",
    ylab="Eigenvalue")
    ⚫ ガットマン基準:値が1.0以上の固有値の数を因子数とする
    ⚫ スクリーテスト:固有値の推移がなだらかになる直前までの固有値の数を因子
    数とする
    2からなだらかになっているので、因子数は1
    1因子構造を示唆
    1因子を最有力候補として
    探索的因子分析を進める。

    View full-size slide

  112. 111
    探索的因子分析4
    #因子数1の検討
    fit1 = factanal(x=dat_CT, factors=1, fm="ml", rotation="none")
    print(fit1)
    fit2 = factanal(x=dat_CT, factors=1, fm="ml", rotation="promax")
    print(fit2, cutoff=0.35) #因子負荷量0.35以下を非表示
    ⚫ 因子数1として因子負荷を推定
    1因子の場合、回転は不要。
    因子間に相関が仮定される場合
    プロマックス回転(斜交回転)。
    推定方法は最尤法がおすすめ。
    ←最尤法、プロ
    マックス回転
    ←因子負荷量(0.4以上ならOK)
    本来はこの後、因子名を考えるなどの作業がある。

    View full-size slide

  113. 112
    探索的因子分析5
    #信頼性係数の算出(アルファとオメガ)
    psych::alpha(dat_CT)#α係数
    omega(nfactors = 1,dat_CT) #ω係数
    ⚫ 信頼性の確認
    ω係数の方がより正確な信頼性の推
    定値。ただし、現実にはα係数とほぼ
    同じ値になる。両方を報告することを
    推奨。
    0.8以上であれば信頼性が高い
    ←α係数
    ←ω係数
    #2因子の場合
    psych::alpha(dat_因子1)#α係数1
    psych::alpha(dat_因子2)#α係数2
    omega(nfactors = 1,dat_因子1) #ω係数1
    omega(nfactors = 1,dat_因子2) #ω係数2
    信頼性係数は、因子ごとに計算する。

    View full-size slide

  114. 113
    尺度得点との相関
    #相関の検討
    dat1$CT=rowMeans(dat1[,c(16:22)]) #指定行の平均値を変数として作成
    cor(dat1$rika_all,dat1$CT) #理科とクリシンの相関
    cor(dat1$sansu_all,dat1$CT) #算数とクリシンの相関
    cor(dat1$kokugo_all,dat1$CT) #国語とクリシンの相関
    ⚫ クリシン得点の変数を作成し、成績との相関を見てみよう
    ←算数と理科では弱い相関がみられる
    *相関係数の目安
    | r | = 0.7~1.0 強い相関
    | r | = 0.4~0.7 中程度の相関
    | r | = 0.2~0.4 弱い相関
    | r | = 0~0.2 ほとんど相関なし

    View full-size slide

  115. 114
    報告例(探索的因子分析)
    項 目
    因 子
    F1 F2
    (18) 深く考えなければならないような状況は避けようとする。 .84 -.04
    (15) 考えなければならない時しか考えない方である。 .78 -.03
    (16)
    深く考えなければ切り抜けられないような事態に対処することは任
    されたくない。 .73 .02
    (14) 長時間一生懸命考えることは苦手な方である。 .69 .03
    (4) 読んだものがよく理解できないとき、それを放り出し忘れてしまう。 .53 .13
    (21) 常に頭を使わなければ満足できない。 .48 -.05
    (17) 考えることは楽しくない。 .05 .73
    (7) 新しい考え方を学ぶことにはあまり興味がない。 -.10 .71
    (1) いろいろな問題の新しい解決方法を考えることは楽しい。 -.02 .62
    (24)
    問題の答えがなぜそうなるのかを理解するよりも、単純に答えだけ
    を知っている方がよい。 -.08 .57
    (8)
    なぜそうなるのかを理解しようとするよりも、物事をあるがままに
    受け取るほうが好きだ。 .06 .51
    (19) 自分が人生で何をすべきかについて考えるのは好きではない。 .06 .51
    負荷量の平方和 2.87 2.29
    Cronbachのα係数 .84 .76
    McDonaldのω係数 .88 .82
    因子間相関
    F2 .46
    表に基づき各因子を検討すると、第1因子は、「深く考えなければならないような状況は避けようとす
    る」、「考えなければならない時しか考えない方である」、「長時間一生懸命考えることは苦手な方であ
    る」など、じっくりと考えることを楽しむ思考傾向に関する質問項目で構成されているため、第1因子を
    「熟慮動機」と解釈した。第2因子は、「考えることは楽しくない」、「新しい考え方を学ぶことにはあ
    まり興味がない」、「いろいろな問題の新しい解決方法を考えることは楽しい」など、考えることを楽し
    む思考傾向に関する質問項目で構成されているため、第2因子を「思考を楽しむ動機」と解釈した。
    次に、各因子の信頼性について検討する。表に示すCronbachのα係数およびMcDonaldのω係数が0.76 ~
    0.88となったことから、内部一貫性が保障されたと考え、十分な信頼性があると判断した。
    固有値の減衰状況および平行分析の結果を踏まえ、因子数を2として探索的因子分析(最尤法・プロ
    マックス回転)を行った結果を表にしめす。

    View full-size slide

  116. 115
    階層的クラスター分析の基礎
    ⚫ 似た項目ではなく似た人をいくつかのクラスター分類する

    View full-size slide

  117. 116
    クラスター分析1
    #クラスター分析の実行
    z=scale(dat_seiseki) #得点を標準化
    z=data.frame(z) #データフレーム形式に戻す
    distance=dist(z)^2 #距離の計算
    res=hclust(distance,method = “ward.D”) #ward法
    plot(res) #デンドログラム作図
    cluster=cutree(res, k=4) # K=でいくつのクラスターに分けるか指定
    cluster=as.factor(cluster) # 因子型に変更
    table(cluster) # それぞれのクラスターの人数確認
    ⚫ 被験者にはどんな特徴を持つグループが存在するのか
    それぞれのクラスターの人数

    View full-size slide

  118. 117
    クラスター分析2
    #クラスター分けの結果を結合
    x=cbind(z, cluster) # 標準得点のデータフレーム
    y=cbind(dat_seiseki, cluster) # 素点のデータフレーム
    #クラスターごとの平均の確認
    tapply(x$kokugo_all, x$cluster, mean) #クラスターごとの国語得点
    tapply(x$sansu_all, x$cluster, mean) #クラスターごとの算数得点
    tapply(x$rika_all, x$cluster, mean) #クラスターごとの理科得点
    ⚫ 被験者にはどんな特徴を持つグループが存在するのか
    クラスター1:国語×算数△理科× 「文字苦手グループ」
    クラスター2:国語×算数×理科× 「勉強苦手グループ」
    クラスター3:国語〇算数△理科〇 「論理的思考グループ」
    クラスター4:国語△算数〇理科〇 「理系グループ」

    View full-size slide

  119. 構造方程式モデリングの世界
    分析の統一的な枠組み
    Structural Equation Modeling (SEM)
    (共分散構造分析)

    View full-size slide

  120. 119
    構造方程式モデリング(SEM)
    のアプローチ
    ① 複数の変数間の関連性について、特定の仮説モデルを
    設定
    ② その仮説モデルの妥当性を検証
    ③ モデルが正しいとした場合の変数間の定量的な関連性
    を推定
    仮説モデル:
    変数間にどのような因果関係や相関関係があるかという理論的な仮説
    を表現したモデル。パス図という図で視覚的に表現する。
    仮説モデルの妥当性:
    適合度という概念で検証する。適合度とは、解析に使用したデータと、
    仮定されたモデルの間の一致度を意味し、適合度が高いほど、モデル
    の妥当性が高いことが示唆される。
    定量的な関連性:
    パス係数(パラメータ推定値)と呼ばれる値で表現。仮定したモデルのも
    とでの変数間の因果関係や相関関係の強さに関する推定値を意味する。

    View full-size slide

  121. 120
    補足:パス図
    観測変数
    潜在変数
    観測変数とは、直接測定されている変数のこと。
    解析に使用するデータセットを構成しているもの。
    潜在変数(因子)とは、直接は測定されず、複数
    の観測変数を介して測定される(c.f. 構成概念)
    X1 Y1
    X2 Y2
    単方向の矢印は、因果関係を表す。
    両方向の矢印は、相関関係を表す。
    外生変数(独立変数):どの変数からも単方向の矢印を受けない変数
    内生変数(従属変数):1つ以上の変数から単方向の矢印を受ける変数

    View full-size slide

  122. 121
    構造モデルと測定モデル
    F1 F3
    F2
    <構造モデル>
    複数の概念感の因果関係に関する仮説を表すもの。
    因果関係に関する仮説は、先行研究の知見や理論
    的な検討によって、先験的に設定される必要があ
    る。
    F
    X1
    X2
    X3
    <測定モデル>
    直接観測できない構成概念を、潜在変数(因子)
    として複数の観測変数を通して定量化するもの。
    (≒確認的因子分析)


    <フルSEMモデル>
    構造モデルと測定モデルを組み合わせたもの。

    View full-size slide

  123. 122
    練習問題
    F1
    友人関係
    F3
    抑うつ
    F2
    家族関係
    X1
    X2
    X3
    X4
    X5
    X6
    X7
    X8
    d1
    e1
    e2
    e3
    e4
    e5
    e6
    e7
    e8
    e1~e8, d1 : 誤差変数
    内生変数には、他の変数
    によって説明されない成
    分(残差)が仮定され、
    誤差変数と呼ばれる。
    Q1 潜在変数はいくつあるか。
    Q2 どの変数間に、相関関係が仮定されているか。
    Q3 外生変数をすべて挙げよ。
    Q4 このパス図が示す、仮説モデルを説明せよ。

    View full-size slide

  124. 123
    補足:適合度1
    ⚫ 仮説モデルのもとでの分散・共分散行列と、実際
    の分散・共分散行列のズレを評価
    指標 説明 範囲 良好 悪い
    χ2値
    因果モデル全体が正し
    いかどうかの指標。 χ2≧0
    有意でなければ
    OK
    p>0.05
    SRMR
    モデルとのズレの残差
    に関する指標。 SRMR≧0
    .08以下(良い)
    .10以下(許容) 0.1以上
    RMSEA
    モデルの分布と真の分
    布の乖離を1自由度あ
    たりの量として表現し
    た指標。
    RMSEA≧
    0
    0.05未満 0.1以上
    AIC
    複数のモデルを比較す
    る際に、モデルの相対
    的な良さを評価する指
    標。
    -
    想定的に低いほど、予測力
    の高いモデル
    BIC
    表1 小さい方が良い指標

    View full-size slide

  125. 124
    補足:適合度2
    ⚫ 仮説モデルのもとでの分散・共分散行列と、実際
    の分散・共分散行列のズレを評価
    指標 説明 範囲 良好 悪い
    GFI モデルの説明力の指標。 GFI≦1 0.95以上 0.9未満
    AGFI
    GFIの自由度を調整した
    指標。 AGFI≦GFI 0.95以上 0.9未満
    CFI
    独立モデル(すべての
    変数が無相関)を基準
    とした場合のモデル適
    合を評価する指標。
    0~1
    0.90以上
    (0.95以上) 0.9未満
    表2 大きい方が良い指標
    ※ただし、適合度の高いモデルは、多数存在する「ありうるモデル」の中の
    1つにすぎない。
    →十分な理論的根拠に基づく判断が必要
    ◆ 適合度が悪かったら、モデルを改善して、再度推定してみる。

    View full-size slide

  126. 125
    構造方程式と共分散構造
    X
    1
    友人関係
    X
    2
    家族関係
    Y
    1
    抑うつ
    d
    1
    φ12
    γ11
    γ12
    <推定したい値>
    パス係数=γ11,
    γ12
    誤差分散(d1
    )=θ1
    分散( X1
    )=φ11,
    分散( X2
    )=φ22
    共分散(X1,
    X2
    )= φ12
    γ◯△
    ◯=従属変数の番号
    △=独立変数の番号
    共分散の値を、両変数の標準
    偏差の積で割って標準化した
    ものが相関係数
    *パス係数
    回帰分析における回帰係数
    (or偏回帰係数)と数学的に
    同一。独立変数が1単位上昇
    したときの充足変数の変化の
    期待値を意味する。
    方程式(構造方程式)で表すと・・・
    𝑌1
    = 𝛾11
    𝑋1
    + 𝛾12
    𝑋2
    + 𝑑1
    <得られている値>
    観測変数=X1
    , X2
    , Y1
    X1
    X2
    Y1
    X1
    φ11
    X2
    φ12
    φ22
    Y1
    𝛾11
    𝜑11
    + 𝛾12
    𝜑22
    𝛾11
    𝜑12
    + 𝛾12
    𝜑22
    𝛾2
    11
    𝜑11
    + 2𝛾11
    𝛾12
    𝜑12
    + 𝛾2
    12
    𝜑22
    + 𝜃1
    表 構造モデルの共分散構造
    ←対角成分は、分散
    その他の成分は、共分散
    6個のパラメータ

    View full-size slide

  127. 126
    具体例(構造モデル)
    X1
    X2
    Y1
    X1
    1.526
    X2
    0.912 3.225
    Y1
    1.666 2.310 9.749
    表 サンプルの分散・共分散行列
    φ
    11
    = 1.526
    φ
    12
    = 0.912
    φ
    22
    = 3.225
    𝛾11
    𝜑11
    + 𝛾12
    𝜑22
    = 1.666
    𝛾11
    𝜑12
    + 𝛾12
    𝜑22
    = 2.310
    𝛾2
    11
    𝜑11
    + 2𝛾11
    𝛾12
    𝜑12
    + 𝛾2
    12
    𝜑22
    + 𝜃1
    = 9.749
    6個の連立方程式から、
    残りのパラメータを算出
    𝛾12
    = 0.490
    𝛾11
    = 0.799 𝜃1
    = 7.286
    自由度=連立方程式の数-
    推定されるパラメータの数
    が、0以上でないと推定できない。

    View full-size slide

  128. 127
    測定方程式と共分散構造
    <推定したい値>
    負荷量=λ11~
    λ41
    誤差分散(d1
    )=θ1
    分散( e )=θ1
    ~ θ4
    *分散( F1
    )=φ1,
    方程式(測定方程式)で表すと・・・
    𝑋1
    = 𝜆11
    𝐹1
    + 𝑒1
    <得られている値>
    観測変数=X1
    , ~ X4
    X1
    X2
    X3
    X4
    X1
    𝜆2
    11
    𝜑1
    + 𝜃1
    X2
    𝜆11
    𝜆21
    𝜑1
    𝜆2
    21
    𝜑1
    + 𝜃2
    X3
    𝜆11
    𝜆31
    𝜑1
    𝜆21
    𝜆31
    𝜑1
    𝜆2
    31
    𝜑1
    + 𝜃3
    X4
    𝜆11
    𝜆41
    𝜑1
    𝜆21
    𝜆41
    𝜑1
    𝜆31
    𝜆41
    𝜑1
    𝜆2
    41
    𝜑1
    + 𝜃4
    表 測定モデルの共分散構造
    10個のパラメータ
    F
    1
    X
    1
    X
    2
    X
    3
    X
    4
    e1
    e2
    e3
    e4
    𝑋2
    = 𝜆21
    𝐹1
    + 𝑒2
    𝑋3
    = 𝜆31
    𝐹1
    + 𝑒3
    𝑋4
    = 𝜆41
    𝐹1
    + 𝑒4
    𝜆11
    𝜆21
    𝜆31
    𝜆41
    ↑どんな値も取りうるから厄介

    View full-size slide

  129. 128
    補足:lavaan記法の基礎
    ◼ lavaan記法の基礎
    メタ認知 学力
    朝食 成績
    CT
    Q1
    Q5
    Q7
    model="
    CT=~Q1+Q5+Q7
    "
    model="
    学力~メタ認知
    "
    model="
    朝食~~成績
    "

    View full-size slide

  130. 129
    EFAとCFA
    ⚫ 探索的因子分析(EFA)と確認的因子分析(CFA)は想定するモデルが異なる
    • すべての因子からすべての
    観測変数への影響を仮定
    • 明確な仮説がない場合
    • 影響を与えるのは1つの因子
    • 明確な仮説がある場合、すで
    に開発されているものを使用
    する場合など

    View full-size slide

  131. 130
    確認的因子分析1
    #確認的因子分析#####
    #SEM
    library(lavaan)
    #1因子モデル
    model1="
    F1=~CT1+CT2+CT3+CT4+CT5+CT6+CT7
    "
    fit1=cfa(model1,data=dat_CT) #確認的因子分析
    summary(fit1, standardized=T, fit.measures=T)
    modificationIndices(fit1, minimum.value = 100) #修正指標
    ⚫ 構造方程式モデリングの枠組みで、確認的因子分析を行う。
    ML=最尤法で推定
    250人のデータ
    ←標準化した係数=T 適合度表示=T

    View full-size slide

  132. 131
    確認的因子分析2
    ⚫ 出力の解釈
    ←標準化推定値
    CFI=1.00, RMSEA=0.00, SRMR=0.03
    →十分な適合度

    View full-size slide

  133. 132
    確認的因子分析3
    #SEM図のプロット
    library(semPlot)
    semPaths(fit1, "std", rotation = 2, edge.label.cex = 1.2,
    style="lisrel",fade=F,theme='gray',label.cex=1.2,sizeMan = 9)
    ⚫ 確認的因子分析の結果を、パス図で表現する。

    View full-size slide

  134. 133
    報告例1(確認的因子分析)
    ◼ 先行研究の知見に基づき、批判的思考に1因子構造を想定
    した確認的因子分析を行った。分析の結果、適合度指標
    は、CFI=1.00, TLI=1.00, RMSEA=.00(90%CI [.00, .06]),
    SRMR=0.03であり、データに対するモデルの当てはまり
    は十分であると判断された。

    View full-size slide

  135. 134
    報告例2(確認的因子分析)
    3つの因子構造モデルおよび神山・藤原(1991)による1因子モデルについ
    て、確認的因子分析(CFA)による比較を行うことにした。4つのモデルにおけ
    る適合度指標および情報量基準を表に示す。
    指標 4因子モデル 2因子モデル 修正版2因子モデル
    1因子モデル
    (神山・藤原,1991)
    CFI 0.83 0.83 0.98 0.63
    TLI 0.80 0.80 0.98 0.57
    RMSEA
    [90%CI]
    (p値※)
    0.09
    [0.08, 0.10]
    (0.00)
    0.10
    [0.08, 0.11]
    (0.00)
    0.03
    [0.00, 0.07]
    (0.72)
    0.13
    [0.11, 0.15]
    (0.00)
    SRMR 0.08 0.08 0.05 0.10
    AIC 6544.02 5877.17 4168.24 5422.28
    BIC 6523.04 5971.37 4235.52 5503.02
    表 適合度指標および情報量基準
    良好な適合度指標値の範囲として小島(2005)は、「CFI≧0.95、RMSEA<
    0.05、SRMR<0.05」という基準を提案している。小島(2005)による提案に
    基づき表を解釈した結果、適合度が基準を満たし、相対的に予測力が高い修
    正版2因子モデルを採択することにした。

    View full-size slide

  136. 135
    構造方程式モデリング1
    #構造方程式モデリング#####
    library(lavaan)
    model2="
    ct=~CT1+CT2+CT3+CT4+CT5+CT6+CT7
    rika_all~ct
    "
    fit2=sem(model = model2,data = dat1)
    summary(fit2, standardized=T, fit.measures=T)
    #SEM図のプロット
    library(semPlot)
    semPaths(fit2, "std", rotation = 2, edge.label.cex = 1.2,
    style="lisrel",fade=F,theme='gray',label.cex=1.2,sizeMan = 9)
    ⚫ 理科の成績をクリシンで説明(予測)する。
    *適合度
    CFI=.993, TLI=.990,
    RMSEA=.026, SRMR=.032
    有意 標準化係数
    ↑標準化した係数 ↑適合度

    View full-size slide

  137. 136
    構造方程式モデリング2
    #sem
    model3="
    ct=~CT1+CT2+CT3+CT4+CT5+CT6+CT7
    risu=~sansu1+sansu2+sansu3+rika1+rika2+rika3
    risu~ct
    "
    fit3=sem(model = model3,data = dat1)
    summary(fit3, standardized=T, fit.measures=T)
    lavInspect(fit3, “rsquare”) #決定係数
    #SEM図のプロット
    library(semPlot)
    semPaths(fit3, "std", rotation = 2, edge.label.cex = 1.2,
    style="lisrel",fade=F,theme='gray',label.cex=1.2,sizeMan = 9)
    ⚫ 理数能力をクリシンで説明(予測)する。
    *適合度
    CFI=.979, TLI=.975, RMSEA=.033, SRMR=.050 理数の説明率=17.9%

    View full-size slide

  138. 137
    補足:SEMのサンプルサイズ
    ✓ 結論:最低でも150、できれば200以上
    • N=100~150が目安(Tinsley & Tinsley, 1987; Ding, Velicer &
    Harlow, 1995)
    • N=200が目安(Kline, 2005)
    • 確認的因子分析では、N=150が合理的(Muthen & Muthen, 2002)
    • 多母集団分析では、各集団につき100のケースが必要(Kline,2005)
    • 観測変数の10倍のデータが最低限必要(Nunnally, 1967)
    • 自由パラメータの10~20倍(Kline, 1998)

    View full-size slide

  139. 138
    補足:その他のモデル
    ⚫ SEMではほかにも様々なモデルが表現できます。
    各自でさらに調べてみてください。
    • MIMICモデル
    • 2次因子分析モデル
    • PLS (Partial Least Squares)
    • 多母集団分析

    View full-size slide

  140. 139
    演習1
    ⚫ data2.xlsxを使用して分析
    Q1.各教科の平均得点の変数を作成せよ
    Q2.学年間で、理科の平均得点に差があるかを検討せよ
    Q3.男女間で、算数の平均得点に差があるかを検討せよ

    View full-size slide

  141. 140
    演習2
    Q4.メタ認知尺度の因子構造について検討せよ
    Q5.仮説モデルを立て、構造方程式モデリングを用いた分析を
    実行せよ。
    END

    View full-size slide

  142. 補足:例数設計
    141

    View full-size slide

  143. 142
    検定の基礎
    検定の結果
    差がある
    差があるとはいえ
    ない
    真実
    差がある
    正しい判断
    (1-α)
    第2種の過誤
    (β)
    差がない
    第1種の過誤
    (α)
    正しい判断
    (1-β)
    危険率(α)=0.05
    検定力(1-β)=0.8
    が推奨されている
    →効果量さえ仮定すれば、
    必要なサンプルサイズが
    見積れる

    View full-size slide

  144. 143
    例数設計
    #例数設計#####
    #対応のないt検定の事前分析 power=検定力, delta=効果量, sig.level=危険率
    power.t.test(power = 0.8, delta = 0.2, sig.level = 0.05, type = "two.sample")
    power.t.test(power = 0.8, delta = 0.5, sig.level = 0.05, type = "two.sample")
    #対応のあるt検定の事前分析
    power.t.test(power = 0.8, delta = 0.2, sig.level = 0.05, type = "paired")
    power.t.test(power = 0.8, delta = 0.5, sig.level = 0.05, type = "paired")
    * Cohenの基準
    d=0.2 小さな効果
    d=0.5 中程度の効果
    d=0.8 大きな効果
    →394名必要
    サンプルサイズが、、、
    多すぎると差の大きさに関わらず有意になってしまう
    少なすぎると差の大きさに関わらず有意にならない

    View full-size slide

  145. 144
    さらなる学習のために
    *多変量解析全般
    川端・岩間・鈴木(2018)
    『Rによる多変量解析入門』
    オーム社
    *構造方程式モデリング
    村上ら(2018)『心理学・社会科学研究のための
    構造方程式モデリング: Mplusによる実践 基礎編』
    ナカニシヤ出版
    *例数設計
    豊田秀樹(2009)『検定力分析入門』東京図書

    View full-size slide

  146. 項目反応理論
    145

    View full-size slide

  147. 146
    古典的テスト理論の問題点
    ⚫ 仮に難易度が同じ2つのテストがあったとして、あ
    る受験者が一方のテストを夏に受験して80点、また
    他方のテストを秋に受験して90点であったとする。
    では、受験者集団の中におけるこの受験者の順位
    (偏差値)も上昇しているか?
    ⚫ テスト得点(例えば90点)が与える情報は、当該のテス
    ト問題や受験者集団の性質に依存したものとなる。
    ⚫ 全国模試が実施され、ある学校の平均点が、80点で
    あった昨年度よりも伸びて、今年度は90点であった。
    その学校の生徒達の学力が平均的に高くなったと考
    えられるか?
    →×(テストが簡単になっただけかも)
    →×(他の受験者の方が平均的により高く得点が上
    昇しているかも)

    View full-size slide

  148. 147
    古典的テスト理論
    ⚫ 集団内における位置で個人の成績を判定
    ⚫ 各問題の正答率がその問題の困難度
    ⚫ 問題Aの正答者が問題Bも正答している(orどちらも不正
    解)ような傾向だと、一貫している(識別力が高い)と判
    断される。
    ⚫ 古典的テスト理論の問題点
    • 困難度や識別力といった項目に関する指標が、受験者集団
    に依存する(標本依存性)
    • テスト得点といった受験者の能力に関する情報が、テスト
    の項目に依存する(項目依存性)

    View full-size slide

  149. 148
    項目反応理論(IRT)
    ⚫ 2種類の依存性を克服できる現代テスト理論
    • 項目に関する指標と、受験者の能力に関する指標を切り分
    けて推定できる。
    ⚫ 項目反応理論のメリット
    • 誰がどの問題を解いたとしても、統一した基準で成績を算
    出できる(ただし、等化を行う必要あり)
    →項目依存性・集団依存性の克服
    • 測定精度をきめ細かく確認できる
    • 平均点をテスト実施前に制御できる
    • テスト得点の対応表が作成できる
    • 受験者の能力ごとに最適な問題を瞬時に選び、その場で出
    題できる(c.f. コンピュータ適応型テストCAT)

    View full-size slide

  150. 149
    項目反応理論の基本
    ⚫ 項目反応理論では,受験者集団の性質に依存しない潜在特
    性値 (能力値)θ を導入する
    ⚫ θは直接観測できないが,その分布は正規分布していると
    仮定する
    ⚫ 横軸に特性値θを,縦軸に項目への正答率を配した関数を
    項目特性曲線(ICC)と呼び、特性値θと項目の特性(困難
    度・識別力)を同時に検討する。

    View full-size slide

  151. 150
    項目特性曲線(ICC)
    • ICC は個々の項目の特徴を表す。項目の数だけある。
    • 横軸は受験者の特性値θ、縦軸は当該能力における正答率
    となる
    • 識別力 𝑎 は、各曲線の傾き立
    ち上がりの急さを表す
    • 困 難度 𝑏 は、正答率が0.5 に
    なる能力値 θ の値を表す

    View full-size slide

  152. 151
    ICCに当てはめるモデル

    View full-size slide

  153. 152
    測定精度 項目情報関数(IIF)

    View full-size slide

  154. 153
    測定精度 テスト情報関数(TIF)

    View full-size slide

  155. 154
    IRT使用の前提
    以下の条件が仮定できる時のみ,IRT は使用可能
    1. 尺度の構成概念が 1 次元(1因子)である
    →因子分析の考え方で確認
    2. 局所独立性が保たれている
    ※局所独立:「能力 θ を固定した時、各項目への反応は互
    いに独立である」ということ
    • 能力と関係なく「ある項目に正解できた人は別の項目に
    も正解しやすい」という傾向がある場合、局所依存性が
    あるという
    • よくある例:数学のテストで,問 1 に正解しているこ
    とが問2を解く上で必要である(項目連鎖)

    View full-size slide

  156. 155
    事例(全国学調の追加分析)
    平成27年度文科省
    委託調査研究
    「学力向上に資する教
    科指導の改善に関する
    調査研究」より

    View full-size slide

  157. 156
    事例(全国学調の追加分析)
    平成27年度文部科学省
    委託調査研究
    「学力向上に資する教科指導の改
    善に関する調査研究」より

    View full-size slide

  158. 157
    2PLに基づく分析1
    #項目反応理論(IRT)に基づく分析#####
    #パッケージの読み込み
    library(ltm)
    library(irtoys)
    library(psych)
    ##データの読み込み
    #ワーキングディレクトリの確認
    getwd()
    #csvから読み込み方法
    setwd("C:/Users/2ken/Desktop/practice2019")
    dat2=read.csv("IRT1.csv")
    head(dat2)
    ⚫ IRT用の分析対象データを読み込む
    誤答0
    正答1

    View full-size slide

  159. 158
    2PLに基づく分析2
    #古典的テスト理論における困難度の確認
    colMeans(dat2)
    #古典的テスト理論における識別力の確認
    descript(dat2)
    ⚫ 古典的テスト理論に基づく分析
    →困難度(正答率)が低いのは?
    →識別力(合計点との各項目の相関)

    View full-size slide

  160. 159
    2PLに基づく分析3
    #2PLモデル
    ip1=est(resp = dat2,model = "2PL",engine = "ltm")
    ip1
    ip2=ltm(dat2~z1) #別の関数でも同じ結果
    summary(ip2)
    ⚫ 2PLモデルの推定
    困難度
    識別力
    ブロイデン・フレッチャー・ゴール
    ドファーブ・シャンノ法(BFGF法)

    View full-size slide

  161. 160
    2PLに基づく分析4
    #項目特性曲線 ICCの表示
    icc=irf(ip1$est)
    plot(icc,label = T,co=NA,main = "ICC")
    ⚫ 項目特性曲線(ICC)のプロット
    正答率50%を超える能力値Θの値が困難度

    View full-size slide

  162. 161
    2PLに基づく分析5
    #テスト特性曲線 TCC
    tcc=trf(ip$est)
    plot(tcc,main = "TCC")
    ⚫ テスト特性曲線(のプロット)
    各能力におけるテスト得点の期待値
    平均位の能力の受験者の期待得点は5点

    View full-size slide

  163. 162
    2PLに基づく分析6
    #個人適合度 Z3
    pfit=api(dat2,ip1$est)
    pfit
    which(abs(pfit)>2.0) #適合度の悪い被験者
    #項目適合度 G2
    j=9 #項目番号(例:項目9)
    itf(dat2,ip$est,item=j,main = paste0("項目",j)) #有意でなければよい適合
    ⚫ 適合度の確認
    IRTモデルはデータに
    適合している

    View full-size slide

  164. 163
    2PLに基づく分析7
    #項目情報関数 IIF
    iif=iif(ip1$est)
    plot(iif, label=T, co=NA, main = "IIF")
    #テスト情報関数 TIF
    tif=tif(ip1$est)
    plot(tif, laber=T, co=NA, main = "TIF")
    ⚫ IIFとTIFのプロット
    θが高い/低い人に適した問題がある 幅広い能力値θに適応した
    テストになっている

    View full-size slide

  165. 164
    2PLに基づく分析8
    #能力値Θの推定
    MLres=mlebme(resp = dat2,ip=ip1$est,method = "ML") #ML=最尤法
    head(MLres)
    BMres=mlebme(resp = dat2,ip=ip1$est,mu=0,sigma=1,method="BM") #MAP推定
    head(BMres)
    EAPres=eap(resp = dat2,ip=ip1$est,qu=normal.qu()) #EAP推定
    head(EAPres)
    ⚫ 能力値Θの推定
    迷ったらEAP推定
    1~6番目の被験者の能力値θと標準誤差

    View full-size slide

  166. ベイズ統計学に基づく分析
    165

    View full-size slide

  167. 166
    統計的仮説検定の限界
    ⚫ 手続きの煩雑さ
    • 帰無仮説を立てて棄却するという背理法の考え方
    ⚫ P値という概念の難しさ
    • 帰無仮説が正しいと仮定した場合の、今回より極端な
    データが得られる確率→なんじゃそりゃ
    ⚫ P値ハッキングに起因する、再現性問題
    • 心理学の研究の再現率が低い問題
    • 有意になるまでサンプルを追加している?
    ⚫ 複雑なモデルへの対応が困難

    View full-size slide

  168. 167
    ベイズの定理
    事後分布 =
    尤度 × 事前分布
    定数
    事前分布:パラメーターに関する事前知識(仮説)
    事前知識がない場合は、広い値を仮定しておく
    事後分布:データを得た後の、パラメーターについての推論
    (事前分布とデータから推定した結果)
    尤度(確率モデル):データの生成メカニズム
    (正規分布が使われることが多い)
    ⚫ 右辺の式に得られたデータを当てはめて、パラメーターを推定
    する。

    View full-size slide

  169. 168
    ベイズ推定
    ⚫ 前ページの式は、積分計算が複雑で、解析的にはとけない
    →シミュレーションを用いる
    ⚫ マルコフ連鎖モンテカルロ法(MCMC)を使って、事後分
    布を反映した乱数を大量に発生させる
    →その乱数分布を事後分布とする
    ⚫ MCMCを実行するには、いくつか追加する必要があり
    1.Rtools(インストールの際にオプションにチェックを入れる)
    2.rstanパッケージ

    View full-size slide

  170. 169
    母平均の差の検討1
    ##母平均の差の推定1(t検定に相当)
    #変数作成
    x=dat1$rika_all[dat1$grade=="5"] #第1群の指定
    y=dat1$rika_all[dat1$grade=="6"] #第2群の指定
    nx = length(x) #xのサンプルサイズ
    ny = length(y) #yのサンプルサイズ
    J=1-(3 /(4*((nx+ny-2)-1))) #効果量gを算出するための補正項
    data=list(N1=nx, N2=ny, x1=x, x2=y, c=0, J=J) #リスト形式. c=0→差が0以上の確率
    #対応のないt検定(頻度論の検定)
    t.test(y, x, var.equal=F) #F=Welchのt検定
    ⚫ 5年よりも6年の理科の成績の方が高いという仮説が正しい確率は?
    この後で使うstanは、リスト形式でデータを渡す必要がある。
    これからやることは、対応のないt検定のベイズ版。

    View full-size slide

  171. 170
    母平均の差の検討2
    pairedF <- '
    data{
    int N1;
    int N2;
    real x1[N1];
    real x2[N2];
    real c;
    real J;
    }
    parameters{
    real mu1;
    real mu2;
    real sigma1;
    real sigma2;
    }
    model{
    x1 ~ normal(mu1,sigma1);
    x2 ~ normal(mu2,sigma2);
    }
    generated quantities{
    real delta;
    real d_overC;
    real cohen_d;
    real hedges_g;
    delta = mu2 - mu1;
    d_overC = (delta>c? 1:0);
    cohen_d = delta /((sigma1^2*(N1-1)+sigma2^2*(N2-1)) /((N1-1)+(N2-1)))^0.5;
    hedges_g = cohen_d*J;
    }
    '
    ⚫ 5年よりも6年の理科の成績の方が高いという仮説が正しい確率は?
    どんなデータを扱うか
    何のパラメータの確率分布を推定するか
    どんな生成メカニズムか(尤度) normal=正規分布
    その他、計算して欲しい値

    View full-size slide

  172. 171
    母平均の差の検討3
    #ベイズ推定
    require(rstan)
    rstan_options(auto_write = TRUE) #コンパイルした結果を保存する
    options(mc.cores = parallel::detectCores()) #複数のCPUコアを並列で使う
    fit<-stan(model_code=pairedF,data=data,chains=5,warmup=1000,iter=21000) #(21000-1000)*5の乱数を発生させる
    print(fit,digits_summary=3) #小数点以下3位までで表示
    ⚫ 5年よりも6年の理科の成績の方が高いという仮説が正しい確率は?
    1.2以下だったら
    適切に収束
    95%確信区間
    (95%の確率でこの範囲に入る)
    点推定値
    (EAP推定値)
    ※結果は毎回少し変わる可能性あり

    View full-size slide

  173. 172
    報告例
    理科の点数について,「5年生の平均値(μ
    5
    )よりも6年生の平均値(μ
    6
    )の方が高い
    」という仮説を立て,後述のモデルのもとパラメタの事後分布において仮説が正しい確率
    (p)をベイズ統計学に基づき算出することにした.ベイズ推定に際しては,長さ21000
    のチェインを5つ発生させ,バーンイン期間を1000とし,MCMC法の一種であるHMC法
    によって得られた100000個の乱数で事後分布を近似した.なお,確率モデルとして, μ
    5
    とμ
    6
    の事前分布には正規分布を用いた.収束判定指標Rhatはすべてのパラメータにおい
    てRhat <1.1であり,パラメータ・生成量の全てに関して有効標本数(n-effect)が
    80000個以上と十分な数であったことから,各パラメータは事後分布からの乱数の近似と
    判断した.学年ごとの点数の母平均と効果量(Cohenの d )のEAP推定値および仮説が正
    しい確率を表に示す.表より,設定したモデルのもとパラメタの事後分布において仮説が
    正しい確率は100%であり,6年生の平均値が高い傾向にあると解釈できる.
    表 母平均および母平均の差についての推定
    EAP p.Sd 2.5% 50% 97.5% Rhat
    μ5
    69.325 0.630 68.093 69.324 70.558 1
    μ6
    76.891 0.609 75.702 76.892 78.089 1
    p
    (μ6
    -μ5
    >0)
    1.000 0.000 1.000 1.000 1.000 -
    d 1.096 0.136 0.831 1.096 1.362 1

    View full-size slide

  174. 173
    母平均の差の検討4
    x=dat_seiseki #データ
    n <- nrow(x) #サンプルサイズ
    data <-list(N = n, X = x) #リスト形式
    ⚫ 理科の点数が国語や算数の点数よりも高いという仮説が正しい確率は?
    この後で使うstanは、リスト形式でデータを渡す必要がある。
    これからやることは、対応のある1元配置分散分析のベイズ版。

    View full-size slide

  175. 174
    母平均の差の検討5
    anovaP3 <- "
    data{
    int N;
    vector[3] X[N];
    }
    parameters{
    vector[3] mu;
    real sig[3];
    real rho;
    }
    transformed parameters{
    matrix[3,3] Sigma;
    Sigma[1,1] = sig[1]*sig[1];
    Sigma[2,2] = sig[2]*sig[2];
    Sigma[3,3] = sig[3]*sig[3];
    Sigma[1,2] = sig[1]*sig[2]*rho;
    Sigma[1,3] = sig[1]*sig[3]*rho;
    Sigma[2,3] = sig[2]*sig[3]*rho;
    Sigma[2,1] = Sigma[1,2];
    Sigma[3,1] = Sigma[1,3];
    Sigma[3,2] = Sigma[2,3];
    }
    ⚫ 理科の点数が国語や算数の点数よりも高いという仮説が正しい確率は?
    どんなデータを扱うか
    何のパラメータの
    確率分布を
    推定するか
    その他の
    パラメータ
    生成メカニズム
    multi normal
    =多変量正規分布
    uniform=一様分布
    cauchy=コーシー分布
    その他、
    計算して欲しい値
    model{
    X ~ multi_normal(mu, Sigma);
    rho ~ uniform(-1,1);
    sig ~ cauchy(0,2.5);
    }
    generated quantities{
    real delta21;
    real delta31;
    real delta32;
    real d_overC1;
    real d_overC2;
    real d_overC3;
    delta21 = mu[2] - mu[1];
    delta31 = mu[3] - mu[1];
    delta32 = mu[3] - mu[2];
    d_overC1 = (delta21>0? 1:0);
    d_overC2 = (delta31>0? 1:0);
    d_overC3 = (delta32>0? 1:0);
    }
    "

    View full-size slide

  176. 175
    母平均の差の検討6
    require(rstan)
    rstan_options(auto_write = TRUE)
    options(mc.cores = parallel::detectCores())
    fit <- stan(model_code = anovaP3, iter=21000, warmup=1000, chains=5, data = data)
    print(fit, digits_summary = 2)
    ⚫ 理科の点数が国語や算数の点数よりも高いという仮説が正しい確率は?
    c1=mu[2] - mu[1]>0の確率
    c2=mu[3] - mu[1]>0の確率
    c3=mu[3] - mu[2]>0の確率
    ※結果は毎回少し変わる可能性あり ※推定に時間かかる
    mu[1]=国語
    mu[2]=算数
    mu[3]=理科

    View full-size slide

  177. 176
    報告例
    各教科の点数の差をベイズ統計に基づき検討する.検討に際しては,まず,母集団における各教科の点
    数のEAP推定値を算出した.推定に際しては,長さ21000のチェインを5つ発生させ,バーンイン期間を
    1000とし,HMC法によって得られた100000個の乱数で事後分布,予測分布を近似した.なお,事前分
    布には一様分布を用いた.収束判定指標RhatはすべてのパラメータにおいてRhat <1.1であり,パラメ
    ータ・生成量の全てに関して有効標本数が110000個以上と十分な数であったことから,各パラメータは
    事後分布・予測分布からの乱数の近似と判断した.次に,任意の2つの教科において,教科Aが教科Bよ
    りも平均値が高い確率を算出した.結果を表1,2に示す.
    表1より,理科の点数が相対的に高いことが見て取れる.また,表2より,理科が算数高い確率は
    100%、理科が国語より高い確率は100%であることが分かる.
    表1 パラメータの推定結果
    表2 行の教科が列の教科より高い確率
    EAP p.sd 2.5% 50.0% 97.5%
    国語 59.10 0.51 58.09 59.10 60.11
    算数 68.24 0.53 67.19 68.24 69.28
    理科 73.10 0.49 72.16 73.10 74.07
    国語 算数 理科
    国語 0.00 0.00 0.00
    算数 1.00 0.00 0.00
    理科 1.00 1.00 0.00

    View full-size slide