統計勉強会2020 統計学の基礎と分析方法

統計勉強会2020 統計学の基礎と分析方法 2020年10月29日～11月20日 @広島大学広島大学大学院D2 中村大輝

1 本勉強会の方針目的：統計学の基礎と実際の分析方法を習得する • 初歩的な統計学の基礎を概説する • 架空のデータを用いて、様々な分析の演習 • 卒論研究に必要な一連の分析技術を習得
× 〇分からないできないできる分かる

2 なぜ、いま統計力が必要か •EBM（Evidence-based medicine） •EBPM（Evidence-based policy making） •EBE（Evidence-based education） →証拠に基づく意思決定
•実証研究に必要不可欠 •調査デザインにも影響 •統計教育の広がりメタ分析無作為化比較試験（RCT）比較実践研究要因対照研究事例報告専門家の意見個人の意見（体験談）高低エビデンスピラミッド（根拠の信頼性）量

3 SPSS vs R • 有料ソフトである • ボタンをポチポチして操作（GUI） •
日本語対応 • 無料ソフトである • コードを入力して操作（CUI） • パッケージ（拡張機能）も8000を超える • Rでしかできない最新手法が多くある • 基本英語 <

4 Rコミュニティの活発な議論

5 準備：RとRStudioをインストールしよう ◼ R CRANからbaseをダウンロード＆インストール https://cran.ism.ac.jp/ ◼ RStudio Rstudio社のHPからFree版をダウンロード＆インストール https://rstudio.com/products/rstudio/download/#downl
oad

6 RStudioについて ⚫RStudioは、Rをより使いやすくするためのソフト（基本無料） ⚫この講習会では、すべてRStudioを利用して分析する ⚫必ずインストール＜便利なところ＞ • コードの予測変換や引数リストを表示してくれる • 変数の管理が容易

Rの使い方の基礎

8 RStudioの画面エディタ（コードを書くところ）コンソール（結果・出力が出るところ）パッケージの管理図表の出力ワークスペース
（変数の管理）

9 R Scriptを作成して保存 R Scriptの作成と保存ファイル名に英語を使った方がよい例）script1, 190907, code_0907 コードを書いておく
メモ帳のようなもの

10 四則演算 #四則演算##### 3+5 10-3 2*3 100/20 (12+34-56)*78/90 4^2 •
エディタに書いて実行 or コンソールに直接入力実行の方法 • Ctr+Enterでその行を実行 • Alt+Enterでその行を実行★ • 範囲を指定してRunをクリックコメントアウト（メモ） • #から始めるとその行は読み込まれない • メモやコメントを残せる • コメントの後ろに#を連ねると目次代わりになる

11 変数と代入代入演算子「<-」「=」を使って，変数にオブジェクトを代入することができる x<-3+5 y<-9 z = x+y z
オブジェクト変数（イメージ）オブジェクト：データそのもの変数：オブジェクトを保管する箱代入：オブジェクトを箱に保管すること本スライドでは・・・ • コードを灰色四角に表示 • 代入演算子は「＝」を使用スペースは無視して読み込まれる

12 関数何らかのインプットに対して処理を加えアウトプットを返すものアウトプットインプット処理関数２４
処理 sqrt sqrt(4) 平方根を返す関数「sqrt」

13 Rによる分析の流れファイルの読み込みコードの入力分析の実行分析に使うエクセルファイルを読み込むコード（スクリプト）を書いて， Rにやってほしいことを命令
出力を読み取る

14 今回使用するデータ ⚫ 「data1.xlsx」：教育測定に関する架空データ  ID：通し番号（1~250）  school：学校名（sakura/kita）  grade：学年（5~6）
 class：クラス  number：出席番号  sex：性別（M男、F女）  kokugo1~3：国語のテスト結果  sansu1~3：算数のテスト結果  rika1~3：理科のテストの結果  CT1~7：批判的思考質問紙 Rは変数名を英語にした方がエラーが出にくいまずはデータを眺めて構造を理解しよう。

15 データの読み込み１（csvから） #データの読み込み##### #ワーキングディレクトリの確認 getwd() #読み込み方法1 csvから setwd(“C:/Users/＊＊＊/＊＊/practice2019") dat1=read.csv("data1.csv") ←コメントアウトの後ろに#連打で目次
←ワーキングディレクトリ：作業スペースの場所（アドレス） ←csvデータを事前に作成しておく ←ワーキングディレクトリの指定 ←read.csv（”ファイル名”）で読込み dat1にデータセットを格納オブジェクト dat1 （イメージ） ※csvカンマ区切りで保存を推奨 ※マウス操作でも変えられる ※コンソールにもWDが表示されてる

16 データの読み込み２（excelから） #読み込み方法2 xlsxから library(readxl) dat1=read_excel("data1.xlsx") View(dat1) ←下図を参考に、マウス操作でExcel ファイルから直接読み込み ←read_excel（”ファイル名”）で読込み
←dat1を表示してみる ※実行されたコードをエディタにもコピーしておく。こっちの方法の方が手早いし楽。一度コードをコピーしておけば次回からは、コードを実行するだけでOK.

17 データハンドリング #データハンドリング##### #行列数 dim(dat1) #先頭6行の表示 head(dat1) head(dat1$rika1) ←目次 ←コメントアウト
←dim（データ）で、行数・列数の表示 ←head（データ）で、先頭6行を表示 ←データ$変数名で、1つの変数を指定 250行/22列（250人/22変数）正しく読み込めているか確認データセット変数

18 変数の型の確認と変更 #変数の型の確認と変更 str(dat1) dat1$school=as.factor(dat1$school) dat1$grade=as.ordered(dat1$grade) dat1$sex=as.factor(dat1$sex) • int：整数型（integer）であることを示す •
num：実数型（numeric）であることを示す。小数点を含むもの。 • Factor：順序なし因子型であることを示す。例）性別 • Order：順序あり因子型であることを示す。例）学年 • chr：文字型（character）であることを示す。 ←str（データ）で構造を確認 ←データセット$変数名で特定の変数を指定。as.factor（変数）で、変数を因子型にする。サジェスト機能を活用しよう変数の型 ↓ Enter 選択

記述統計学と視覚化基礎統計量、ヒストグラム、箱ひげ図、散布図 19

20 記述統計学と推測統計学 ⚫ 記述統計（descriptive statistics）：得られたデータの特徴や性質を説明・要約する ①数値要約：平均値や標準偏差などの代表値 ②図的要約：ヒストグラム・箱ひげ図・散布図など ⚫ 推測統計（inferential
statistics）：得られたデータから，手元にないデータを含めた全データの一般的な性質について推測する

21 尺度水準と計算尺度水準説明可能な演算例量的変数比率尺度 0が原点であり、間隔と比率に意味が
あるもの＋－×÷ 重さ、長さ、標高間隔尺度目盛が等間隔になっているもので、その間隔に意味があるもの＋－気温、西暦質的変数順序尺度順序や大小には意味があるが間隔には意味がないもの＞＝順位名義尺度他と区別し分類するための記号度数カウント血液型、郵便番号、住所名義順序間隔比率平均値 ☓ ☓ ◯ ◯ 中央値 ☓ ◯ ◯ ◯ 最頻値 ◯ ◯ ◯ ◯ 尺度水準によって使える分析や指標が異なる。

22 練習問題 ⚫ 次のデータの尺度水準を答えなさい。 A) 人間の性別 B) 身長・体重 C) 気温（摂氏）
D) 絶対温度（K） E) 成績の順位 F) 血液型 G) アンケートで聞いたやる気度（５段階）※ H) 偏差値 ⚫ テストの項目として問題があるのは？

23 代表値の種類 ◼ 代表値：データの分布の中心的な位置を表す指標値 ⚫ 平均値（mean) ⚫ 中央値（median）データを小さい順に並べた時に中央に位置する値。データが偶数個の場合は中央の2つの平均を算出。
⚫ 最頻値（mode）度数の最も多い階級に対する値

24 散布度の指標 ◼ 散布度：データのばらつきの度合を表す指標値 ⚫ 偏差（diviation） 𝑑𝑖 = 𝑥𝑖 −
ҧ 𝑥 ⚫ 分散(variance) 𝑠2 = 1 𝑛 ෍ 𝑖=1 𝑛 𝑥𝑖 − ҧ 𝑥 2 ⚫ 標準偏差(standard deviation) 𝑠 = 𝑠2 = 1 𝑛 ෍ 𝑖=1 𝑛 𝑥𝑖 − ҧ 𝑥 2

25 基礎集計 #基礎集計##### #代表値と散布度 mean(dat1$rika1) #相加平均 median(dat1$rika1 ) #中央値 table(dat1$CT1)
#最頻値 var(dat1$rika1) #不偏分散 sd(dat1$rika1) #標準偏差標準偏差の２乗が分散の値と一致することを確認してみよう

26 要約 #要約 summary(dat1) install.packages("psych") library(psych) describe(dat1) ←summary(データ)で、四分位数を表示 ←psychパッケージをインストール（初回のみ） ←psychパッケージを読み込み
←describe(データ)で、基礎集計の表示追加のパッケージをインストール＆読み込むことで、様々な分析が可能になる。 [最小値、第一四分位、中央値、平均、第三四分位、最大値] [変数番号、サンプルサイズ、平均、標準偏差、中央値、トリム平均、中央絶対偏差、最小、最大、レンジ、歪度、尖度、標準誤差]

27 新しい変数の作成 #新しい変数の作成 dat1$kokugo_all=apply(dat1[,7:9],1,mean) dat1$sansu_all=apply(dat1[,10:12],1,mean) dat1$rika_all=apply(dat1[,13:15],1,mean) ←国語平均の作成。 ←算数平均の作成。 ←理科平均の作成。 ※0なら列,
1なら行に対して処理。新しい変数名＝関数による処理代入新しい変数が増えている

28 欠損値の除去 #欠損値除去 dat1=na.omit(dat1) ←リストワイズ除去（欠損値がある行を1行丸々除去する） 1. 完全にランダムに欠損→Missing Completely At Random(MCAR)
2. 観測データに依存する欠損→Missing At Random(MAR) 3. 欠損データに依存する欠損→Missing Not At Random(MNAR) ⚫ 欠損値の種類と対応 • MCARの場合、ペアワイズ削除（その分析に使う場合のみ除去）でもリストワイズ削除でもOK • MARの場合、完全情報最尤法による推定や、多重代入法による欠損値代入を行う • MNARの場合、お手上げ状態 ※ペアワイズ削除は、多くの関数でデフォルト設定になっている。

29 視覚化１ #視覚化##### #ヒストグラム hist(dat1$rika_all) library(lattice) histogram(~rika_all | grade+sex, data=dat1)
←1変数のヒストグラム ←パッケージの読み込み ←理科成績を学年と性別ごとにヒストグラム化何が読み取れる？

30 視覚化２ #箱ひげ図 boxplot(dat1$rika_all,horizontal = T) boxplot(rika_all~sex, data = dat1,horizontal
= T) ←TRUE=横書き, FALSE=縦書き ←性別ごとに箱ひげ図をプロット • 画像として保存 • Metafile形式なら、パワポ上で細かくいじれる f m 50 60 70 80 90 rika_all sex ↓Metafile形式で出力して色を付けた例最小値中央値第一四分位／第三四分位最大値

31 視覚化３ #散布図 plot(dat1$sansu_all, dat1$rika_all) plot(dat1$sansu_all, dat1$rika_all,pch=21,bg=c("blue","red")[unclass(dat1$sex)]) plot(dat1$sansu_all, dat1$rika_all,pch=as.numeric(dat1$sex), cex=1.5)
↑ plot(x軸の変数, y軸の変数) ★引数の参考 http://cse.naro.affrc.go.jp/takezawa/r- tips/r/53.html

32 ハイレベルな視覚化 #ペアプロット library(GGally) dat_ksr=dat1[,c("school","grade","sex","kokugo_all","sansu_all","rika_all")] dat_ksr=subset(dat1,select=c("school", "grade", "sex", "kokugo_all", "sansu_all",
"rika_all")) colnames(dat_ksr)=c(“学校”,“学年”,“性別”,“国語”,“算数”,“理科”) #日本語化 ggpairs(dat_ksr, aes_string(colour="学校", alpha=0.5)) #学校ごとに色分け ggpairs(dat_ksr, aes_string(colour="学年", alpha=0.5)) #学年ごとに色分け ggpairs(dat_ksr, aes_string(colour="性別", alpha=0.5)) #性別ごとに色分け同じ • 対角行列はその変数の分布 • 三角行列は変数間の関連 • 縦と横の変数の重なりを見る

33 課題 ⚫ データを視覚化し、どのような傾向がありそうかについてディスカッションしましょう。データの傾向について見通しを持つことは、その後の分析方針を立てる上で役に立ちます。

確率分布正規分布を知る

35 確率変数と確率分布 ⚫ 確率変数取る値の範囲と取る確率だけがわかっている変数 ➢ 連続確率変数：例）身長 ➢ 離散確率変数：
例）コインの表裏 ⚫ 確率分布確率変数がとる値とその値をとる確率の対応の様子コインの出る目の確率分布コインの表裏表(=1) 裏(=0) 確率 0.5 0.5

36 確率分布の種類確率分布離散型一様分布二項分布ポアソン分布正規分布 z 分布（標準正規分布）
t 分布 χ2分布 F 分布連続型 χ2分布（標準）正規分布 t分布 F分布二項分布ポアソン分布一様分布

37 正規分布と確率 ⚫ 正規分布の確率密度関数 μは平均値（期待値）であり、σ²は分散、xはデータの値 𝑓(𝑥) = 1 2𝜋𝜎2 𝑒−
𝑥−𝜇 2 2𝜎2 面積が確率を表している。区分求積法で計算する。 68.27% 95.45% μ σ 2σ -σ -2σ ↑こんな形確率分布を決定する統計量を母数（parameter）と言う。正規分布の母数は、平均μと分散σ²

38 正規分布の例 ⚫ 日本人17歳男性の身長分布 𝑓(𝑥) = 1 2𝜋 ∗ 33
𝑒− 𝑥−170 2 2∗33 日本の成人男性の身長(確率変数) 170cm 190cm 150cm 存在する確率（確率密度) 極端に長身や低身の人は滅多にいない

39 標準正規分布 ⚫ 標準正規分布の確率密度関数 μ=0，σ2=1 であるような正規分布を標準正規分布と呼ぶ。 𝑓(𝑥) = 1 2𝜋
𝑒𝑥𝑝 − 𝑥2 2 68.27% 95.45% 0 1 2 -1 -2 x 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.500 0.496 0.492 0.488 0.484 0.480 0.476 0.472 0.468 0.464 0.1 0.460 0.456 0.452 0.448 0.444 0.440 0.436 0.433 0.429 0.425 0.2 0.421 0.417 0.413 0.409 0.405 0.401 0.397 0.394 0.390 0.386 0.3 0.382 0.378 0.374 0.371 0.367 0.363 0.359 0.356 0.352 0.348 0.4 0.345 0.341 0.337 0.334 0.330 0.326 0.323 0.319 0.316 0.312 0.5 0.309 0.305 0.302 0.298 0.295 0.291 0.288 0.284 0.281 0.278 0.6 0.274 0.271 0.268 0.264 0.261 0.258 0.255 0.251 0.248 0.245 0.7 0.242 0.239 0.236 0.233 0.230 0.227 0.224 0.221 0.218 0.215 0.8 0.212 0.209 0.206 0.203 0.200 0.198 0.195 0.192 0.189 0.187 0.9 0.184 0.181 0.179 0.176 0.174 0.171 0.169 0.166 0.164 0.161 1.0 0.159 0.156 0.154 0.152 0.149 0.147 0.145 0.142 0.140 0.138 1.1 0.136 0.133 0.131 0.129 0.127 0.125 0.123 0.121 0.119 0.117 1.2 0.115 0.113 0.111 0.109 0.107 0.106 0.104 0.102 0.100 0.099 1.3 0.097 0.095 0.093 0.092 0.090 0.089 0.087 0.085 0.084 0.082 1.4 0.081 0.079 0.078 0.076 0.075 0.074 0.072 0.071 0.069 0.068 1.5 0.067 0.066 0.064 0.063 0.062 0.061 0.059 0.058 0.057 0.056 表標準正規分布表（上側確率） #正規分布の上側確率 pnorm(1.00, mean=0, sd=1, lower.tail = FALSE)

40 標準化とz得点 ⚫ 標準化データを平均０、標準偏差（分散）１に変換する作業。 𝑧 = 𝑥𝑖 − 𝜇𝑥
𝜎𝑥 • どんな正規分布に従う確率変数でも、標準化すれば標準正規分布で表せて便利 • 変換した後の得点をｚ得点（標準得点）と呼ぶ。

41 Rで正規分布を描画してみよう #確率分布の描画 curve(dnorm(x, 0, 1), -5, 5) curve(dnorm(x, 50,
10), 0, 100) curve (関数の式, 横軸の最小値, 横軸の最大値) ←標準正規分布 ←平均50、標準偏差10の正規分布 ↑この分布、どこかで見たような…

42 偏差値 ⚫ 偏差値偏差値 = 50 + 10 ∗
𝑧得点 • 平均50、標準偏差10になるように変換 • 受験者全体の分布の中でどれだけ高いかを反映している ⚫ 知能指数（IQ） IQ = 100 + 15 ∗ 𝑧得点 • 平均100、標準偏差15になるように変換 ※ただし、いくつかのバージョンがあるのと、フリン効果で分布が変化しつつある

43 練習問題 ① 偏差値が平均50, 標準偏差10の正規分布に従う場合、偏差値60以上は全体の何％であるか。ヒント１：偏差値＝ｚ得点×10+50 ヒント２：ｚ得点は標準正規分布に従う ③ あなたの理科の試験の得点は80点でした。クラス全体が
平均60点、標準偏差10点の正規分布に従う場合、あなたの得点の標準化した値と偏差値を求めなさい。 ② IQが平均100, 標準偏差15の正規分布に従う場合、 IQ130以上は全体の何％であるか。Rで計算せよ。 pnorm(130, mean=100, sd=15, lower.tail = FALSE)

44 復習問題 1. 4つの尺度水準とその具体例を答えよ 2. 代表値と散布度の指標を2つずつ答えよ 3. （標本）分散の計算式を答えよ 4. 標準正規分布の特徴を説明せよ
5. 標準化とはどのような作業か説明せよ

推測統計学の基礎標本分布、標準誤差、中心極限定理

46 記述統計学と推測統計学母集団記述統計学･･･サンプルの性質の要約推測統計学 ”標本統計量の値をもとに，母数についてできるだけ正確な推測をする” サンプル（標本）
サンプリング ⚫ 記述統計学と推測統計学目の前のサンプルに関することしか言えない

47 標本統計量と標本誤差母集団サンプル（標本） μ m 標本統計量（sample statistic）母数（parameter）
標本平均母平均サンプリング母数（未知の真の値）推定値標本誤差平均や分散標本データから母数を推定する場合は必ず誤差（標本誤差）が生じる

48 標本平均と標本分布母集団（テントウムシの体長）標本 (n=2) 母平均1.0cm （実際は未知）標本平均0.9cm （実際に観測できる）
標本平均1.1cm 標本平均1.3cm 標本平均◦.◦cm 標本平均は分布する何度でも抽出できる標本平均の標本分布 1.0 繰り返しサンプリングする状況を考えてみよう。複数得られた統計量の分布をその統計量の標本分布という。

49 標本平均のばらつき（標準誤差）母集団（テントウムシの体長）母平均1cm （実際は未知）標本平均0.9cm 標本平均1.1cm 標本平均0.5cm 何度でも
抽出できる nの数によって・・・標本平均2.5cm nが大きいと、標本平均のバラツキは小さい nが小さいと、標本平均のバラツキは大きい標本分布の標準偏差を標準誤差と呼ぶ nが大きいほど標準誤差は小さくなる Standard Error

50 サンプルサイズと標準誤差 μ 母集団の最小値（最小個体）母集団の最大値（最大個体）母集団の個体の分布標本平均の分布（n=5）標本平均の分布（n=10）
標本平均の分布（n=全数N，母平均）母標準偏差σ 母標準誤差σ/√5 母標準誤差σ/√10 x ➢ 母標準誤差(SE) 𝜎 ҧ 𝑥 = 𝜎𝑥 𝑛 ➢ 標本標準誤差(se) 𝑆 ҧ 𝑥 = 𝑆𝑥 𝑛 nが大きいほど標準誤差は小さくなる→精度良く母集団の平均値の推定ができる

51 大数の法則と中心極限定理標本平均の分布（n=1）標本平均の分布（n=5）標本平均の分布（n=10）標本平均の分布（n=全数N，母平均） x • より大きいサイズの標本から標本平均を求めると、
真の平均に近づく（大数の法則） nが大きいほど標準誤差は小さくなる→精度良く母集団の平均値の推定ができる • 標本の大きさnが大きくなると、抽出元の母集団が正規分布でない場合も、標本平均は正規分布に従う（中心極限定理）

52 標本平均の不偏性 μ ⚫ 標本平均 ⚫ 母平均 ⚫ 不偏平均（標本から母平均を推定）不偏性を持つ（不偏推定量）
ҧ 𝑥 = 1 𝑛 ෍ 𝑖=1 𝑛 𝑥𝑖 𝜇 = 1 𝑛 ෍ 𝑖=1 𝑛 𝑥𝑖 Ƹ 𝜇 = 1 𝑛 ෍ 𝑖=1 𝑛 𝑥𝑖 𝐸 Ƹ 𝜇 = 𝜇

53 不偏分散 ⚫ 標本分散 𝑠2 = 1 𝑛 ෍ 𝑖=1
𝑛 𝑥𝑖 − ҧ 𝑥 2 ⚫ 母分散 𝜎2 = 1 𝑛 ෍ 𝑖=1 𝑛 𝑥𝑖 − 𝜇 2 ⚫ 不偏分散（標本から母分散を推定） ෢ 𝜎2 = 1 𝑛 − 1 ෍ 𝑖=1 𝑛 𝑥𝑖 − ҧ 𝑥 2

54 練習問題 1. 標本分布とは何か説明せよ 2. 標準偏差(sd)と標準誤差(se)の違いについて述べよ 3. n=100で20代男性のBMIを調べた結果、平均22.7、標準偏差4.0であった。この場合の標本平均の標準誤差を算出せよ。
4. 標準誤差を半分にするには、サンプルサイズを何倍にすればよいだろうか。（ヒント：標準誤差の計算式の分母に注目） 5. 前回のRコードをもう一度実行し、“要約”の部分で標準誤差（se）が表示されていたことを確認しよう。

区間推定 95%信頼区間

56 点推定と区間推定 ⚫ 点推定母数の推定値を1つの値で示す（ex. 母平均の推定値は8.3cm） ⚫ 区間推定誤差を考慮して、母数の推定値を区間で示す（ex.
95%の確率で7.8~8.8cmの間に入る） 68.27% 95.45% μ σ 2σ -σ -2σ 95% 平均 +1.96se -1.96se 正規分布標本分布（正規分布）上限値（upper）下限値（lower）

57 95％信頼区間 ⚫ 95％信頼区間サンプリングと95%信頼区間の推定を繰り返せば、95%の確率で母平均（真の値）が含まれる区間。母平均（真の値） … 95%信頼区間失敗

58 平均値の区間推定 • ある牛丼屋の店長は、ランダムに100回の調査を行った。 • 結果、牛肉の重さの平均53g、不偏分散81gであった。 • 平均値の95%信頼区間を求めよ。 #95%信頼区間##### mu_lower=53-1.96*sqrt(81/100)
mu_lower mu_upper=53+1.96*sqrt(81/100) mu_upper

帰無仮説検定の基礎決定論的アプローチ

60 統計的仮説検定の考え方 ⚫ 統計的仮説検定標本を使って、母集団に関する判断を下す手法。仮説を立てて、白黒決着をつけたいというお気持ち。 ⚫ 手順 ① 仮説の設定（ex.
AとBには差がある） ② 仮説検定に用いる標本統計量の選択 ③ 有意水準の設定 ④ 実際のデータ（標本）から標本統計量を計算 ⑤ 仮説の正誤の判断（→結論） ※ただし、仮説検定は常にギャンブルであることを忘れるな

61 仮説の設定 ⚫ 仮説の種類 ◼ 帰無仮説（本来主張したいこととは反対の内容） • AクラスとBクラスの学力には差がない。 ◼ 対立仮説（本来主張したい内容）
• AクラスとBクラスの学力には差がある。 ⚫ 帰無仮説の棄却帰無仮説の下では、実際に得られたデータはとても極端な値であり、そんな値が出るのは非常にまれな確率だとなれば、「帰無仮説が正しい」という前提を疑い、帰無仮説を棄却する。背理法的な考え方により、対立仮説を採択する。

62 標本統計量の選択 ⚫ 検定統計量 ◼ 標本から計算される統計量を標本統計量と呼ぶ（復習） ◼ 仮説検定に用いられる標本統計量を検定統計量と呼ぶ ◼ 帰無仮説から離れるほど大きな値を示す指標である
• t, Χ2, F など • データから計算する ⚫ 基本コンセプト ◼ 帰無仮説の下での標本分布（数理的に導かれる）をもとに、データから計算した検定統計量が得られるのは非常にまれな確率（有意水準以下）なのかを検討する。 →慣例的に5% ※標本分布は母集団に対して同じ条件でサンプリングを繰り返すことを想定していたことに留意せよ

63 有意水準の設定 ⚫ リスクをコントロールせよ真実帰無仮説は正しい（差がない）帰無仮説は間違い（差がある）決定
帰無仮説を棄却第1種の誤り確率はα（有意水準） 5% 正しい決定確率は1-β（検定力）棄却しない正しい決定確率は1-α 95% 第2種の誤り確率はβ • 検定力の目安は0.8 • サンプルサイズを大きくすると、検定力は上がる • 差が大きいと検定力は上がる

64 標本統計量（検定統計量）の計算 ⚫ 基本コンセプト ◼ 帰無仮説の下での標本分布（数理的に導かれる）をもとに、データから計算した検定統計量が得られるのは非常にまれな確率（有意水準以下）なのかを検討する。例）学力の差・
AクラスとBクラスの学力には差がない。（帰無仮説）・帰無仮説から離れる＝学力の差が大きいほど大きい値を取る検定統計量を計算（ex., z=2.33）・標本分布をもとに、その検定統計量よりまれな値が得られる確率（p値）を計算 →差がないとは言えない統計的に意味のある差＝有意差がある 2.5% 2.5% p=0.01

65 仮説の正誤の判断 ⚫ 仮説検定 ◼ p値が有意水準（ex., 5%）を下回った時、検定結果が有意であると判断し、帰無仮説を棄却する。 ⚫ p値とは何であって何でないのか
◦ 帰無仮説が真であるという仮定の下で、検定統計量がデータから計算された値以上に甚だしい値となる確率 × 帰無仮説が真である確率 × 平均に差がないという仮説が正しい確率 × 対立仮説が正しい確率は1-p値 × 帰無仮説が真であるときに、誤って帰無仮説を棄却してしまう確率 × とにかく5%を切ったら嬉しい値

66 色々な検定統計量

67 ２つの平均値の差の検定 •問題 • Aクラス（n=40）のテストは、平均60.0点、不偏分散20であった。 • Bクラス（n=40）のテストは、平均58.0点、不偏分散20であった。 • ２つのクラスの学力に差があるといえるだろうか？帰無仮説：μA
-μB =0 対立仮説： μA -μB >0 𝑡 ҧ 𝑥1− ҧ 𝑥2 = ҧ 𝑥1 − ҧ 𝑥2 𝜎2 1 𝑛1 + 1 𝑛2 = 60 − 58 20 1 40 + 1 40 = 2 p＝0.0455 帰無仮説を棄却する →差がないとは言えない（差があると判断する） 68.27% 95.45% 0 1 2 -1 -2

68 有意差があればOKなのか？ ⚫ 検定統計量の式から分かる通り、nが大きければ検定統計量も大きくなりやすい＝p値が小さくなりやすい ⚫ nが大きいということは、自信をもって差を見出せるということ ⚫ 差があるかどうかだけでなく、差の大きさについても検討
する必要がある ⚫ 標準化した差の大きさを効果量と呼ぶ 𝑑 = 𝜇2 − 𝜇1 𝜎

２変量解析 t検定、一元配置分散分析、相関分析、クロス集計、カイ二乗検定、残差分析 69

70 対応のないt検定１（2群の平均値差） #学年間比較 tapply(dat1$rika_all, dat1$grade, mean) #学年ごとの平均値を見てみる t.test(rika_all~grade, data=dat1, var.equal=F)
#F=Welchのt検定 g5=dat1$rika_all[dat1$grade==“5”] #５年の抽出 g6=dat1$rika_all[dat1$grade==“6”] #６年の抽出 t.test(g6, g5, var.equal=F) #F=Welchのt検定 library(effsize) cohen.d(g6,g5,hedges.correction = T) #効果量：T=heagesのg, F=cohenのd ＊効果量（Effect Size）差の大きさを表す指標。平均値の差が標準偏差の何個分に相当するかを計算。測定単位が変わっても比較できる。様々な種類があるが、代表的なのはCohenのｄ。 Headgesのgは、 Cohenのdの補正版。同じことの別記法有意 ⚫ 理科の点数に学年間で差はあるだろうか？

71 対応のないt検定２（2群の平均値差） #性別間比較 tapply(dat1$rika_all, dat1$sex, mean) #性別ごとの平均値 t.test(rika_all~sex, data=dat1, var.equal=F)
#F=Welchのt検定 m=dat1$rika_all[dat1$sex=="m"] #第1群の指定 f=dat1$rika_all[dat1$sex=="f"] #第2群の指定 t.test(m, f, var.equal=F) #Welchのt検定 library(effsize) cohen.d(m, f, hedges.correction = T) #効果量：True=heagesのg, False=cohenのd ＊ Cohenの基準（dとgに適応できる） d=0.2 小さな効果 d=0.5 中程度の効果 d=0.8 大きな効果中程度の大きさの差有意 ⚫ 理科の点数に男女間で差はあるだろうか？ ※どんなに差が小さくても、サンプルサイズが大きければ有意になってしまう。効果量も重要。同じことの別記法 95%CI

72 報告例（対応のないt検定） 68 70 72 74 76 78 学年理科点数l
5 6 n=125 n=125 ◼ 男子（N=118）と女子（N=132）の理科の点数に差があるのかを明らかにするために、Welchのｔ検定を行った。その結果、男子（M=76.17, SD=6.88）と女子（M=70.36, SD=7.60）の点数には有意な差が見られた（t (247.96) =6.35, p < .001, g =0.80 (95%CI [0.54, 1.06])）。 ◼ 第５学年と第６学年で、理科の点数に差があるのかについて、独立な２群のｔ検定（Welch’s t-test）を実施したところ、0.1%水準で有意差が認められた（t (247.82)=8.743, p < .001, g =1.102 (95%CI [0.836, 1.369])）。

73 対応のあるt検定（2群の平均値差） ##対応のあるt検定（プレ・ポスト） t.test(dat1$rika3,dat1$rika1,paired = T) #T=対応あり library(effsize) cohen.d(dat1$rika3, dat1$rika1,
paired = T, hedges.correction = T) 無視できる差有意でない ⚫ 理科の点数の１回目と３回目で差はあるだろうか？＜報告例＞ ◼ １回目と３回目のテストで児童（N=250）の点数に変化があるかを明らかにするために、対応のあるｔ検定を行った。その結果、１回目（M=72.87, SD=11.07）と３回目（M=73.50, SD=10.55）の点数には有意な差が見られなかった（t (249) =0.79, p =.433, g =0.06 (95%CI [-0.09, 0.20])）。

74 練習問題 1. t検定を用いて、国語（kokugo_all）と算数（sansu_all）の性差を検討せよ 2. 理科の性差は国語の何倍か概算せよ（ヒント：効果量に基づく比較） 3. 桜小学校と北小学校では、どちらの学力が高いか検討せよ
（※やり方は1つではないので、問題を自由に解釈してよい。）

75 復習 1. 標本分布の標準偏差を何と呼ぶでしょうか 2. 95%信頼区間について説明せよ 3. ［正誤判定問題］ ①有意水準αを５%に設定するということは、実際には帰無仮説が正しい（差がない）のに、誤って帰無仮説を棄却する確率を５%以下に
抑えることを意味する。判定： . ②p値とは、帰無仮説が正しい確率であり、低ければ低いほど良い指標である。判定： . 4. 2群の母平均の差について検討する際に使用する検定を答えよ 5. 有意差の有無だけでなく、効果量も報告する必要があるのはなぜでしょうか？

76 分散分析 ⚫ ３群以上の平均値差を比べるにはどうしたらよいだろうか？ 1. ｔ検定を繰り返す → αのインフレを補正 2. 分散分析を使用する
◼ 分散分析 𝐹 = 群間変動の分散群内変動（誤差）の分散群間全体で差があるか判断する 1 − 1 − 𝛼 𝑛

77 一元配置分散分析（対応なし） ##一元配置分散分析 #学年＊性別を組み合わせた変数を作成 dat1$grade_sex=ifelse(dat1$grade=="5" & dat1$sex=="m", "5m", ifelse(dat1$grade=="5" &
dat1$sex=="f", "5f", ifelse(dat1$grade=="6" & dat1$sex=="m", "6m", ifelse(dat1$grade=="6" & dat1$sex=="f", "6f", NA)))) #１要因４水準の分散分析(対応なし) anova(lm(dat1$rika_all~dat1$grade_sex)) ↑ ifelse(条件式，Trueの場合, Falseの場合) ⚫ ４水準の間に全体として差があるか？５年男子／５年女子／６年男子／６年女子 F値が有意全体として差がある

78 多重比較とｐ値の補正 ⚫ ボンフェローニの補正法（Bonferroni） • 検定の回数分、p値を大きく補正する。 • 例えば、t検定で得られたp値をp×3（検定の繰り返し数）と補正して，補正後のp値がp<0.05となれば有意差ありと判断
ID class score 1 A 11 2 A 13 3 B 12 4 B 16 5 C 9 6 C 14 ➢ 多群の比較の例 ➢ 多項目の比較の例 ID Q1 Q2 Q3 Q4 Q5 Q6 1 2 3 2 4 4 3 2 6 5 2 5 4 1 3 4 1 6 3 7 5 4 4 5 3 7 7 5 5 3 4 5 4 4 6 6 6 3 5 1 2 3

79 多重比較 ⚫ どの水準間に差があるか？５年女子／５年男子／６年女子／６年男子 #多重比較 tapply(dat1$rika_all,dat1$grade_sex,mean) #性別*学年ごとの平均値 sort(tapply(dat1$rika_all,dat1$grade_sex,mean)) #並べ替え
pairwise.t.test(dat1$rika_all, dat1$grade_sex, p.adj = "bonf") #ボンフェローニ法 ※検定を繰り返していることになるので、ボンフェローニ法などでp値を補正する。多重比較５年女子５年男子６年女子５年男子 *** ６年女子 *** p=0.63 ６年男子 *** *** ** ５年女子５年男子６年女子６年男子 Mean 67.21 72.38 74.38 79.06

80 報告例（1元配置分散分析） ◼ 理科の点数を従属変数、性別と学年（5年男子・5年女子・6 年男子・6年女子）を要因とする一元配置分散分析を行った結果、有意差が見られた（F(3, 246)=41.04, p < .001）。ボン
フェローニ法による多重比較を行ったところ、6年女子と5 年男子の間を除くすべての組み合わせで有意差が見られた（ps < 0.01）。 ◼ 小学生を対象とした第1回（M=59.10, SD=7.80）、第2回（M=68.24, SD=8.52）、第3回（M=73.10, SD=7.81）の理科テストデータを用いて反復測定分散分析を行った。その際、 Mauchlyの検定が有意となり（χ2(2)=39.69, p < 0.001）、球面性の仮定が満たされないことが示されたため、Greenhouse- Geisserのε =.87を用いて自由度の修正を行った。結果、平均値には有意な差が見られた（ F(1.74, 249) = 290.41, p < .001, η2 =.34）。また、ホルム法による多重比較の結果、すべてのテスト間で有意差が見られた（ ps < 0.05）。

81 相関係数の種類ピアソンの積率相関連続量×連続量（間隔・比率）線形ポリコリック相関順序尺度×順序尺度線形ポリシリアル相関順序尺度×連続量
線形テトラコリック相関２値×２値の順序尺度線形スピアマンの順位相関順序or連続量の相関単調クラメールの連関名義尺度×名義尺度ーピアソン = +1、スピアマン = +1 ピアソン = +0.851、スピアマン = +1 多変量正規分布 | r | = 0.7～1.0 強い相関 | r | = 0.4～0.7 中程度の相関 | r | = 0.2～0.4 弱い相関 | r | = 0～0.2 ほとんど相関なし ※疑似相関に注意例）アイスの売り上げと溺死者数線形〇単調〇線形×（非線形）単調〇

82 ピアソンの積率相関係数 ⚫ 共分散（Covariance） 𝑟 = 𝑠𝑥𝑦 𝑠𝑥 𝑠𝑦 =
1 𝑛 σ𝑖=1 𝑛 (𝑥𝑖 − ҧ 𝑥)(𝑦𝑖 − ത 𝑦) 1 𝑛 σ 𝑖=1 𝑛 (𝑥𝑖 − ҧ 𝑥)2 1 𝑛 σ 𝑖=1 𝑛 (𝑦𝑖 − ത 𝑦)2 Cov x, y = 𝑠𝑥𝑦 = 1 𝑛 ෍ 𝑖=1 𝑛 (𝑥𝑖 − ҧ 𝑥)(𝑦𝑖 − ത 𝑦) x y ҧ 𝑥 ത 𝑦 𝑥𝑖 − ҧ 𝑥 𝑦𝑖 − ത 𝑦 + + －－ ⚫ 相関（Correlation）＝標準化した共分散帰無仮説は相関が無い（ r=0 ）として、検定をかける。有意であれば、相関があると判断。

83 相関分析１ #Pearsonの積率相関係数 cor(dat1$rika1,dat1$rika2) #2変数の相関 cor(dat_seiseki) #3教科の相関 plot(dat_seiseki) #散布図 library(psych)
corr.test(dat_seiseki) #相関係数の検定 ⚫ 変数間の関連の強さは？すべて有意＊相関係数の目安 | r | = 0.7～1.0 強い相関 | r | = 0.4～0.7 中程度の相関 | r | = 0.2～0.4 弱い相関 | r | = 0～0.2 ほとんど相関なし

84 相関分析２ #カテゴリカル変数を含む相関 library(polycor) hetcor(dat_ksr, ML=T) #カテゴリカル変数を含めた相関行列 ML=最尤法 ⚫ 変数間の関連の強さは？
ポリシリアル相関：順序×連続変数の相関がみられる

85 クロス集計とカイ二乗検定賛成反対合計男子 a c n1 女子
b d n2 合計 m1 m2 N 賛成反対男子 a`=m1*n1/N c`=m2*n1/N 女子 b`=m1*n2/N d`=m2*n2/N 賛成反対男子 A=(a-a`)^2/a` C=(c-c`)^2/c` 女子 B=(b-b`)^2/b` A=(d-d`)^2/d` 例賛成反対合計男子 70 180 250 女子 30 120 150 合計 100 300 400 例賛成反対男子 62.5 187.5 女子 37.5 112.5 観測度数期待度数ずれ 𝜒2 = ෍ (観測度数 − 期待度数)2 期待度数 = 𝐴 + 𝐵 + 𝐶 + 𝐷 例賛成反対男子 0.9 0.3 女子 1.5 0.5

86 クロス集計 cross=table(dat1$school,dat1$sex) #クロス集計表の作成 cross prop.table(cross) #全度数を基準にした割合 library(vcd) assocstats(cross) #連関係数
クラメールのV chi=chisq.test(cross) #カイ二乗検定（独立性の検定） chi chi$residuals #残差分析絶対値1.96以上で有意 ⚫ 学校と男女の人数には関係がある？（人）女男北小 70 55 桜小 62 63 X-squared = 0.786, df = 1, p-value = 0.3752 有意に多い組み合わせはない有意でない：2変数に関連があるとは言えない ※ただし、2×2のクロス集計の場合は、正確確率検定を使用する。

線形モデルの拡張単回帰分析、重回帰分析、共分散分析

88 線形モデルの種類分析名従属変数独立変数一般化線形モデル一般線形モデル単回帰分析
量的データ（正規分布）量的データ（１つ）重回帰分析量的データ（正規分布）量的データ（複数）（t検定）量的データ（正規分布）質的データ（群＝２）（分散分析）量的データ（正規分布）質的データ（群≧３）ロジスティック回帰分析質的データ（2値）何でもOK 順序ロジスティック回帰分析質的データ（順序尺度）何でもOK 多項ロジスティック回帰分析質的データ（名義尺度）何でもOK 何でもOK 何でもOK

89 単回帰分析の数式表現数学学力(x) 物理点数(y) ො 𝑦 = 𝑎 + 𝑏𝑥
切片回帰係数従属変数の予測値独立変数回帰係数１単位 ො 𝑦 = −0.36 + 0.42𝑥 𝑦 = 𝑎 + 𝑏𝑥 + 𝑒 残差（誤差）残差回帰係数が大きいほどその変数の影響が強い従属変数 ◆回帰係数の推定（最小二乗法） 𝑄 = ෍ 𝑖=1 𝑁 𝑒2 𝑖 = ෍ 𝑖=1 𝑁 (𝑦𝑖 − ො 𝑦𝑖 )2 = ෍ 𝑖=1 𝑁 𝑦𝑖 − (𝑎 + 𝑏𝑥𝑖 ) 2 Qを最小化する aとbを求める

90 単回帰分析 #単回帰分析 res1=lm(dat1$rika_all~dat1$sansu_all) summary(res1) ⚫ 理科の成績を算数の成績で説明（予測）する。有意係数が0を上回る切片
係数決定係数 35%説明できる

91 重回帰分析の数式表現読解力数学力物理点数 ො 𝑦
= 𝑎 + 𝑏1 𝑥1 + ⋯ +𝑏𝑝 𝑥𝑝 偏回帰係数偏回帰係数＝他の独立変数の影響を取り除いたある独立変数の回帰係数（b）標準偏回帰係数＝標準化した偏回帰係数。測定単位に依存しないので、（β）比較が容易。標準化（すべての変数を平均０、分散１にそろえる）

92 （標準）偏回帰係数の解釈 ⚫ 偏回帰係数他の独立変数を一定（同程度）としたとき、 𝑥𝑝 が１単位増えればyが平均的に𝑏𝑝 増える ⚫ 標準偏回帰係数
他の独立変数を一定（同程度）としたとき、 𝑥𝑝 が１標準偏差増えればyが平均的に𝛽𝑝 標準偏差増える年収＝322.9+1.2*年齢＋8.7*勤続年数という重回帰式から年収（万円）に対する年齢（歳）と勤続年数（年）の影響はどのように解釈できるでしょうか。年収＝0.07*年齢＋0.52*勤続年数という標準偏回帰係数を用いた重回帰式から年収（万円）に対する年齢（歳）と勤続年数（年）の影響はどのように解釈できるでしょうか。また、年齢と勤続年数のどちらが大きな影響をもっているでしょうか。

93 その他の指標 ⚫ 決定係数（R2）観測値の散らばりに占める予測値の散らばりの割合 0 ≤ 𝑅2 ≤ 1
回帰モデルで従属変数の𝑅2 × 100％が説明できた ⚫ 多重共線性の指標（VIF）独立変数間の相関が強い→回帰係数の推定値の信頼性が低くなる＝重回帰分析の使用が不適切 𝑉𝐼𝐹 > 10 →多重共線性発生していると解釈

94 #重回帰分析 res2.1=lm(rika_all~sansu_all+kokugo_all,data = dat1) summary(res2.1) #偏回帰係数 dat_z=scale(dat_seiseki) #標準化 dat_z=data.frame(dat_z)
res2.2=lm(rika_all~sansu_all+kokugo_all,data = dat_z) summary(res2.2) #標準偏回帰係数 library(car) vif(res2.2) # VIF 重回帰分析 ⚫ 理科の成績を算数と国語の成績で説明（予測）する。有意 VIF>10だと多重共線性に問題あり。 VIF<2なら問題なし。 ↑どうやって解釈する？

95 一般線形モデル #一般線形モデル res3=lm(rika_all~sansu_all+grade+sex,data = dat1) summary(res3) ⚫ 理科の成績を算数の成績と学年・性別で説明（予測）する。有意
決定係数も増加している

96 共分散分析 #共分散分析 res4=lm(rika2~rika1+school,data = dat1) summary(res4) ⚫ 理科1回目を統制した場合、理科2回目の点数には実験群と統制群で差があるか有意でない
1回目の点数を統制すると、2回目の点数は桜小学校の方が、平均0.716点高い（有意ではない） ※交互作用はない前提での分析実験群：桜小統制群：北小

97 因果関係を示すためには？ ⚫ ミルの三原則 1. 原因は結果よりも時間的に先行していること 2. 原因と結果の間には関連があること 3. 他の因果的説明が排除されていること
• 回帰分析やパス解析で示せるのは２．のみ。 • 因果関係を示すためには、実験計画法や縦断調査が必要。

98 練習問題 1. ｔ検定をそのまま繰り返してはいけないのはなぜか説明せよ 2. 標準化した共分散を何と呼ぶだろうか 3. 偏回帰係数と標準偏回帰係数の違いを説明せよ

99 復習 1. 3群の平均値の差を検討する際，分散分析が有意であったことからどのようなことが言えるだろうか。 2. ピアソンの積率相関係数が取り得る値の範囲を答えよ。 3. 重回帰回帰分析において、独立変数間の影響の強さを比較したい場合、偏回帰係数と標準偏回帰係数のどちらを用い
るべきか。

多変量解析探索的因子分析、確認的因子分析、構造方程式モデリング、クラスター分析 100

101 構成概念 ⚫ 人に関する現象を説明するために、研究者によって人為的に構成された概念例）思いやり、社交性、理解度、科学的思考力、批判的思考態度 ⚫ 構成概念の影響を受けるであろう複数の行動や態度を測定し、構成概念の存在を検証するマンガ
好き行動１（読む）行動２（買う）行動３（話す）理論世界現実世界

102 心理尺度の測定法 ⚫ 言葉による質問によって行動や考え方を測るものを心理尺度と呼ぶ ◆ 様々な測定法がある ★リッカート法（評定総和法） Q1. このマンガについてよく知っている
非常に当てはまるやや当てはまるあまり当てはまらないまったく当てはまらないどちらでもない ★サーストン法（等現間隔法）そのマンガについて知らないことはないそのマンガを週刊誌で毎週読んでいるそのマンガの単行本が出たら読むそのマンガを読もうと思ったことがあるそのマンガの名前も聞いたことが無い 5.12点 4.05点 3.24点 1.93点 1.13点 ※最も近い項目を選ぶ ★ガットマン法（強度分析法） ★SD法（意味微分法）１２３４５

103 構成概念妥当性 construct validity ⚫ 構成概念妥当性（＝測りたいものを測れているか） 1. 内容的な側面：項目内容が構成概念の定義と比べて適切か（網羅しているか） 2.
本質的な側面：反応プロセスが想定通りか 3. 構造的な側面：内的なまとまり（因子構造）が理論や仮説と一致しているか 4. 一般化可能性の側面（信頼性）：測定誤差が小さいか（繰り返し同じ結果になるか） 5. 外的な側面：外的変数との間に予測通りの関係（相関）が見られるか

104 因子分析の基礎 (factor analysis) ⚫ 観測変数の背後にある因子（構成概念, 潜在変数）を探る ★探索的因子分析（exploratory factor
analysis: EFA） ★確認的因子分析（confirmatory factor analysis: CFA）親しみやすい人懐っこい有能な知的な温かさ因子有能さ因子理科数学国語社会理系因子文系因子観測変数1 = 𝑎1 ∗ 𝐹1 + 𝑏1 ∗ 𝐹2+誤差e1 𝑎1 𝑎2 𝑎3 𝑎4 𝑏1 𝑏2 𝑏3 𝑏4 𝐹1 𝐹2 … 第１因子の影響第２因子の影響

105 因子負荷量 ⚫ 因子負荷量：因子から観測変数への影響力の強さ ⚫ 共通性：因子によって説明される要素 ⚫ 独自性：各項目が持つ独自の要素（因子によって説明されない部分）因子
共通性独自性共通性独自性共独自性共通性独 ◼ 因子分析の結果の例（1因子・2因子）項目因子負荷量共通性物理が好き .90 .80 化学が好き .82 .66 生物が好き 74 .53 地学が好き .68 .48 項目 F1 F2 共通性親しみやすい .68 .29 .55 人懐っこい .79 .15 .65 有能な .20 .81 .69 知的な .22 .88 .82

106 因子軸の回転 ⚫ 特別な処理をせずに求めた因子負荷量を初期解と呼ぶ ⚫ 初期解の解釈が難しい場合、因子軸を回転させる（因子負荷量を変換する）ことで因子が識別しやすくなる（※2因子以上の時） ★斜交回転例）プロマックス回転
★直行回転例）バリマックス回転因子1 因子1 因子2 項目 F1 F2 共親しみやすい .70 -.24 .55 人懐っこい .69 -.41 .65 有能な .68 .47 .69 知的な .75 .51 .82 項目 F1 F2 共親しみやすい .68 .29 .55 人懐っこい .79 .15 .65 有能な .20 .81 .69 知的な .22 .88 .82 ◼ 回転前（初期解） ◼ 回転後

107 探索的因子分析の手順 1. 因子数のあたりをつける ➢ 平行分析、ガットマン基準、スクリーテスト 2. 候補の因子数で因子分析を行う 3. 複数因子で初期解の解釈が難しい場合は、回転を行う
4. 因子負荷量が低い項目（0.4以下）などは外し、再度、因子分析を繰り返す 5. 信頼性係数を確認する 6. 因子構造を解釈し、因子名を付ける

108 探索的因子分析１ #探索的因子分析##### #データの取り出し dat_CT=dat1[,c(16:22)] #16～22列目の取り出し ⚫ 批判的思考：何を信じ、何を行うかの決定に焦点を当てた、合理的で省察的な思考（Ennis, 1987）。
←Q1~Q7（7件法） 1 いつも偏りのない判断をしようとする 2 物事を決めるときには、客観的な態度を心がける 3 できるだけ多くの立場から考えようとする 4 自分が偏った見方をしていないかふり返るようにしている 5 たとえ意見が合わない人の話にも耳を傾ける 6 自分のと異なる考えの人とも議論する 7 物事を見るときは様々な立場から見る

109 探索的因子分析２ #平行分析 fa.parallel(dat_CT) ⚫ 何因子構造だろう？ →平行分析／ガットマン基準／スクリーテスト１因子構造を示唆１～２の間で線が重なっている→1因子構造 △がFA（Factor
Analysis）

110 探索的因子分析３ #スクリープロット cor=cor(dat_CT) eigen=eigen(cor)$values #固有値 eigen plot(eigen, type="b", main="Scree
Plot",xlab="Number", ylab="Eigenvalue") ⚫ ガットマン基準：値が1.0以上の固有値の数を因子数とする ⚫ スクリーテスト：固有値の推移がなだらかになる直前までの固有値の数を因子数とする２からなだらかになっているので、因子数は１１因子構造を示唆 1因子を最有力候補として探索的因子分析を進める。

111 探索的因子分析４ #因子数1の検討 fit1 = factanal(x=dat_CT, factors=1, fm="ml", rotation="none") print(fit1)
fit2 = factanal(x=dat_CT, factors=1, fm="ml", rotation="promax") print(fit2, cutoff=0.35) #因子負荷量0.35以下を非表示 ⚫ 因子数１として因子負荷を推定 1因子の場合、回転は不要。因子間に相関が仮定される場合プロマックス回転（斜交回転）。推定方法は最尤法がおすすめ。 ←最尤法、プロマックス回転 ←因子負荷量（0.4以上ならOK）本来はこの後、因子名を考えるなどの作業がある。

112 探索的因子分析５ #信頼性係数の算出（アルファとオメガ） psych::alpha(dat_CT)#α係数 omega(nfactors = 1,dat_CT) #ω係数 ⚫ 信頼性の確認
ω係数の方がより正確な信頼性の推定値。ただし、現実にはα係数とほぼ同じ値になる。両方を報告することを推奨。 0.8以上であれば信頼性が高い ←α係数 ←ω係数 #2因子の場合 psych::alpha(dat_因子１)#α係数1 psych::alpha(dat_因子２)#α係数2 omega(nfactors = 1,dat_因子１) #ω係数1 omega(nfactors = 1,dat_因子２) #ω係数2 信頼性係数は、因子ごとに計算する。

113 尺度得点との相関 #相関の検討 dat1$CT=rowMeans(dat1[,c(16:22)]) #指定行の平均値を変数として作成 cor(dat1$rika_all,dat1$CT) #理科とクリシンの相関 cor(dat1$sansu_all,dat1$CT) #算数とクリシンの相関 cor(dat1$kokugo_all,dat1$CT)
#国語とクリシンの相関 ⚫ クリシン得点の変数を作成し、成績との相関を見てみよう ←算数と理科では弱い相関がみられる＊相関係数の目安 | r | = 0.7～1.0 強い相関 | r | = 0.4～0.7 中程度の相関 | r | = 0.2～0.4 弱い相関 | r | = 0～0.2 ほとんど相関なし

114 報告例（探索的因子分析）項目因子 F1 F2 (18) 深く考えなければならないような状況は避けようとする。
.84 -.04 (15) 考えなければならない時しか考えない方である。 .78 -.03 (16) 深く考えなければ切り抜けられないような事態に対処することは任されたくない。 .73 .02 (14) 長時間一生懸命考えることは苦手な方である。 .69 .03 (4) 読んだものがよく理解できないとき、それを放り出し忘れてしまう。 .53 .13 (21) 常に頭を使わなければ満足できない。 .48 -.05 (17) 考えることは楽しくない。 .05 .73 (7) 新しい考え方を学ぶことにはあまり興味がない。 -.10 .71 (1) いろいろな問題の新しい解決方法を考えることは楽しい。 -.02 .62 (24) 問題の答えがなぜそうなるのかを理解するよりも、単純に答えだけを知っている方がよい。 -.08 .57 (8) なぜそうなるのかを理解しようとするよりも、物事をあるがままに受け取るほうが好きだ。 .06 .51 (19) 自分が人生で何をすべきかについて考えるのは好きではない。 .06 .51 負荷量の平方和 2.87 2.29 Cronbachのα係数 .84 .76 McDonaldのω係数 .88 .82 因子間相関 F2 .46 表に基づき各因子を検討すると、第１因子は、「深く考えなければならないような状況は避けようとする」、「考えなければならない時しか考えない方である」、「長時間一生懸命考えることは苦手な方である」など、じっくりと考えることを楽しむ思考傾向に関する質問項目で構成されているため、第１因子を「熟慮動機」と解釈した。第２因子は、「考えることは楽しくない」、「新しい考え方を学ぶことにはあまり興味がない」、「いろいろな問題の新しい解決方法を考えることは楽しい」など、考えることを楽しむ思考傾向に関する質問項目で構成されているため、第２因子を「思考を楽しむ動機」と解釈した。次に、各因子の信頼性について検討する。表に示すCronbachのα係数およびMcDonaldのω係数が0.76 ~ 0.88となったことから、内部一貫性が保障されたと考え、十分な信頼性があると判断した。固有値の減衰状況および平行分析の結果を踏まえ、因子数を２として探索的因子分析（最尤法・プロマックス回転）を行った結果を表にしめす。

115 階層的クラスター分析の基礎 ⚫ 似た項目ではなく似た人をいくつかのクラスター分類する

116 クラスター分析１ #クラスター分析の実行 z=scale(dat_seiseki) #得点を標準化 z=data.frame(z) #データフレーム形式に戻す distance=dist(z)^2 #距離の計算 res=hclust(distance,method
= “ward.D”) #ward法 plot(res) #デンドログラム作図 cluster=cutree(res, k=4) # K=でいくつのクラスターに分けるか指定 cluster=as.factor(cluster) # 因子型に変更 table(cluster) # それぞれのクラスターの人数確認 ⚫ 被験者にはどんな特徴を持つグループが存在するのかそれぞれのクラスターの人数

117 クラスター分析２ #クラスター分けの結果を結合 x=cbind(z, cluster) # 標準得点のデータフレーム y=cbind(dat_seiseki, cluster) #
素点のデータフレーム #クラスターごとの平均の確認 tapply(x$kokugo_all, x$cluster, mean) #クラスターごとの国語得点 tapply(x$sansu_all, x$cluster, mean) #クラスターごとの算数得点 tapply(x$rika_all, x$cluster, mean) #クラスターごとの理科得点 ⚫ 被験者にはどんな特徴を持つグループが存在するのかクラスター１：国語×算数△理科× 「文字苦手グループ」クラスター２：国語×算数×理科× 「勉強苦手グループ」クラスター３：国語〇算数△理科〇「論理的思考グループ」クラスター４：国語△算数〇理科〇「理系グループ」

構造方程式モデリングの世界分析の統一的な枠組み Structural Equation Modeling (SEM) （共分散構造分析）

119 構造方程式モデリング（SEM）のアプローチ ① 複数の変数間の関連性について、特定の仮説モデルを設定 ② その仮説モデルの妥当性を検証 ③ モデルが正しいとした場合の変数間の定量的な関連性
を推定仮説モデル：変数間にどのような因果関係や相関関係があるかという理論的な仮説を表現したモデル。パス図という図で視覚的に表現する。仮説モデルの妥当性：適合度という概念で検証する。適合度とは、解析に使用したデータと、仮定されたモデルの間の一致度を意味し、適合度が高いほど、モデルの妥当性が高いことが示唆される。定量的な関連性：パス係数（パラメータ推定値）と呼ばれる値で表現。仮定したモデルのもとでの変数間の因果関係や相関関係の強さに関する推定値を意味する。

120 補足：パス図観測変数潜在変数観測変数とは、直接測定されている変数のこと。解析に使用するデータセットを構成しているもの。潜在変数（因子）とは、直接は測定されず、複数の観測変数を介して測定される（c.f. 構成概念） X1
Y1 X2 Y2 単方向の矢印は、因果関係を表す。両方向の矢印は、相関関係を表す。外生変数（独立変数）：どの変数からも単方向の矢印を受けない変数内生変数（従属変数）：１つ以上の変数から単方向の矢印を受ける変数

121 構造モデルと測定モデル F1 F3 F2 ＜構造モデル＞複数の概念感の因果関係に関する仮説を表すもの。因果関係に関する仮説は、先行研究の知見や理論的な検討によって、先験的に設定される必要がある。
F X1 X2 X3 ＜測定モデル＞直接観測できない構成概念を、潜在変数（因子）として複数の観測変数を通して定量化するもの。（≒確認的因子分析）＋＝＜フルSEMモデル＞構造モデルと測定モデルを組み合わせたもの。

122 練習問題 F1 友人関係 F3 抑うつ F2 家族関係 X１ X２
X３ X４ X５ X６ X７ X８ d1 e1 e2 e3 e4 e5 e6 e7 e8 e1~e8, d1 : 誤差変数内生変数には、他の変数によって説明されない成分（残差）が仮定され、誤差変数と呼ばれる。 Q1 潜在変数はいくつあるか。 Q2 どの変数間に、相関関係が仮定されているか。 Q3 外生変数をすべて挙げよ。 Q4 このパス図が示す、仮説モデルを説明せよ。

123 補足：適合度１ ⚫ 仮説モデルのもとでの分散・共分散行列と、実際の分散・共分散行列のズレを評価指標説明範囲良好悪い
χ2値因果モデル全体が正しいかどうかの指標。 χ2≧0 有意でなければ OK p>0.05 SRMR モデルとのズレの残差に関する指標。 SRMR≧0 .08以下（良い） .10以下（許容） 0.1以上 RMSEA モデルの分布と真の分布の乖離を１自由度あたりの量として表現した指標。 RMSEA≧ 0 0.05未満 0.1以上 AIC 複数のモデルを比較する際に、モデルの相対的な良さを評価する指標。 - 想定的に低いほど、予測力の高いモデル BIC 表１小さい方が良い指標

124 補足：適合度２ ⚫ 仮説モデルのもとでの分散・共分散行列と、実際の分散・共分散行列のズレを評価指標説明範囲良好悪い
GFI モデルの説明力の指標。 GFI≦1 0.95以上 0.9未満 AGFI GFIの自由度を調整した指標。 AGFI≦GFI 0.95以上 0.9未満 CFI 独立モデル（すべての変数が無相関）を基準とした場合のモデル適合を評価する指標。 0~1 0.90以上（0.95以上） 0.9未満表２大きい方が良い指標 ※ただし、適合度の高いモデルは、多数存在する「ありうるモデル」の中の１つにすぎない。 →十分な理論的根拠に基づく判断が必要 ◆ 適合度が悪かったら、モデルを改善して、再度推定してみる。

125 構造方程式と共分散構造 X 1 友人関係 X 2 家族関係 Y 1
抑うつ d 1 φ12 γ11 γ12 ＜推定したい値＞パス係数=γ11, γ12 誤差分散(d1 )=θ1 分散( X1 )=φ11, 分散( X2 )=φ22 共分散(X1, X2 )= φ12 γ◯△ ◯＝従属変数の番号 △＝独立変数の番号共分散の値を、両変数の標準偏差の積で割って標準化したものが相関係数＊パス係数回帰分析における回帰係数（or偏回帰係数）と数学的に同一。独立変数が１単位上昇したときの充足変数の変化の期待値を意味する。方程式（構造方程式）で表すと・・・ 𝑌1 = 𝛾11 𝑋1 + 𝛾12 𝑋2 + 𝑑1 ＜得られている値＞観測変数=X1 , X2 , Y1 X1 X2 Y1 X1 φ11 X2 φ12 φ22 Y1 𝛾11 𝜑11 + 𝛾12 𝜑22 𝛾11 𝜑12 + 𝛾12 𝜑22 𝛾2 11 𝜑11 + 2𝛾11 𝛾12 𝜑12 + 𝛾2 12 𝜑22 + 𝜃1 表構造モデルの共分散構造 ←対角成分は、分散その他の成分は、共分散６個のパラメータ

126 具体例（構造モデル） X1 X2 Y1 X1 1.526 X2 0.912 3.225
Y1 1.666 2.310 9.749 表サンプルの分散・共分散行列 φ 11 = 1.526 φ 12 = 0.912 φ 22 = 3.225 𝛾11 𝜑11 + 𝛾12 𝜑22 = 1.666 𝛾11 𝜑12 + 𝛾12 𝜑22 = 2.310 𝛾2 11 𝜑11 + 2𝛾11 𝛾12 𝜑12 + 𝛾2 12 𝜑22 + 𝜃1 = 9.749 ６個の連立方程式から、残りのパラメータを算出 𝛾12 = 0.490 𝛾11 = 0.799 𝜃1 = 7.286 自由度＝連立方程式の数－推定されるパラメータの数が、０以上でないと推定できない。

127 測定方程式と共分散構造＜推定したい値＞負荷量=λ11～ λ41 誤差分散(d1 )=θ1 分散( e )=θ1
～ θ4 *分散( F1 )=φ1, 方程式（測定方程式）で表すと・・・ 𝑋1 = 𝜆11 𝐹1 + 𝑒1 ＜得られている値＞観測変数=X1 , ~ X4 X1 X2 X3 X4 X1 𝜆2 11 𝜑1 + 𝜃1 X2 𝜆11 𝜆21 𝜑1 𝜆2 21 𝜑1 + 𝜃2 X3 𝜆11 𝜆31 𝜑1 𝜆21 𝜆31 𝜑1 𝜆2 31 𝜑1 + 𝜃3 X4 𝜆11 𝜆41 𝜑1 𝜆21 𝜆41 𝜑1 𝜆31 𝜆41 𝜑1 𝜆2 41 𝜑1 + 𝜃4 表測定モデルの共分散構造１０個のパラメータ F 1 X 1 X 2 X 3 X 4 e1 e2 e3 e4 𝑋2 = 𝜆21 𝐹1 + 𝑒2 𝑋3 = 𝜆31 𝐹1 + 𝑒3 𝑋4 = 𝜆41 𝐹1 + 𝑒4 𝜆11 𝜆21 𝜆31 𝜆41 ↑どんな値も取りうるから厄介

128 補足：lavaan記法の基礎 ◼ lavaan記法の基礎メタ認知学力朝食成績 CT Q1
Q5 Q7 model=" CT=~Q1+Q5+Q7 " model=" 学力~メタ認知 " model=" 朝食~~成績 "

129 EFAとCFA ⚫ 探索的因子分析（EFA）と確認的因子分析（CFA）は想定するモデルが異なる • すべての因子からすべての観測変数への影響を仮定 • 明確な仮説がない場合 •
影響を与えるのは１つの因子 • 明確な仮説がある場合、すでに開発されているものを使用する場合など

130 確認的因子分析１ #確認的因子分析##### #SEM library(lavaan) #1因子モデル model1=" F1=~CT1+CT2+CT3+CT4+CT5+CT6+CT7 " fit1=cfa(model1,data=dat_CT)
#確認的因子分析 summary(fit1, standardized=T, fit.measures=T) modificationIndices(fit1, minimum.value = 100) #修正指標 ⚫ 構造方程式モデリングの枠組みで、確認的因子分析を行う。 ML=最尤法で推定 250人のデータ ←標準化した係数=T 適合度表示=T

131 確認的因子分析２ ⚫ 出力の解釈 ←標準化推定値 CFI=1.00, RMSEA=0.00, SRMR=0.03 →十分な適合度

132 確認的因子分析３ #SEM図のプロット library(semPlot) semPaths(fit1, "std", rotation = 2, edge.label.cex
= 1.2, style="lisrel",fade=F,theme='gray',label.cex=1.2,sizeMan = 9) ⚫ 確認的因子分析の結果を、パス図で表現する。

133 報告例１（確認的因子分析） ◼ 先行研究の知見に基づき、批判的思考に1因子構造を想定した確認的因子分析を行った。分析の結果、適合度指標は、CFI=1.00, TLI=1.00, RMSEA=.00(90%CI [.00, .06]),
SRMR=0.03であり、データに対するモデルの当てはまりは十分であると判断された。

134 報告例２（確認的因子分析）３つの因子構造モデルおよび神山・藤原（1991）による１因子モデルについて、確認的因子分析（CFA）による比較を行うことにした。４つのモデルにおける適合度指標および情報量基準を表に示す。指標４因子モデル２因子モデル修正版２因子モデル１因子モデル
（神山・藤原，1991） CFI 0.83 0.83 0.98 0.63 TLI 0.80 0.80 0.98 0.57 RMSEA [90%CI] (p値※) 0.09 [0.08, 0.10] (0.00) 0.10 [0.08, 0.11] (0.00) 0.03 [0.00, 0.07] (0.72) 0.13 [0.11, 0.15] (0.00) SRMR 0.08 0.08 0.05 0.10 AIC 6544.02 5877.17 4168.24 5422.28 BIC 6523.04 5971.37 4235.52 5503.02 表適合度指標および情報量基準良好な適合度指標値の範囲として小島（2005）は、「CFI≧0.95、RMSEA＜ 0.05、SRMR＜0.05」という基準を提案している。小島（2005）による提案に基づき表を解釈した結果、適合度が基準を満たし、相対的に予測力が高い修正版２因子モデルを採択することにした。

135 構造方程式モデリング１ #構造方程式モデリング##### library(lavaan) model2=" ct=~CT1+CT2+CT3+CT4+CT5+CT6+CT7 rika_all~ct " fit2=sem(model =
model2,data = dat1) summary(fit2, standardized=T, fit.measures=T) #SEM図のプロット library(semPlot) semPaths(fit2, "std", rotation = 2, edge.label.cex = 1.2, style="lisrel",fade=F,theme='gray',label.cex=1.2,sizeMan = 9) ⚫ 理科の成績をクリシンで説明（予測）する。＊適合度 CFI=.993, TLI=.990, RMSEA=.026, SRMR=.032 有意標準化係数 ↑標準化した係数 ↑適合度

136 構造方程式モデリング２ #sem model3=" ct=~CT1+CT2+CT3+CT4+CT5+CT6+CT7 risu=~sansu1+sansu2+sansu3+rika1+rika2+rika3 risu~ct " fit3=sem(model =
model3,data = dat1) summary(fit3, standardized=T, fit.measures=T) lavInspect(fit3, “rsquare”) #決定係数 #SEM図のプロット library(semPlot) semPaths(fit3, "std", rotation = 2, edge.label.cex = 1.2, style="lisrel",fade=F,theme='gray',label.cex=1.2,sizeMan = 9) ⚫ 理数能力をクリシンで説明（予測）する。＊適合度 CFI=.979, TLI=.975, RMSEA=.033, SRMR=.050 理数の説明率=17.9%

137 補足：SEMのサンプルサイズ ✓ 結論：最低でも150、できれば200以上 • N=100~150が目安（Tinsley & Tinsley, 1987; Ding,
Velicer & Harlow, 1995） • N=200が目安（Kline, 2005） • 確認的因子分析では、N=150が合理的（Muthen & Muthen, 2002） • 多母集団分析では、各集団につき100のケースが必要（Kline,2005） • 観測変数の10倍のデータが最低限必要（Nunnally, 1967） • 自由パラメータの10~20倍（Kline, 1998）

138 補足：その他のモデル ⚫ SEMではほかにも様々なモデルが表現できます。各自でさらに調べてみてください。 • MIMICモデル • 2次因子分析モデル •
PLS (Partial Least Squares) • 多母集団分析

139 演習１ ⚫ data2.xlsxを使用して分析 Q1.各教科の平均得点の変数を作成せよ Q2.学年間で、理科の平均得点に差があるかを検討せよ Q3.男女間で、算数の平均得点に差があるかを検討せよ

140 演習２ Q4.メタ認知尺度の因子構造について検討せよ Q5.仮説モデルを立て、構造方程式モデリングを用いた分析を実行せよ。 END

補足：例数設計 141

142 検定の基礎検定の結果差がある差があるとはいえない真実差がある正しい判断（1-α）
第２種の過誤（β）差がない第１種の過誤（α）正しい判断（1-β）危険率（α）=0.05 検定力（1-β）＝0.8 が推奨されている →効果量さえ仮定すれば、必要なサンプルサイズが見積れる

143 例数設計 #例数設計##### #対応のないt検定の事前分析 power=検定力, delta=効果量, sig.level=危険率 power.t.test(power = 0.8,
delta = 0.2, sig.level = 0.05, type = "two.sample") power.t.test(power = 0.8, delta = 0.5, sig.level = 0.05, type = "two.sample") #対応のあるt検定の事前分析 power.t.test(power = 0.8, delta = 0.2, sig.level = 0.05, type = "paired") power.t.test(power = 0.8, delta = 0.5, sig.level = 0.05, type = "paired") ＊ Cohenの基準 d=0.2 小さな効果 d=0.5 中程度の効果 d=0.8 大きな効果 →394名必要サンプルサイズが、、、多すぎると差の大きさに関わらず有意になってしまう少なすぎると差の大きさに関わらず有意にならない

144 さらなる学習のために＊多変量解析全般川端・岩間・鈴木（2018）『Rによる多変量解析入門』オーム社＊構造方程式モデリング村上ら（2018）『心理学・社会科学研究のための構造方程式モデリング: Mplusによる実践
基礎編』ナカニシヤ出版＊例数設計豊田秀樹（2009）『検定力分析入門』東京図書

項目反応理論 145

146 古典的テスト理論の問題点 ⚫ 仮に難易度が同じ２つのテストがあったとして、ある受験者が一方のテストを夏に受験して80点、また他方のテストを秋に受験して90点であったとする。では、受験者集団の中におけるこの受験者の順位（偏差値）も上昇しているか？ ⚫ テスト得点(例えば90点)が与える情報は、当該のテス
ト問題や受験者集団の性質に依存したものとなる。 ⚫ 全国模試が実施され、ある学校の平均点が、80点であった昨年度よりも伸びて、今年度は90点であった。その学校の生徒達の学力が平均的に高くなったと考えられるか？ →×(テストが簡単になっただけかも） →×（他の受験者の方が平均的により高く得点が上昇しているかも）

147 古典的テスト理論 ⚫ 集団内における位置で個人の成績を判定 ⚫ 各問題の正答率がその問題の困難度 ⚫ 問題Aの正答者が問題Bも正答している（orどちらも不正解）ような傾向だと、一貫している（識別力が高い）と判断される。
⚫ 古典的テスト理論の問題点 • 困難度や識別力といった項目に関する指標が、受験者集団に依存する（標本依存性） • テスト得点といった受験者の能力に関する情報が、テストの項目に依存する（項目依存性）

148 項目反応理論（IRT） ⚫ 2種類の依存性を克服できる現代テスト理論 • 項目に関する指標と、受験者の能力に関する指標を切り分けて推定できる。 ⚫ 項目反応理論のメリット •
誰がどの問題を解いたとしても、統一した基準で成績を算出できる（ただし、等化を行う必要あり） →項目依存性・集団依存性の克服 • 測定精度をきめ細かく確認できる • 平均点をテスト実施前に制御できる • テスト得点の対応表が作成できる • 受験者の能力ごとに最適な問題を瞬時に選び、その場で出題できる（c.f. コンピュータ適応型テストCAT）

149 項目反応理論の基本 ⚫ 項目反応理論では，受験者集団の性質に依存しない潜在特性値（能力値）θ を導入する ⚫ θは直接観測できないが，その分布は正規分布していると仮定する
⚫ 横軸に特性値θを，縦軸に項目への正答率を配した関数を項目特性曲線(ICC)と呼び、特性値θと項目の特性（困難度・識別力）を同時に検討する。

150 項目特性曲線（ICC） • ICC は個々の項目の特徴を表す。項目の数だけある。 • 横軸は受験者の特性値θ、縦軸は当該能力における正答率となる • 識別力
𝑎 は、各曲線の傾き立ち上がりの急さを表す • 困難度 𝑏 は、正答率が0.5 になる能力値 θ の値を表す

151 ICCに当てはめるモデル

152 測定精度項目情報関数(IIF)

153 測定精度テスト情報関数(TIF)

154 IRT使用の前提以下の条件が仮定できる時のみ，IRT は使用可能 1. 尺度の構成概念が 1 次元（1因子）である →因子分析の考え方で確認 2.
局所独立性が保たれている ※局所独立：「能力 θ を固定した時、各項目への反応は互いに独立である」ということ • 能力と関係なく「ある項目に正解できた人は別の項目にも正解しやすい」という傾向がある場合、局所依存性があるという • よくある例：数学のテストで，問 1 に正解していることが問2を解く上で必要である（項目連鎖）

155 事例（全国学調の追加分析）平成27年度文科省委託調査研究「学力向上に資する教科指導の改善に関する調査研究」より

156 事例（全国学調の追加分析）平成27年度文部科学省委託調査研究「学力向上に資する教科指導の改善に関する調査研究」より

157 2PLに基づく分析１ #項目反応理論（IRT）に基づく分析##### #パッケージの読み込み library(ltm) library(irtoys) library(psych) ##データの読み込み #ワーキングディレクトリの確認 getwd()
#csvから読み込み方法 setwd("C:/Users/2ken/Desktop/practice2019") dat2=read.csv("IRT1.csv") head(dat2) ⚫ IRT用の分析対象データを読み込む誤答０正答１

158 2PLに基づく分析２ #古典的テスト理論における困難度の確認 colMeans(dat2) #古典的テスト理論における識別力の確認 descript(dat2) ⚫ 古典的テスト理論に基づく分析 →困難度（正答率）が低いのは？ →識別力（合計点との各項目の相関）

159 2PLに基づく分析３ #2PLモデル ip1=est(resp = dat2,model = "2PL",engine = "ltm")
ip1 ip2=ltm(dat2~z1) #別の関数でも同じ結果 summary(ip2) ⚫ 2PLモデルの推定困難度識別力ブロイデン・フレッチャー・ゴールドファーブ・シャンノ法（BFGF法）

160 2PLに基づく分析４ #項目特性曲線 ICCの表示 icc=irf(ip1$est) plot(icc,label = T,co=NA,main = "ICC")
⚫ 項目特性曲線（ICC）のプロット正答率50%を超える能力値Θの値が困難度

161 2PLに基づく分析５ #テスト特性曲線 TCC tcc=trf(ip$est) plot(tcc,main = "TCC") ⚫ テスト特性曲線（のプロット）
各能力におけるテスト得点の期待値平均位の能力の受験者の期待得点は5点

162 2PLに基づく分析６ #個人適合度 Z3 pfit=api(dat2,ip1$est) pfit which(abs(pfit)>2.0) #適合度の悪い被験者 #項目適合度 G2
j=9 #項目番号（例：項目9） itf(dat2,ip$est,item=j,main = paste0("項目",j)) #有意でなければよい適合 ⚫ 適合度の確認 IRTモデルはデータに適合している

163 2PLに基づく分析７ #項目情報関数 IIF iif=iif(ip1$est) plot(iif, label=T, co=NA, main =
"IIF") #テスト情報関数 TIF tif=tif(ip1$est) plot(tif, laber=T, co=NA, main = "TIF") ⚫ IIFとTIFのプロット θが高い／低い人に適した問題がある幅広い能力値θに適応したテストになっている

164 2PLに基づく分析８ #能力値Θの推定 MLres=mlebme(resp = dat2,ip=ip1$est,method = "ML") #ML=最尤法 head(MLres)
BMres=mlebme(resp = dat2,ip=ip1$est,mu=0,sigma=1,method="BM") #MAP推定 head(BMres) EAPres=eap(resp = dat2,ip=ip1$est,qu=normal.qu()) #EAP推定 head(EAPres) ⚫ 能力値Θの推定迷ったらEAP推定１～６番目の被験者の能力値θと標準誤差

ベイズ統計学に基づく分析 165

166 統計的仮説検定の限界 ⚫ 手続きの煩雑さ • 帰無仮説を立てて棄却するという背理法の考え方 ⚫ P値という概念の難しさ • 帰無仮説が正しいと仮定した場合の、今回より極端な
データが得られる確率→なんじゃそりゃ ⚫ P値ハッキングに起因する、再現性問題 • 心理学の研究の再現率が低い問題 • 有意になるまでサンプルを追加している？ ⚫ 複雑なモデルへの対応が困難

167 ベイズの定理事後分布 = 尤度 × 事前分布定数事前分布：パラメーターに関する事前知識（仮説）事前知識がない場合は、広い値を仮定しておく
事後分布：データを得た後の、パラメーターについての推論（事前分布とデータから推定した結果）尤度（確率モデル）：データの生成メカニズム（正規分布が使われることが多い） ⚫ 右辺の式に得られたデータを当てはめて、パラメーターを推定する。

168 ベイズ推定 ⚫ 前ページの式は、積分計算が複雑で、解析的にはとけない →シミュレーションを用いる ⚫ マルコフ連鎖モンテカルロ法（MCMC）を使って、事後分布を反映した乱数を大量に発生させる →その乱数分布を事後分布とする ⚫
MCMCを実行するには、いくつか追加する必要があり１．Rtools(インストールの際にオプションにチェックを入れる) ２．rstanパッケージ

169 母平均の差の検討１ ##母平均の差の推定１（ｔ検定に相当） #変数作成 x=dat1$rika_all[dat1$grade=="5"] #第1群の指定 y=dat1$rika_all[dat1$grade=="6"] #第2群の指定 nx =
length(x) #xのサンプルサイズ ny = length(y) #yのサンプルサイズ J=1-(3 /(4*((nx+ny-2)-1))) #効果量gを算出するための補正項 data=list(N1=nx, N2=ny, x1=x, x2=y, c=0, J=J) #リスト形式. c=0→差が0以上の確率 #対応のないｔ検定（頻度論の検定） t.test(y, x, var.equal=F) #F=Welchのt検定 ⚫ 5年よりも6年の理科の成績の方が高いという仮説が正しい確率は？この後で使うstanは、リスト形式でデータを渡す必要がある。これからやることは、対応のないt検定のベイズ版。

170 母平均の差の検討２ pairedF <- ' data{ int<lower=0> N1; int<lower=0> N2;
real x1[N1]; real x2[N2]; real c; real J; } parameters{ real mu1; real mu2; real<lower=0> sigma1; real<lower=0> sigma2; } model{ x1 ~ normal(mu1,sigma1); x2 ~ normal(mu2,sigma2); } generated quantities{ real delta; real d_overC; real cohen_d; real hedges_g; delta = mu2 - mu1; d_overC = (delta>c? 1:0); cohen_d = delta /((sigma1^2*(N1-1)+sigma2^2*(N2-1)) /((N1-1)+(N2-1)))^0.5; hedges_g = cohen_d*J; } ' ⚫ 5年よりも6年の理科の成績の方が高いという仮説が正しい確率は？どんなデータを扱うか何のパラメータの確率分布を推定するかどんな生成メカニズムか（尤度） normal=正規分布その他、計算して欲しい値

171 母平均の差の検討３ #ベイズ推定 require(rstan) rstan_options(auto_write = TRUE) #コンパイルした結果を保存する options(mc.cores =
parallel::detectCores()) #複数のCPUコアを並列で使う fit<-stan(model_code=pairedF,data=data,chains=5,warmup=1000,iter=21000) #(21000-1000)*5の乱数を発生させる print(fit,digits_summary=3) #小数点以下3位までで表示 ⚫ 5年よりも6年の理科の成績の方が高いという仮説が正しい確率は？ 1.2以下だったら適切に収束 95%確信区間（95%の確率でこの範囲に入る）点推定値（EAP推定値） ※結果は毎回少し変わる可能性あり

172 報告例理科の点数について，「5年生の平均値（μ 5 ）よりも6年生の平均値（μ 6 ）の方が高い」という仮説を立て，後述のモデルのもとパラメタの事後分布において仮説が正しい確率（p）をベイズ統計学に基づき算出することにした．ベイズ推定に際しては，長さ21000 のチェインを５つ発生させ，バーンイン期間を1000とし，MCMC法の一種であるHMC法
によって得られた100000個の乱数で事後分布を近似した．なお，確率モデルとして， μ 5 とμ 6 の事前分布には正規分布を用いた．収束判定指標RhatはすべてのパラメータにおいてRhat <1.1であり，パラメータ・生成量の全てに関して有効標本数（n-effect）が 80000個以上と十分な数であったことから，各パラメータは事後分布からの乱数の近似と判断した．学年ごとの点数の母平均と効果量（Cohenの d ）のEAP推定値および仮説が正しい確率を表に示す．表より，設定したモデルのもとパラメタの事後分布において仮説が正しい確率は100%であり，6年生の平均値が高い傾向にあると解釈できる．表母平均および母平均の差についての推定 EAP p.Sd 2.5% 50% 97.5% Rhat μ5 69.325 0.630 68.093 69.324 70.558 1 μ6 76.891 0.609 75.702 76.892 78.089 1 p (μ6 -μ5 >0) 1.000 0.000 1.000 1.000 1.000 - d 1.096 0.136 0.831 1.096 1.362 1

173 母平均の差の検討４ x=dat_seiseki #データ n <- nrow(x) #サンプルサイズ data <-list(N
= n, X = x) #リスト形式 ⚫ 理科の点数が国語や算数の点数よりも高いという仮説が正しい確率は？この後で使うstanは、リスト形式でデータを渡す必要がある。これからやることは、対応のある1元配置分散分析のベイズ版。

174 母平均の差の検討５ anovaP3 <- " data{ int<lower=0> N; vector[3] X[N];
} parameters{ vector[3] mu; real<lower=0> sig[3]; real<lower=-1,upper=1> rho; } transformed parameters{ matrix[3,3] Sigma; Sigma[1,1] = sig[1]*sig[1]; Sigma[2,2] = sig[2]*sig[2]; Sigma[3,3] = sig[3]*sig[3]; Sigma[1,2] = sig[1]*sig[2]*rho; Sigma[1,3] = sig[1]*sig[3]*rho; Sigma[2,3] = sig[2]*sig[3]*rho; Sigma[2,1] = Sigma[1,2]; Sigma[3,1] = Sigma[1,3]; Sigma[3,2] = Sigma[2,3]; } ⚫ 理科の点数が国語や算数の点数よりも高いという仮説が正しい確率は？どんなデータを扱うか何のパラメータの確率分布を推定するかその他のパラメータ生成メカニズム multi normal =多変量正規分布 uniform=一様分布 cauchy=コーシー分布その他、計算して欲しい値 model{ X ~ multi_normal(mu, Sigma); rho ~ uniform(-1,1); sig ~ cauchy(0,2.5); } generated quantities{ real delta21; real delta31; real delta32; real d_overC1; real d_overC2; real d_overC3; delta21 = mu[2] - mu[1]; delta31 = mu[3] - mu[1]; delta32 = mu[3] - mu[2]; d_overC1 = (delta21>0? 1:0); d_overC2 = (delta31>0? 1:0); d_overC3 = (delta32>0? 1:0); } "

175 母平均の差の検討６ require(rstan) rstan_options(auto_write = TRUE) options(mc.cores = parallel::detectCores()) fit
<- stan(model_code = anovaP3, iter=21000, warmup=1000, chains=5, data = data) print(fit, digits_summary = 2) ⚫ 理科の点数が国語や算数の点数よりも高いという仮説が正しい確率は？ c1=mu[2] - mu[1]>0の確率 c2=mu[3] - mu[1]>0の確率 c3=mu[3] - mu[2]>0の確率 ※結果は毎回少し変わる可能性あり ※推定に時間かかる mu[1]＝国語 mu[2]＝算数 mu[3]＝理科

176 報告例各教科の点数の差をベイズ統計に基づき検討する．検討に際しては，まず，母集団における各教科の点数のEAP推定値を算出した．推定に際しては，長さ21000のチェインを５つ発生させ，バーンイン期間を 1000とし，HMC法によって得られた100000個の乱数で事後分布，予測分布を近似した．なお，事前分布には一様分布を用いた．収束判定指標RhatはすべてのパラメータにおいてRhat <1.1であり，パラメータ・生成量の全てに関して有効標本数が110000個以上と十分な数であったことから，各パラメータは事後分布・予測分布からの乱数の近似と判断した．次に，任意の２つの教科において，教科Aが教科Bよりも平均値が高い確率を算出した．結果を表１，２に示す．
表１より，理科の点数が相対的に高いことが見て取れる．また，表２より，理科が算数高い確率は 100%、理科が国語より高い確率は100％であることが分かる．表１パラメータの推定結果表２行の教科が列の教科より高い確率 EAP p.sd 2.5% 50.0% 97.5% 国語 59.10 0.51 58.09 59.10 60.11 算数 68.24 0.53 67.19 68.24 69.28 理科 73.10 0.49 72.16 73.10 74.07 国語算数理科国語 0.00 0.00 0.00 算数 1.00 0.00 0.00 理科 1.00 1.00 0.00

統計勉強会2020 統計学の基礎と分析方法

統計勉強会2020 統計学の基礎と分析方法

More Decks by Daiki Nakamura

Other Decks in Education

Featured

Transcript