Slide 1

Slide 1 text

統計の基礎6 カイ二乗分布とカイ二乗検定 2020/9/1 Ver. 1.0

Slide 2

Slide 2 text

カイ二乗検定とは? カテゴリカルデータの比の検定 • 比がある値と同じである(適合度の検定) • 比がある値と異なる(独立性の検定) を検証する検定法 名前は2つあるが、基本的に同じものを指す

Slide 3

Slide 3 text

カテゴリカルデータ クロス集計表で表されるデータのこと 症状 男性 女性 あり 50 75 なし 100 140 男性と女性で比率が異なるかどうか検定する

Slide 4

Slide 4 text

カイ2乗分布 観測数と期待数の差の分布を調べる ෍ ( − )2 O: 観測された度数、E: 期待される度数 このパラメータの分布が、カイ2乗分布を取る

Slide 5

Slide 5 text

カイ2乗分布 ; = 1 2 2Γ( 2 ) ∙ /2 k=5 k=10 k=15 • 0~+∞の連続分布 • 期待値kを持つ • kは平均値となる

Slide 6

Slide 6 text

適合度の検定 比率がある値と同じであるかどうか検定する方法 • 女性の症状ありの比率が1:2かどうか検定する 症状 男性 女性 あり 50 75 なし 100 140

Slide 7

Slide 7 text

Rでの計算方法: 適合度 chisq.testで計算する • 女性の症状ありの比率は1:2と変わらない これがp値

Slide 8

Slide 8 text

独立性の検定 2グループでの比率の差を検定する方法 • 女性の症状ありの比率が男性と同じであるか検定する 症状 男性 女性 あり 50 75 なし 100 140

Slide 9

Slide 9 text

Rでの計算方法: 独立性 chisq.testで計算する • 女性の症状ありの比率は男性と変わらない これがp値

Slide 10

Slide 10 text

いつ使う? 比率計算が必要な際に使用されることがある • 被験者群間での応答性比較を行うとき • 形質の分離がメンデル的であるか確認するとき • カテゴリカルデータの取り扱いのとき

Slide 11

Slide 11 text

まとめ • 比率の比較を行うときはカイ2乗検定を利用する • カイ2乗検定は適合度と独立性の検定を含む • 適合度も独立性も根本的には同じ統計手法である • カイ2乗検定ではカイ2乗分布を利用して検定統計量を求める