Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2018年度 化学工学特論2 第7回

2018年度 化学工学特論2 第7回

言いたいこと
前回の達成目標
今回の達成目標
実験結果は向上したか?
検定 (統計的仮説検定) とは?
ウェルチの t 検定とは?
ウェルチの t 検定のやり方
両側検定と片側検定
[参考] Brunner-Munzel 検定
相関
相関係数
相関係数の式
相関係数の例
注意!
無相関の検定
無相関の検定のやり方
母相関係数の区間推定
母相関係数の区間推定の考え方
復習クイズ3問!

Hiromasa Kaneko

January 27, 2019
Tweet

More Decks by Hiromasa Kaneko

Other Decks in Technology

Transcript

  1. 実験結果は向上したか︖ 4 条件1での3回の実験結果 (収率) [80.0, 79.0, 79.5]︓平均 79.5 条件2での3回の実験結果 (収率)

    [80.5, 79.5, 80.0]︓平均 80.0 条件2のとき、条件1より収率が向上したといえるか︖ ウェルチの t 検定 (Welch's t test) で検討する 前提︓それぞれの条件での実験結果は正規分布に従う 2つの実験について、分散が同じでなくても構わない
  2. 検定 (統計的仮説検定) とは︖ 5 最初に仮説を⽴て、実際に起こるか確率的に検証し、結論を導くこと 帰無仮説︓否定 (棄却) したい仮説 例) 条件1の実験結果の平均は、条件2の実験結果の平均と同じ

    もしくは、それより大きい 対⽴仮説︓帰無仮説が棄却されたら、正しいことが証明される仮説 例) 条件1の実験結果の平均は、条件2の実験結果の平均より小さい 有意水準 α %︓帰無仮説が起こる確率が α × 100 %以下なら、 帰無仮説を棄却できる。事前に設定する 帰無仮説を棄却できれば、対⽴仮説が成り⽴つことが証明される
  3. ウェルチの t 検定とは︖ 6 1 2 2 2 1 2

    1 2 x m m µ µ σ σ − = + μ1 : 実験1の平均 μ2 : 実験2の平均 σ1 : 実験1の標準偏差 σ2 : 実験2の標準偏差 m1 : 実験1のサンプル数 m2 : 実験2のサンプル数 検定の一つ、Welch (ウェルチ) さんが1938年に開発 以下の x が t 分布に従うことを利用して、帰無仮説が起こる確率を検討 ( ) ( ) 2 2 2 1 2 1 2 4 4 1 2 2 2 1 1 2 2 1 1 m m m m m m σ σ ν σ σ   +     = + − − ただし、⾃由度 ν は、
  4. ウェルチの t 検定のやり方 7 1. x の値から、t 分布においてその値となりうる確率を計算する ( t

    分布表というものを⾒ることで調べられますが、Python でウェルチの t 検定をするときは Scipy で計算できるので、調べなくて大丈夫です) 2. 得られた確率が α より小さい場合は、帰無仮説を棄却する
  5. [参考] Brunner-Munzel 検定 9 ( ) ( ) 1 2

    1 2 2 2 1 2 1 1 2 2 m m x m m m m µ µ σ σ − = + + 実験データの正規分布性を仮定しない検定の一つ Brunner さんと Munzel さんが 2000 年に開発 以下の x が t 分布に従うことを利用して、帰無仮説が起こる確率を検討 ( )2 2 2 1 1 2 2 2 4 2 4 1 1 2 2 1 2 1 1 m m m m m m σ σ ν σ σ + = + − − ただし、⾃由度 ν は、
  6. 相関 10 変数 x1 の値が大きくなると、変数 x2 の値も同様に大きくなる (小さくなる) 傾向があるとき、 x1

    と x2 の間には相関がある、という ある 294 の化合物郡において、 沸点と分⼦量の間には相関がある
  7. 相関係数 11 相関係数 r (correlation coefficient) : 2つの変数の間における 相関の度合いを数値化したもの 1

    に近いほど正の相関が強く、0 に近いほど相関がなく (無相関)、 -1 に近いほど負の相関が強いことを示す r = 0.77
  8. 相関係数の式 12 ( )( ) ( ) ( ) 1,

    1 2, 2 1 2 2 1, 1 2, 2 1 1 m i i i m m i i i i x x r x x µ µ µ µ = = = − − =    − −          x1,i : 変数1の i 番目のサンプルの値 x2,i : 変数2の i 番目のサンプルの値 μ1 : 変数1の平均 μ2 : 変数2の平均 m : サンプル数 変数2の平均からのばらつき 変数1の平均からのばらつき 変数1と変数2の間のばらつき
  9. 相関係数の例 13 r = 1.0 r = 0.96 r =

    0.70 r = 0.0 r = -0.70 r = -0.93 r = -1.0 完全な正の相関 完全な負の相関 強い正の相関 強い負の相関 正の相関がある 負の相関がある 相関がない (無相関)
  10. 無相関の検定 15 2 2 1 r m x r −

    = − 以下の x が t 分布に従うことを利用して、帰無仮説が起こる確率を検討 2 m ν = − ただし、⾃由度 ν は、
  11. 無相関の検定のやり方 16 1. x の値から、t 分布においてその値となりうる確率を計算する ( t 分布表というものを⾒ることで調べられますが、Python で無相関の

    検定をするときは Scipy で計算できるので、調べなくて大丈夫です) 2. 得られた確率が α より小さい場合は、帰無仮説を棄却する 帰無仮説︓2つの変数の間には相関がない 対⽴仮説︓2つの変数の間には相関がある
  12. ⺟相関係数の区間推定の考え方 18 ある程度 サンプルがある (少なくとも 10 以上) とき 、以下の z

    が 正規分布に従うことを利用 1 1 log 2 1 r z r + = − ただし、正規分布の平均はサンプルから得られた r によって計算された z であり、分散は 1 3 m − (フィッシャーの z 変換)
  13. ⺟相関係数の区間推定のやり方 19 1. サンプルから相関係数 r を計算し、フィッシャーの z 変換を⾏う 2. 平均・分散を計算し、その正規分布を積分して

    α × 100 % となる z の範囲を求める (Scipy で計算します) 3. z から r に (逆) 変換して、r の範囲を求める 1 1 log 2 1 r z r + = − ( ) ( ) exp 2 1 exp 2 1 z r z − = +