Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2018年度 化学工学特論2 第7回

2018年度 化学工学特論2 第7回

言いたいこと
前回の達成目標
今回の達成目標
実験結果は向上したか?
検定 (統計的仮説検定) とは?
ウェルチの t 検定とは?
ウェルチの t 検定のやり方
両側検定と片側検定
[参考] Brunner-Munzel 検定
相関
相関係数
相関係数の式
相関係数の例
注意!
無相関の検定
無相関の検定のやり方
母相関係数の区間推定
母相関係数の区間推定の考え方
復習クイズ3問!

Avatar for Hiromasa Kaneko

Hiromasa Kaneko

January 27, 2019
Tweet

More Decks by Hiromasa Kaneko

Other Decks in Technology

Transcript

  1. 実験結果は向上したか︖ 4 条件1での3回の実験結果 (収率) [80.0, 79.0, 79.5]︓平均 79.5 条件2での3回の実験結果 (収率)

    [80.5, 79.5, 80.0]︓平均 80.0 条件2のとき、条件1より収率が向上したといえるか︖ ウェルチの t 検定 (Welch's t test) で検討する 前提︓それぞれの条件での実験結果は正規分布に従う 2つの実験について、分散が同じでなくても構わない
  2. 検定 (統計的仮説検定) とは︖ 5 最初に仮説を⽴て、実際に起こるか確率的に検証し、結論を導くこと 帰無仮説︓否定 (棄却) したい仮説 例) 条件1の実験結果の平均は、条件2の実験結果の平均と同じ

    もしくは、それより大きい 対⽴仮説︓帰無仮説が棄却されたら、正しいことが証明される仮説 例) 条件1の実験結果の平均は、条件2の実験結果の平均より小さい 有意水準 α %︓帰無仮説が起こる確率が α × 100 %以下なら、 帰無仮説を棄却できる。事前に設定する 帰無仮説を棄却できれば、対⽴仮説が成り⽴つことが証明される
  3. ウェルチの t 検定とは︖ 6 1 2 2 2 1 2

    1 2 x m m µ µ σ σ − = + μ1 : 実験1の平均 μ2 : 実験2の平均 σ1 : 実験1の標準偏差 σ2 : 実験2の標準偏差 m1 : 実験1のサンプル数 m2 : 実験2のサンプル数 検定の一つ、Welch (ウェルチ) さんが1938年に開発 以下の x が t 分布に従うことを利用して、帰無仮説が起こる確率を検討 ( ) ( ) 2 2 2 1 2 1 2 4 4 1 2 2 2 1 1 2 2 1 1 m m m m m m σ σ ν σ σ   +     = + − − ただし、⾃由度 ν は、
  4. ウェルチの t 検定のやり方 7 1. x の値から、t 分布においてその値となりうる確率を計算する ( t

    分布表というものを⾒ることで調べられますが、Python でウェルチの t 検定をするときは Scipy で計算できるので、調べなくて大丈夫です) 2. 得られた確率が α より小さい場合は、帰無仮説を棄却する
  5. [参考] Brunner-Munzel 検定 9 ( ) ( ) 1 2

    1 2 2 2 1 2 1 1 2 2 m m x m m m m µ µ σ σ − = + + 実験データの正規分布性を仮定しない検定の一つ Brunner さんと Munzel さんが 2000 年に開発 以下の x が t 分布に従うことを利用して、帰無仮説が起こる確率を検討 ( )2 2 2 1 1 2 2 2 4 2 4 1 1 2 2 1 2 1 1 m m m m m m σ σ ν σ σ + = + − − ただし、⾃由度 ν は、
  6. 相関 10 変数 x1 の値が大きくなると、変数 x2 の値も同様に大きくなる (小さくなる) 傾向があるとき、 x1

    と x2 の間には相関がある、という ある 294 の化合物郡において、 沸点と分⼦量の間には相関がある
  7. 相関係数 11 相関係数 r (correlation coefficient) : 2つの変数の間における 相関の度合いを数値化したもの 1

    に近いほど正の相関が強く、0 に近いほど相関がなく (無相関)、 -1 に近いほど負の相関が強いことを示す r = 0.77
  8. 相関係数の式 12 ( )( ) ( ) ( ) 1,

    1 2, 2 1 2 2 1, 1 2, 2 1 1 m i i i m m i i i i x x r x x µ µ µ µ = = = − − =    − −          x1,i : 変数1の i 番目のサンプルの値 x2,i : 変数2の i 番目のサンプルの値 μ1 : 変数1の平均 μ2 : 変数2の平均 m : サンプル数 変数2の平均からのばらつき 変数1の平均からのばらつき 変数1と変数2の間のばらつき
  9. 相関係数の例 13 r = 1.0 r = 0.96 r =

    0.70 r = 0.0 r = -0.70 r = -0.93 r = -1.0 完全な正の相関 完全な負の相関 強い正の相関 強い負の相関 正の相関がある 負の相関がある 相関がない (無相関)
  10. 無相関の検定 15 2 2 1 r m x r −

    = − 以下の x が t 分布に従うことを利用して、帰無仮説が起こる確率を検討 2 m ν = − ただし、⾃由度 ν は、
  11. 無相関の検定のやり方 16 1. x の値から、t 分布においてその値となりうる確率を計算する ( t 分布表というものを⾒ることで調べられますが、Python で無相関の

    検定をするときは Scipy で計算できるので、調べなくて大丈夫です) 2. 得られた確率が α より小さい場合は、帰無仮説を棄却する 帰無仮説︓2つの変数の間には相関がない 対⽴仮説︓2つの変数の間には相関がある
  12. ⺟相関係数の区間推定の考え方 18 ある程度 サンプルがある (少なくとも 10 以上) とき 、以下の z

    が 正規分布に従うことを利用 1 1 log 2 1 r z r + = − ただし、正規分布の平均はサンプルから得られた r によって計算された z であり、分散は 1 3 m − (フィッシャーの z 変換)
  13. ⺟相関係数の区間推定のやり方 19 1. サンプルから相関係数 r を計算し、フィッシャーの z 変換を⾏う 2. 平均・分散を計算し、その正規分布を積分して

    α × 100 % となる z の範囲を求める (Scipy で計算します) 3. z から r に (逆) 変換して、r の範囲を求める 1 1 log 2 1 r z r + = − ( ) ( ) exp 2 1 exp 2 1 z r z − = +