Upgrade to Pro — share decks privately, control downloads, hide ads and more …

カイ二乗検定は何をやっているのか/What_Does_the_Chi-Square_Test_Do

florets1
December 01, 2024
2k

 カイ二乗検定は何をやっているのか/What_Does_the_Chi-Square_Test_Do

florets1

December 01, 2024
Tweet

Transcript

  1. 2 私がカイ二乗検定に納得するまで 1. 頻度論を離れてベイズ統計の視点で考えてみた。 2. その後、頻度論に戻って考え直した。 My Journey to Understanding

    the Chi-Square Test Considered it from a Bayesian statistical perspective, leaving frequentist reasoning behind. Returned to frequentist reasoning to reevaluate it.
  2. 3 サイコロが偏っているか知りたい 1. サイコロを何度も投げる 2. 実測値と理論値のズレの合計を計算 3. ズレの合計が大きければ偏っている Is this

    dice biased? Roll the die repeatedly. Calculate the total deviation between observed and theoretical values. If the total deviation is large, the die is biased.
  3. 6 頻度論ではパラメーターは分布ではない 標本データから母集団の真のパラメーターを推定する。 ↓ 推定値に差があったとしても、母集団のパラメーターに 差があるとは断言できない。 ↓ 仮説検定 In Frequentist

    Statistics, Parameters Are Not Distributions Population parameters are estimated from sample data. Even if there are differences in estimates, we cannot definitively claim differences in population parameters. Hypothesis testing
  4. 9 コイン投げの頻度論による分析(2) 「表が18回という観測 データ、またはそれよ りもっと極端なデータ が得られた」確率2% 有意水準の5%を下回っ ているため、帰無仮説 を棄却する Coin

    Toss Analysis Using Frequentist Approach Probability of observing "18 heads or more extreme outcomes": 2%. Since this is below the 5% significance level, the null hypothesis is rejected.
  5. サイコロ投げのベイズ統計による分析(3) 14 ベイズ統計 • 二項分布によるベイズ更新を6回 • 多項分布なら1回 サイコロ投げはコイン投げの自然な拡張 Dice Roll

    Analysis Using Bayesian Approach Bayesian statistics: Six Bayesian updates using binomial distributions. One update using a multinomial distribution. Dice rolling is a natural extension of coin tossing.
  6. 16 サイコロ投げの頻度論による分析(2) 多項分布による検定 1回の検定ですみそう。 →なぜか実際にはあまり使われていない。 理論的にはよさそうなアイデアなのに。 標本分布の計算量が大きいためか。 Dice Roll Analysis

    Using Frequentist Approach Test using a multinomial distribution. This could be done in a single test. However, it is rarely used in practice. Despite being theoretically promising, its computational demands might make it impractical.
  7. 17 サイコロ投げの頻度論による分析(3) 頻度論の仮説検定 • 二項検定を6回繰り返す ダメ • 多項検定 ダメ コイン投げの自然な拡張ではダメ

    Dice Roll Analysis Using Frequentist Approach Frequentist hypothesis testing: Repeated binomial tests → Not viable. Multinomial tests → Not viable. The natural extension of coin tossing doesn’t work.
  8. 18 サイコロ投げの頻度論による分析(4) カイ二乗検定 実測値と理論値のズレの合計が カイ二乗分布に従う性質を利用する。 カイ二乗分布に従う Dice Roll Analysis Using

    Frequentist Approach Chi-square test: Uses the property that the sum of squared deviations (observed vs. theoretical values) follows a chi-square distribution.
  9. 19 ここまでのまとめ ベイズ統計 サイコロ投げはコイン投げの自然な拡張 • 二項分布によるベイズ更新を6回 • 多項分布なら1回 頻度論の仮説検定 コイン投げの自然な拡張ではダメ

    • 二項検定を6回繰り返す ダメ • 多項検定 ダメ • カイ二乗検定 OK Summary So Far Bayesian Statistics: Dice rolling is a natural extension of coin tossing. Six updates with binomial distributions. One update with a multinomial distribution. Frequentist Hypothesis Testing: The natural extension of coin tossing doesn’t work. Repeated binomial tests → Not viable. Multinomial tests → Not viable. Chi-square test → Viable.
  10. 20 カイ二乗検定(1) 1. 二項分布は正規分布で近似できる。 2. 二項分布に従う確率変数を標準化すると、標準正規 分布に従う。 3. 標準正規分布の二乗和はカイ二乗分布に従う。 4.

    「実測値と理論値のズレの合計」はカイ二乗分布に 従う。 Chi-Square Test 1. A binomial distribution can be approximated by a normal distribution. 2. Standardizing a binomial random variable yields a standard normal distribution. 3. The sum of squares of standard normal variables follows a chi-square distribution. 4. "Sum of deviations between observed and theoretical values" follows a chi-square distribution.