Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
カイ二乗検定との遭遇/The_path_to_encountering_the_chi-squ...
Search
florets1
July 11, 2024
Marketing & SEO
360
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
カイ二乗検定との遭遇/The_path_to_encountering_the_chi-square_test
florets1
July 11, 2024
More Decks by florets1
See All by florets1
データ分析をはじめよう/lets_start_data_analysis
florets1
2
1k
なぜSQLはAIぽく見えるのか/why does SQL look AI like
florets1
0
760
Tableauとggplot2の背景/Background_of_Tableau_and_ggplot2
florets1
0
90
Rで学ぶデータハンドリング入門/Introduction_to_Data_Handling_with_R
florets1
0
160
人工知能はクロスジョインでできている/AI_Is_Built_on_Cross_Joins
florets1
0
110
仮説の取扱説明書/User_Guide_to_a_Hypothesis
florets1
4
480
複式簿記から純資産を排除する/eliminate_net_assets_from_double-entry_bookkeeping
florets1
1
490
カイ二乗検定は何をやっているのか/What_Does_the_Chi-Square_Test_Do
florets1
7
2.5k
直積は便利/direct_product_is_useful
florets1
3
490
Other Decks in Marketing & SEO
See All in Marketing & SEO
Redefining Success Metrics for the AI Search Era - #BrightonSEO
aleyda
0
870
JAWS-UG福井 AWS Community Update
awsjcpm
1
190
Google reviews: The secret sauce for local visibility
greggifford
PRO
0
430
Teach The Shit Out Of Everything
portentint
PRO
0
360
You Can't Generate What You Can't Retrieve
dawnieando
1
440
Winning organic in 2026_ A framework for surviving Google’s AI era
aleyda
0
430
弊社のAWS事情、大公開!
taku271
1
520
From Keywords to Conversations: Winning in an AI-First Search World With Audience-Focused Content
sophiecoley
0
110
ExpoEcomm 2026: Do SEO ao GEO como a IA está Mudando o Comportamento de Busca dos Brasileiros e o que Fazer para Vender Mais
felipebazon
1
140
SEO and Brand Sitting In A Tree K-I-S-S-I-N-G - By Lidia Infante for Digital PR Summit 2026
lidiainfante
0
280
Baidu Mobile SEO in the Age of WeChat
owainlw
0
220
Feed the machine: Berlin SEO & content club
katarinadahlin
PRO
1
160
Featured
See All Featured
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
23k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
120k
HDC tutorial
michielstock
2
720
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
1
250
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
62k
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
2
580
Ethics towards AI in product and experience design
skipperchong
2
320
The Cult of Friendly URLs
andyhume
79
6.9k
Leading Effective Engineering Teams in the AI Era
addyosmani
9
2.1k
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
490
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
160
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
220
Transcript
1 2024.07.13 Tokyo.R #114 カイ二乗検定との遭遇
2 コインが偏ってないか調べる(1) 確率𝑝で表が出るコインを𝑛回投げる。 表が出る回数は二項分布𝐵(𝑛, 𝑝) に従う 分布の形状はパラメーターによって変化する B(10, 0.8) B(10,
0.5)
3 コインが偏ってないか調べる(2) パラメーターは確率分布ではない流儀 0.5 p パラメーター𝑝は0.5に近いのか それとも遠いのか、なんとも言 えない。 パラメーターは確率分布だとする流儀 0.5
パラメーター𝑝は0.5に近いのか それとも遠いのか、分布の形状 から判断できる。 二項分布𝐵(𝑛, 𝑝) のパラメーター𝑝 に注目 p
4 コインが偏ってないか調べる(3) 実際に観測された値、もしくはそれよりも極端な値が観測される確率(P値)を求めて… パラメーターは確率分布ではない流儀では仮説検定を行う 例えば二項検定
5 サイコロが偏ってないか調べる(1) サイコロの1の目が出る回数の確率は二項分布に従う 分布の形状はパラメーターによって変化する B(n=10, p=1/6)
6 サイコロが偏ってないか調べる(2) パラメーターは確率分布だとする流儀 1/6 パラメーター𝑝は1/6に近いのか それとも遠いのか、分布の形状 から判断できる。 6個のパラメーターそれぞれに ついて、1/6に近いのか遠いのか 判断してやればよい。
p
パラメーター𝑝は1/6に近いのか それとも遠いのか、なんとも言 えない。 7 サイコロが偏ってないか調べる(3) パラメーターは確率分布ではない流儀 1/6 6個のパラメーターそれぞれに ついて、1/6に近いのか遠いのか 仮説検定をすればよい。
p
8 サイコロが偏ってないか調べる(4) パラメーターは確率分布ではない流儀 6個のパラメーターそれぞれに ついて、1/6に近いのか遠いのか 仮説検定をすればよい。 多重検定
9 サイコロが偏ってないか調べる(5) 多重検定やりたくないなあ ではどうするか 素直に考えたら 多項分布を使って検定すればよさそう 多項分布は二項分布を多クラスに拡張した分布だから しかし、なぜかこの手法は流行っていないようだ 実際に流行ってるのはカイ二乗検定
10 カイ二乗分布とは 標準正規分布の二乗和の分布
11 二項分布からカイ二乗分布へ nが十分に大きいとき、二項分布𝐵(𝑛, 𝑝) は 正規分布𝑁(𝑛𝑝, 𝑛𝑝 1 − 𝑝
) で近似できる。 確率変数𝑋が二項分布𝐵(𝑛, 𝑝)に従うとき 𝑋−𝑛𝑝 𝑛𝑝(1−𝑝) は近似的に標準正規分布に従う。 標準正規分布の二乗和はカイ二乗分布 𝜒2 = (𝑋 − 𝑛𝑝)2 𝑛𝑝(1 − 𝑝)
12 カイ二乗検定とは サイコロの目 1 2 3 4 5 6 合計
実測値 24 20 18 19 17 22 120 理論値 20 20 20 20 20 20 120 ズレ (24 − 20)2 20 (20 − 20)2 20 (18 − 20)2 20 (19 − 20)2 20 (17 − 20)2 20 (22 − 20)2 20 (24 − 20)2 20 + (20 − 20)2 20 + (18 − 20)2 20 + (19 − 20)2 20 + (17 − 20)2 20 + (22 − 20)2 20 = 𝜒2 実測値と理論値のズレの和がカイ二乗分布に従っている ことを利用する検定
13 まとめ パラメーターは確率分布だとする 流儀は単純だと思う パラメーターの分布を見比べるだけ どのパラメーターが偏っているかも個別にわかる
14 まとめ パラメーターは確率分布ではない流儀は複雑だと思う パラメーター同士を直接比べてもが近いのか遠いのかなんとも言えない→仮説検定 二項分布に従う現象だから二項検定を6回やったら→多重検定 二項分布の多クラス拡張である多項分布で検定すれば→流行ってない 二項分布を正規分布で近似して、標準正規分布の二乗和が従う分布(カイ二乗分布) を使って検定する どのパラメーターが偏っているか個別にはわからないが、サイコロが偏っていること はわかる