Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
多重比較/相関分析 / Multiple Comparison and Correlation...
Search
Kenji Saito
PRO
January 18, 2025
Technology
0
71
多重比較/相関分析 / Multiple Comparison and Correlation Analysis
早稲田大学大学院経営管理研究科「企業データ分析」2024 冬の第11-12回で使用したスライドです。
Kenji Saito
PRO
January 18, 2025
Tweet
Share
More Decks by Kenji Saito
See All by Kenji Saito
ゼミ紹介 : 公共の利益のためのデジタルトランスフォーメーション / Zemi Introduction : Digital Transformation for Public Good
ks91
PRO
0
28
逆襲のインクルーシブ社会 / An Inclusive Society Strikes Back
ks91
PRO
0
14
続・インクルーシブな社会へ / Continuing Towards an Inclusive Society
ks91
PRO
0
26
AGI (人工一般知能) と創る新しく奇妙な社会 / New and Stranger Society built with AGI
ks91
PRO
0
73
回帰分析/大規模言語モデルと統計 / Regression Analysis, Large Language Models and Statistics
ks91
PRO
0
78
アカデミーキャンプ 2025冬「考えるのは奴らだ」 / Academy Camp 2025 Winter - Live and Let Think DAY 3
ks91
PRO
0
70
アカデミーキャンプ 2025冬「考えるのは奴らだ」 / Academy Camp 2025 Winter - Live and Let Think DAY 2
ks91
PRO
0
56
アカデミーキャンプ 2025冬「考えるのは奴らだ」 / Academy Camp 2025 Winter - Live and Let Think DAY 1
ks91
PRO
1
81
インクルーシブな社会へ / Toward an Inclusive Society
ks91
PRO
0
27
Other Decks in Technology
See All in Technology
スケールアップ企業のQA組織のバリューを最大限に引き出すための取り組み
tarappo
3
680
Javaの新しめの機能を知ったかぶれるようになる話 #kanjava
irof
3
4.6k
【ServiceNow SNUG Meetup LT deck】ServiceNow「検索性の進化」ZingからNow Assistまで
niwato
1
280
AI・LLM事業部のSREとタスクの自動運転
shinyorke
PRO
0
200
20250326_管理ツールの権限管理で改善したこと
sasata299
0
130
Vision Language Modelを活用した メルカリの類似画像レコメンドの性能改善
yadayuki
3
450
移行できそうでやりきれなかった 10年超えのシステムを葬るための戦略
ryu955
2
170
30代エンジニアが考える、エンジニア生存戦略~~セキュリティを添えて~~
masakiokuda
4
1.9k
Reactを段階的に覗いてみる
ytaisei
2
780
Engineering Managementのグローバルトレンド #emoasis / Engineering Management Global Trend
kyonmm
PRO
5
890
モンテカルロ木探索のパフォーマンスを予測する Kaggleコンペ解説 〜生成AIによる未知のゲーム生成〜
rist
1
240
ルートユーザーの活用と管理を徹底的に深掘る
yuobayashi
4
490
Featured
See All Featured
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Visualization
eitanlees
146
15k
Embracing the Ebb and Flow
colly
84
4.6k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
27
1.6k
BBQ
matthewcrist
88
9.5k
Building Adaptive Systems
keathley
40
2.5k
Why You Should Never Use an ORM
jnunemaker
PRO
55
9.3k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
30
2.3k
Navigating Team Friction
lara
183
15k
How to train your dragon (web standard)
notwaldorf
91
5.9k
Statistics for Hackers
jakevdp
797
220k
Transcript
Corporate data analysis — generated by Stable Diffusion XL v1.0
2024 11-12 (WBS) 2024 11-12 — 2025-01-20 – p.1/29
https://speakerdeck.com/ks91/collections/corporate-data-analysis-2024-winter 2024 11-12 — 2025-01-20 – p.2/29
1 12 2 • 2 12 2 (B A )
• 3 12 9 • 4 12 9 • 5 12 16 • 6 12 16 t • 7 12 23 2 ( ) t • 8 12 23 2 ( ) t • 9 1 6 P • 10 1 6 • 11 1 20 • 12 1 20 • 13 1 27 14 1 27 W-IOI 2024 11-12 — 2025-01-20 – p.3/29
( 20 25 ) 1 (20 ) • 2 R
( 55 ) • 3 (32 ) • 4 (14 ) • 5 ( Git) (22 ) • 6 ( ) (24 ) • 7 (1) (25 ) • 8 (2) (25 ) • 9 R ( ) (1) — Welch (17 ) • 10 R ( ) (2) — (21 ) • 11 R ( ) (1) — (15 ) • 12 R ( ) (2) — (19 ) • 13 GPT-4 (19 ) • 14 GPT-4 (29 ) • 15 ( ) LaTeX Overleaf (40 ) • 8 (12/16 ) / (2 ) OK / 2024 11-12 — 2025-01-20 – p.4/29
2 2 t 1 9 P P 10 H0 HA
k, N, ¯ ¯ x σ2 ( )MSwithin ( )MSbetween MStotal F F 2024 11-12 — 2025-01-20 – p.5/29
11 — 2 t FWER (Family-Wise Error Rate) Bonferroni (
2 t ) / Tukey-Kramer q 12 / r sxy vs. 2024 11-12 — 2025-01-20 – p.6/29
2024 11-12 — 2025-01-20 – p.7/29
5. (1) ( ) (2) 2025 1 16 ( )
23:59 JST ( ) Waseda Moodle (Q & A ) (1)(2) Discord 2024 11-12 — 2025-01-20 – p.8/29
. . . . . . 17 16 (1/17( )
) ( ) → 16 ( ) → 11 ( ) ( ) → 2 → 3 ← ( ) ( ^^;) ↑ 2024 11-12 — 2025-01-20 – p.9/29
( ) F = / ⇒ ( ) F =
MSbetween MSwithin . . . [ ] . . . . . . [ ] ⇒ 2024 11-12 — 2025-01-20 – p.10/29
O (1/n) 3 1. ∗ 40 4 * 2. ∗∗
** 3. 2024 11-12 — 2025-01-20 – p.11/29
O (2/n) 1 1 ⇒ 2024 11-12 — 2025-01-20 –
p.12/29
O (3/n) (n = 3) 1. 2. ( ) (
-1 ) 3. F F = ( ) ( ) 4. F F F F F 5% F ⇒ →( ) → 2024 11-12 — 2025-01-20 – p.13/29
K ⇒ p.228 10-17 2024 11-12 — 2025-01-20 – p.14/29
H ⇒ (research question) . . . R 7.3 7.4
7.5 1 2024 11-12 — 2025-01-20 – p.15/29
H ⇒ : https://www.nikkei-r.co.jp/pollsurvey/method.html 2024 11-12 — 2025-01-20 – p.16/29
K ⇒ : https://www.mgt.ous.ac.jp/about/management/lecture/lecture_d-02/ ↑ p p ± 1.96 p(1
− p) n 2024 11-12 — 2025-01-20 – p.17/29
p 95% : https://bellcurve.jp/statistics/course/9122.html n . . . µ 95%
(1)( 6 ) p 95% (2) x − 1.96 × σ √ n ≤ µ ≤ x + 1.96 × σ √ n (1) ˆ p − 1.96 × ˆ p(1 − ˆ p) n ≤ p ≤ ˆ p + 1.96 × ˆ p(1 − ˆ p) n (2) B(n, p) n N(np, np(1 − p)) ˆ p N(p, p(1−p) n ) x N(µ, σ2 n ) 95% 95% 95% ( ) 2024 11-12 — 2025-01-20 – p.18/29
F 2 ⇒ ( ). . . 2024 11-12 —
2025-01-20 – p.19/29
11 — 2 t FWER (Family-Wise Error Rate) Bonferroni (
2 t ) Tukey-Kramer q 2024 11-12 — 2025-01-20 – p.20/29
(1/2) 2 t t α α . . . α
(1 − α)m ( ) m 1 FWER ( t 1 α ) 5% Bonferroni ( 2 t ) αBonferroni = 0.05 m t 2024 11-12 — 2025-01-20 – p.21/29
(2/2) Tukey-Kramer (1) : (2) : σ2 ( ) (H0
) µ1 = µ2 = · · · = µk µA = µB q qA−B = ¯ xA − ¯ xB √ MSwithin 1 2 ( 1 nA + 1 nB ) µA = µB q0.05 (k, dfwithin ) < |qA−B | 2024 11-12 — 2025-01-20 – p.22/29
V ( p.248) 19 4 “ V.R” ( multcomp glht()
) (R TukeyHSD() ) p.243 “multcomp” 2024 11-12 — 2025-01-20 – p.23/29
12 r sxy ( ) vs. 2024 11-12 — 2025-01-20
– p.24/29
Pearson r ( sx sy x y ) r =
sxy sx sy = n i=1 (xi − ¯ x)(yi − ¯ y) n i=1 (xi − ¯ x)2 n i=1 (yi − ¯ y)2 r −1 +1 |r| 1 ( ) sxy sxy = n i=1 (xi − ¯ x)(yi − ¯ y) n − 1 t ( df = n − 2 t ; ) t = r n − 2 1 − r2 2024 11-12 — 2025-01-20 – p.25/29
X ( p.270) “ X.R” ( cor.test() ) p.270 (
) 2024 11-12 — 2025-01-20 – p.26/29
2024 11-12 — 2025-01-20 – p.27/29
6. (1) ( ) (2) 2025 1 23 ( )
23:59 JST ( ) Waseda Moodle (Q & A ) (1) Discord 2024 11-12 — 2025-01-20 – p.28/29
2024 11-12 — 2025-01-20 – p.29/29