Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
R を用いた分析(補講) (2) — 人工データの生成 / Analysis using R ...
Search
Kenji Saito
PRO
November 30, 2024
Technology
78
0
Share
R を用いた分析(補講) (2) — 人工データの生成 / Analysis using R (supplementary) (2) - Generating artificial data
早稲田大学大学院経営管理研究科「企業データ分析」2024 冬のオンデマンド教材 第12回で使用したスライドです。
Kenji Saito
PRO
November 30, 2024
More Decks by Kenji Saito
See All by Kenji Saito
ルール・ロール・ツールを創る / Creating Rules, Roles and Tools
ks91
PRO
0
24
コーディング・エージェントの活用 / Using Coding Agents
ks91
PRO
0
24
AGI (Artificial General Intelligence) の論点 / Key Issues in AGI (Artificial General Intelligence)
ks91
PRO
0
21
ワールドカフェ再び、そしてゴール・ルール・ロール・ツール / World Café Revisited, and the Goals-Rules-Roles-Tools
ks91
PRO
0
180
AI の技術 / AI technology
ks91
PRO
0
84
対話による知の拡張と傾聴の理論 / Expansion of Knowledge Through Dialogue and the Theory of Active Listening
ks91
PRO
0
23
プロンプトに対する攻撃と防御 / Attacks and Defenses Against Prompts
ks91
PRO
0
18
AI 前提社会における(地球)環境データのセンシング / Sensing of (Global) Environmental Data in an AI-Driven Society
ks91
PRO
0
32
自然言語の扱いと翻訳のためのプロンプト / Handling Natural Language and Prompts for Translation
ks91
PRO
0
24
Other Decks in Technology
See All in Technology
The Bag-of-Documents Model for Query Understanding and Retrieval
dtunkelang
0
160
Oracle AI Database@Azure:サービス概要のご紹介
oracle4engineer
PRO
6
1.7k
Swift Sequence の便利 API 再発見
treastrain
1
290
なぜ、IAMロールのプリンシパルに*による部分マッチングが使えないのか? / 20260518-ssmjp-iam-role-principal
opelab
1
130
freeeで運用しているAIQAについて
qatonchan
1
640
「背中を見て育て」からの卒業 〜専門技術としてのテスト設計を軸に、品質保証のバトンを繋ぐ〜 #genda_tech_talk
nihonbuson
PRO
4
1.5k
既存プロダクトQAから新規プロダクトQAへ
ryotakahashi
0
160
AWS運用におけるAI Agent活用術 / JAWS-UG 神戸 #11 LT大会
genda
1
300
20260515 OpenIDファウンデーション・ジャパンご紹介
oidfj
0
170
20260515 ID管理は会社を守る大切な砦!〜🔰情シス向け〜
oidfj
0
650
M&Aで増え続けるプロダクトに少数QAはどう立ち向かうか─GENDAが挑む、全員で取り組む品質標準化戦略 / GENDA Tech Talk #4
genda
0
140
そのSLO 99.9%、本当に必要ですか? 〜優先度付きSLOによる責任共有の設計思想〜 / Is that 99.9% SLO really necessary? Design philosophy of shared responsibility through prioritized SLOs
vtryo
0
820
Featured
See All Featured
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
510
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.2k
How Software Deployment tools have changed in the past 20 years
geshan
0
33k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.9k
How to Ace a Technical Interview
jacobian
281
24k
Mind Mapping
helmedeiros
PRO
1
190
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.2k
エンジニアに許された特別な時間の終わり
watany
106
240k
Speed Design
sergeychernyshev
33
1.7k
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
65
55k
YesSQL, Process and Tooling at Scale
rocio
174
15k
The Mindset for Success: Future Career Progression
greggifford
PRO
0
330
Transcript
Boxes and whiskers — generated by Stable Diffusion XL v1.0
2024 12 R ( ) (2) — (WBS) 2024 12 R ( ) (2) — — 2024-11 – p.1/14
https://speakerdeck.com/ks91/collections/corporate-data-analysis-2024-winter 2024 12 R ( ) (2) — — 2024-11
– p.2/14
( 20 ) 1 • 2 R • 3 •
4 • 5 • 6 ( ) • 7 (1) • 8 (2) • 9 R ( ) (1) — Welch • 10 R ( ) (2) — χ2 • 11 R ( ) (1) — • 12 R ( ) (2) — • 13 GPT-4 14 GPT-4 15 ( ) LaTeX Overleaf 8 (12/16 ) / (2 ) OK / 2024 12 R ( ) (2) — — 2024-11 – p.3/14
N(µ, σ2) ρ 2 ( : ˆ y = a
+ b1 x1 + b2 x2 + e ) 2024 12 R ( ) (2) — — 2024-11 – p.4/14
N(µ, σ2) “rnorm()” set.seed(173205) # # N(50, 10^2) 100 x
<- rnorm(n=100, mean=50, sd=10) # x # hist(x) mean(x) sd(x) 2024 12 R ( ) (2) — — 2024-11 – p.5/14
Histogram of x x Frequency 10 20 30 40 50
60 70 80 0 5 10 15 20 25 30 35 mean(x) : 50.06994 sd(x) : 10.30096 2024 12 R ( ) (2) — — 2024-11 – p.6/14
ρ 2 (1/2) MASS “mvrnorm()” “ .R” # r =
0.9 # t = 3.7 # r = 15.2 # t = 7.5 # = -0.5 # <- matrix(c( r^2, * t * r, * r * t, t^2 ), nrow=2) 2024 12 R ( ) (2) — — 2024-11 – p.7/14
“mvrnorm()” = S xx S xy S xy S yy
= S xx rS x S y rS x S y S yy ( r = S xy S x S y ) 2 x, y x, y, z, . . . 2024 12 R ( ) (2) — — 2024-11 – p.8/14
ρ 2 (2/2) MASS “mvrnorm()” “ .R” # set.seed(28284) <-
mvrnorm(n=100, mu=c( r, t), Sigma= ) <- pmin(pmax( [,1], 13.0), 19.9) <- pmin(pmax( [,2], 0.0), 20.0) “ [,1]” “ [,2]” plot 2024 12 R ( ) (2) — — 2024-11 – p.9/14
0 5 10 15 20 13 14 15 16 17
18 ㈇ࡢ┦㛵ࡢ 㐌ᙜࡓࡾࡢㄢእ㐠ື㛫 100m㉮ࡢࢱ࣒ (⛊) r : -0.5932345 ( ) -0.5884094 ( ) 2024 12 R ( ) (2) — — 2024-11 – p.10/14
(1/2) “ .R” n <- 50 # a <- 49.4
# ( (158cm ) ) # r_father <- 0.306 mean_father <- 168.78 sd_father <- 3.2 # r_mother <- 0.37 mean_mother <- 155.32 sd_mother <- 2.45 2024 12 R ( ) (2) — — 2024-11 – p.11/14
(2/2) “ .R” <- round(rnorm(n=n, mean=mean_father, sd=sd_father), digits=1) <- round(rnorm(n=n,
mean=mean_mother, sd=sd_mother), digits=1) e <- rnorm(n=n, mean=0, sd=2.8) # <- round(a + r_father * + r_mother * + e, digits=1) 1 “round()” plot 2024 12 R ( ) (2) — — 2024-11 – p.12/14
ፉ㌟㛗 160 165 170 175 152 156 160 164 160
165 170 175 ∗㌟㛗 152 156 160 164 150 154 158 150 154 158 ẕ㌟㛗 : 34.2484 : 0.3545 : 0.4137 : 0.2831 2024 12 R ( ) (2) — — 2024-11 – p.13/14
2024 12 R ( ) (2) — — 2024-11 –
p.14/14