Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Rの基礎9 基本的な統計と検定
Search
xjorv
January 23, 2021
Education
0
200
Rの基礎9 基本的な統計と検定
Rの基礎9では、Rでの統計や検定の基礎について説明します。
xjorv
January 23, 2021
Tweet
Share
More Decks by xjorv
See All by xjorv
コンパートメントモデル
xjorv
1
5.4k
コンパートメントモデルをStanで解く
xjorv
0
440
生物学的同等性試験 検出力の計算法
xjorv
0
3.4k
生物学的同等性試験ガイドライン 同等性パラメータの計算方法
xjorv
0
6k
粉体特性2
xjorv
0
2.4k
粉体特性1
xjorv
0
2.8k
皮膜5
xjorv
0
2.2k
皮膜4
xjorv
0
2.1k
皮膜3
xjorv
0
2.1k
Other Decks in Education
See All in Education
予習動画
takenawa
0
4.2k
(キラキラ)人事教育担当のつらみ~教育担当として知っておくポイント~
masakiokuda
0
100
新卒交流ワークショップ
pokotyamu
0
400
Data Physicalisation - Lecture 9 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
430
郷土教育モデル事業(香川県小豆島町).pdf
bandg
0
190
2025年度春学期 統計学 第5回 分布をまとめるー記述統計量(平均・分散など) (2025. 5. 8)
akiraasano
PRO
0
110
Virtual and Augmented Reality - Lecture 8 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
1.7k
SkimaTalk Teacher Guidelines Summary
skimatalk
0
790k
Tutorial: Foundations of Blind Source Separation and Its Advances in Spatial Self-Supervised Learning
yoshipon
1
110
IMU-00 Pi
kanaya
0
360
社外コミュニティと「学び」を考える
alchemy1115
2
160
Course Review - Lecture 12 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
1.7k
Featured
See All Featured
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3k
Designing for humans not robots
tammielis
253
25k
The World Runs on Bad Software
bkeepers
PRO
69
11k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Reflections from 52 weeks, 52 projects
jeffersonlam
351
20k
Making Projects Easy
brettharned
116
6.3k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
107
19k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Java REST API Framework Comparison - PWX 2021
mraible
31
8.6k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
For a Future-Friendly Web
brad_frost
179
9.8k
Transcript
Rの基礎 9 基本的な統計と検定 2020/8/15 Ver. 1.0
基本統計量 ベクトルの平均・分散・標準偏差などは関数で簡単に求まる mean sd var max min quantile sum median
平均値 標準偏差 分散 最大値 最小値 4分位値 合計 中央値
summary関数 基本統計量はsummary関数で表示できる データがあれば、とりあえずsummary関数の引数にしてみる
確率分布と乱数 Rでは、確率分布に従った乱数を簡単に得ることができる *乱数: ランダムな数のこと。乱数シミュレーションなどで利用できる runif rnorm rbinom rpois 一様分布 正規分布
二項分布 ポアソン分布
確率分布のグラフ histやggplot2のgeom_densityを用いる *平均0、標準偏差1の正規乱数200000個を生成し、ヒストグラムや確率密度関数にしたもの
相関係数 相関係数も相関行列もcor関数で得られる
直線回帰 直線回帰はlm関数で計算できる • Rでは、Y~Xという表現で2数の関係を示す • Yが従属変数、Xが説明変数となる • Interceptは切片、説明変数の数字は傾きとなる 切片 傾き
直線回帰の詳しい情報 回帰の結果をsummary関数の引数に取る 切片と傾き 切片と傾きの検定結果 *検定では傾きや切片が有意にゼロから離れていることを示す
重回帰分析 重回帰もlm関数で計算できる • 説明変数を+でつなぐだけ • +を*に変えると、交互作用を計算できる
平均の差の検定: t検定 t検定は、t.test関数で実行できる t.test(1つ目の集団, 2つ目の集団)で計算できる これがp値 Welchは等分散でないときのt検定の拡張
平均の差の検定: ウィルコクソンの順位和検定 ウィルコクソンはt検定のノンパラメトリック*版 wilcox.test(1つ目の集団, 2つ目の集団)で計算できる *ノンパラメトリック: 集団が正規分布しないときに使用する検定手法。検出力が低い
分散分析 aov関数で計算できる aov(差を知りたいデータ~カテゴリデータ)で計算できる *線形回帰のlmをaovに変えただけ。summaryで情報が得られるのも同じ。+を使えば多元にできるし、*を使えば交互作用を調べられる
カテゴリデータ: factor(因子) カテゴリを示すときに因子を多用する • データフレームを読み込むと文字列は因子に変換*される • 数字に名前がついたもの • 同じ名前のものが同じカテゴリとして扱われる *stringAsFactors
= Tがデフォルトなので、read.table関数で読み込むと変換が起きる
多重比較: Tukeyの方法 総当りの比較にはTukeyの方法を用いる TukeyHSD(aovの結果)で計算できる *他にScheffeやDunnett、Kruskal-Wallis、holm、Bonferroniの方法などがある
検出力の計算 検定の検出力はpowerから始まる関数で行う power.t.test, power.prop.test, power.anova.testなどがある これが検出力
例数の計算 例数もpowerから始まる関数で計算できる これが例数
まとめ • Rには統計に関する手法・パッケージが豊富にある • カテゴリデータの扱いに因子を用いる • 「R 統計手法」で検索すれば、だいたい手法が見つかる