Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Rの基礎9 基本的な統計と検定
Search
xjorv
January 23, 2021
Education
0
200
Rの基礎9 基本的な統計と検定
Rの基礎9では、Rでの統計や検定の基礎について説明します。
xjorv
January 23, 2021
Tweet
Share
More Decks by xjorv
See All by xjorv
コンパートメントモデル
xjorv
3
5.5k
コンパートメントモデルをStanで解く
xjorv
0
440
生物学的同等性試験 検出力の計算法
xjorv
0
3.4k
生物学的同等性試験ガイドライン 同等性パラメータの計算方法
xjorv
0
6.1k
粉体特性2
xjorv
0
2.4k
粉体特性1
xjorv
0
2.8k
皮膜5
xjorv
0
2.3k
皮膜4
xjorv
0
2.2k
皮膜3
xjorv
0
2.2k
Other Decks in Education
See All in Education
Sponsor the Conference | VizChitra 2025
vizchitra
0
560
AIの時代こそ、考える知的学習術
yum3
2
170
計算情報学研究室 (数理情報学第7研究室)紹介スライド (2025)
tomonatu8
0
540
実務プログラム
takenawa
0
6.8k
Human-AI Interaction - Lecture 11 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
470
Constructing a Custom TeX Ecosystem for Educational Institutions—Beyond Academic Typesetting
doratex
1
11k
i-GIP 2025 中高生のみなさんへ資料
202200
0
500
新卒交流ワークショップ
pokotyamu
0
440
2025年度春学期 統計学 第5回 分布をまとめるー記述統計量(平均・分散など) (2025. 5. 8)
akiraasano
PRO
0
130
2025.05.10 技術書とVoicyとわたし #RPALT
kaitou
1
230
ビジネスモデル理解
takenawa
0
6.9k
Tutorial: Foundations of Blind Source Separation and Its Advances in Spatial Self-Supervised Learning
yoshipon
1
120
Featured
See All Featured
We Have a Design System, Now What?
morganepeng
53
7.7k
RailsConf 2023
tenderlove
30
1.1k
4 Signs Your Business is Dying
shpigford
184
22k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
50
5.5k
Optimising Largest Contentful Paint
csswizardry
37
3.3k
Building Flexible Design Systems
yeseniaperezcruz
328
39k
Measuring & Analyzing Core Web Vitals
bluesmoon
7
510
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
138
34k
Designing for humans not robots
tammielis
253
25k
A Modern Web Designer's Workflow
chriscoyier
695
190k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
Transcript
Rの基礎 9 基本的な統計と検定 2020/8/15 Ver. 1.0
基本統計量 ベクトルの平均・分散・標準偏差などは関数で簡単に求まる mean sd var max min quantile sum median
平均値 標準偏差 分散 最大値 最小値 4分位値 合計 中央値
summary関数 基本統計量はsummary関数で表示できる データがあれば、とりあえずsummary関数の引数にしてみる
確率分布と乱数 Rでは、確率分布に従った乱数を簡単に得ることができる *乱数: ランダムな数のこと。乱数シミュレーションなどで利用できる runif rnorm rbinom rpois 一様分布 正規分布
二項分布 ポアソン分布
確率分布のグラフ histやggplot2のgeom_densityを用いる *平均0、標準偏差1の正規乱数200000個を生成し、ヒストグラムや確率密度関数にしたもの
相関係数 相関係数も相関行列もcor関数で得られる
直線回帰 直線回帰はlm関数で計算できる • Rでは、Y~Xという表現で2数の関係を示す • Yが従属変数、Xが説明変数となる • Interceptは切片、説明変数の数字は傾きとなる 切片 傾き
直線回帰の詳しい情報 回帰の結果をsummary関数の引数に取る 切片と傾き 切片と傾きの検定結果 *検定では傾きや切片が有意にゼロから離れていることを示す
重回帰分析 重回帰もlm関数で計算できる • 説明変数を+でつなぐだけ • +を*に変えると、交互作用を計算できる
平均の差の検定: t検定 t検定は、t.test関数で実行できる t.test(1つ目の集団, 2つ目の集団)で計算できる これがp値 Welchは等分散でないときのt検定の拡張
平均の差の検定: ウィルコクソンの順位和検定 ウィルコクソンはt検定のノンパラメトリック*版 wilcox.test(1つ目の集団, 2つ目の集団)で計算できる *ノンパラメトリック: 集団が正規分布しないときに使用する検定手法。検出力が低い
分散分析 aov関数で計算できる aov(差を知りたいデータ~カテゴリデータ)で計算できる *線形回帰のlmをaovに変えただけ。summaryで情報が得られるのも同じ。+を使えば多元にできるし、*を使えば交互作用を調べられる
カテゴリデータ: factor(因子) カテゴリを示すときに因子を多用する • データフレームを読み込むと文字列は因子に変換*される • 数字に名前がついたもの • 同じ名前のものが同じカテゴリとして扱われる *stringAsFactors
= Tがデフォルトなので、read.table関数で読み込むと変換が起きる
多重比較: Tukeyの方法 総当りの比較にはTukeyの方法を用いる TukeyHSD(aovの結果)で計算できる *他にScheffeやDunnett、Kruskal-Wallis、holm、Bonferroniの方法などがある
検出力の計算 検定の検出力はpowerから始まる関数で行う power.t.test, power.prop.test, power.anova.testなどがある これが検出力
例数の計算 例数もpowerから始まる関数で計算できる これが例数
まとめ • Rには統計に関する手法・パッケージが豊富にある • カテゴリデータの扱いに因子を用いる • 「R 統計手法」で検索すれば、だいたい手法が見つかる