Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Rの基礎9 基本的な統計と検定
Search
xjorv
PRO
January 23, 2021
Education
0
160
Rの基礎9 基本的な統計と検定
Rの基礎9では、Rでの統計や検定の基礎について説明します。
xjorv
PRO
January 23, 2021
Tweet
Share
More Decks by xjorv
See All by xjorv
コンパートメントモデル
xjorv
PRO
0
4.1k
コンパートメントモデルをStanで解く
xjorv
PRO
0
260
生物学的同等性試験 検出力の計算法
xjorv
PRO
0
2.6k
生物学的同等性試験ガイドライン 同等性パラメータの計算方法
xjorv
PRO
0
3.8k
粉体特性2
xjorv
PRO
0
2k
粉体特性1
xjorv
PRO
0
2.2k
皮膜5
xjorv
PRO
0
1.9k
皮膜4
xjorv
PRO
0
1.8k
皮膜3
xjorv
PRO
0
1.8k
Other Decks in Education
See All in Education
高可用性システム構築 - Oracle Data Guard基本編
oracle4engineer
PRO
2
1.1k
@ngrx/signals
yannickbaron
0
170
4 занятие. Разбор бизнес-моделей и метод красной нити #ideaNN 9.02.2024.
karlov
0
230
D&I推進レポート〜テクノロジー分野のジェンダーギャップとその取り組みについて〜
codeforeveryone
1
900
Project Sprint 学生版(入門編)
copilot
PRO
0
180
執筆テーマの決め方
sapi_kawahara
1
180
「小・中・高等学校における情報教育の体系的な学習を目指したカリキュラムモデル基本方針」
codeforeveryone
0
1.4k
全員参加型で会社を強くしていく活動を考えてみる
ikefukurou777
0
210
Animaatiot opetuksessa
matleenalaakso
0
3.1k
View Manipulation and Reduction - Lecture 9 - Information Visualisation (4019538FNR)
signer
PRO
0
1.4k
Copilotとして理解する生成AI利用の基本
gmoriki
0
140
保育とふりかえりをコネクト! / connect childcare and retrospectives!
psj59129
1
150
Featured
See All Featured
Faster Mobile Websites
deanohume
299
30k
Web Components: a chance to create the future
zenorocha
305
41k
Designing the Hi-DPI Web
ddemaree
276
33k
For a Future-Friendly Web
brad_frost
172
9k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
17
1.4k
Unsuck your backbone
ammeep
663
57k
Rebuilding a faster, lazier Slack
samanthasiow
73
8.2k
5 minutes of I Can Smell Your CMS
philhawksworth
199
19k
Building Flexible Design Systems
yeseniaperezcruz
319
37k
Infographics Made Easy
chrislema
238
18k
How to name files
jennybc
65
93k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
352
28k
Transcript
Rの基礎 9 基本的な統計と検定 2020/8/15 Ver. 1.0
基本統計量 ベクトルの平均・分散・標準偏差などは関数で簡単に求まる mean sd var max min quantile sum median
平均値 標準偏差 分散 最大値 最小値 4分位値 合計 中央値
summary関数 基本統計量はsummary関数で表示できる データがあれば、とりあえずsummary関数の引数にしてみる
確率分布と乱数 Rでは、確率分布に従った乱数を簡単に得ることができる *乱数: ランダムな数のこと。乱数シミュレーションなどで利用できる runif rnorm rbinom rpois 一様分布 正規分布
二項分布 ポアソン分布
確率分布のグラフ histやggplot2のgeom_densityを用いる *平均0、標準偏差1の正規乱数200000個を生成し、ヒストグラムや確率密度関数にしたもの
相関係数 相関係数も相関行列もcor関数で得られる
直線回帰 直線回帰はlm関数で計算できる • Rでは、Y~Xという表現で2数の関係を示す • Yが従属変数、Xが説明変数となる • Interceptは切片、説明変数の数字は傾きとなる 切片 傾き
直線回帰の詳しい情報 回帰の結果をsummary関数の引数に取る 切片と傾き 切片と傾きの検定結果 *検定では傾きや切片が有意にゼロから離れていることを示す
重回帰分析 重回帰もlm関数で計算できる • 説明変数を+でつなぐだけ • +を*に変えると、交互作用を計算できる
平均の差の検定: t検定 t検定は、t.test関数で実行できる t.test(1つ目の集団, 2つ目の集団)で計算できる これがp値 Welchは等分散でないときのt検定の拡張
平均の差の検定: ウィルコクソンの順位和検定 ウィルコクソンはt検定のノンパラメトリック*版 wilcox.test(1つ目の集団, 2つ目の集団)で計算できる *ノンパラメトリック: 集団が正規分布しないときに使用する検定手法。検出力が低い
分散分析 aov関数で計算できる aov(差を知りたいデータ~カテゴリデータ)で計算できる *線形回帰のlmをaovに変えただけ。summaryで情報が得られるのも同じ。+を使えば多元にできるし、*を使えば交互作用を調べられる
カテゴリデータ: factor(因子) カテゴリを示すときに因子を多用する • データフレームを読み込むと文字列は因子に変換*される • 数字に名前がついたもの • 同じ名前のものが同じカテゴリとして扱われる *stringAsFactors
= Tがデフォルトなので、read.table関数で読み込むと変換が起きる
多重比較: Tukeyの方法 総当りの比較にはTukeyの方法を用いる TukeyHSD(aovの結果)で計算できる *他にScheffeやDunnett、Kruskal-Wallis、holm、Bonferroniの方法などがある
検出力の計算 検定の検出力はpowerから始まる関数で行う power.t.test, power.prop.test, power.anova.testなどがある これが検出力
例数の計算 例数もpowerから始まる関数で計算できる これが例数
まとめ • Rには統計に関する手法・パッケージが豊富にある • カテゴリデータの扱いに因子を用いる • 「R 統計手法」で検索すれば、だいたい手法が見つかる