Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Rの基礎9 基本的な統計と検定
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
xjorv
January 23, 2021
Education
0
210
Rの基礎9 基本的な統計と検定
Rの基礎9では、Rでの統計や検定の基礎について説明します。
xjorv
January 23, 2021
Tweet
Share
More Decks by xjorv
See All by xjorv
コンパートメントモデル
xjorv
3
5.9k
コンパートメントモデルをStanで解く
xjorv
0
490
生物学的同等性試験 検出力の計算法
xjorv
0
3.6k
生物学的同等性試験ガイドライン 同等性パラメータの計算方法
xjorv
0
6.5k
粉体特性2
xjorv
0
2.6k
粉体特性1
xjorv
0
2.9k
皮膜5
xjorv
0
2.4k
皮膜4
xjorv
0
2.3k
皮膜3
xjorv
0
2.3k
Other Decks in Education
See All in Education
焦りと不安を、技術力に変える方法 - 新卒iOSエンジニアの失敗談と成長のフレームワーク
hypebeans
1
660
Generative AI Leader 認定試験範囲の解説
cloudace
0
100
多様なメンター、多様な基準
yasulab
PRO
5
19k
国際卓越研究大学計画|Science Tokyo(東京科学大学)
sciencetokyo
PRO
0
47k
NUTMEG紹介スライド
mugiiicha
0
930
心理学を学び活用することで偉大なスクラムマスターを目指す − 大学とコミュニティを組み合わせた学びの循環 / Becoming a great Scrum Master by learning and using psychology
psj59129
1
1.7k
栃木にいても「だいじ」だっぺ〜! 栃木&全国アジャイルコミュニティへの参加・運営の魅力
sasakendayo
1
150
2026 Medicare 101 Presentation
robinlee
PRO
0
110
核軍備撤廃に向けた次の大きな一歩─核兵器を先には使わないと核保有国が約束すること
hide2kano
0
240
【ZEPホスト用メタバース校舎操作ガイド】
ainischool
0
170
MySmartSTEAM 2526
cbtlibrary
0
190
Introduction - Lecture 1 - Next Generation User Interfaces (4018166FNR)
signer
PRO
2
4.4k
Featured
See All Featured
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
0
190
Thoughts on Productivity
jonyablonski
74
5k
Statistics for Hackers
jakevdp
799
230k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
60
42k
A better future with KSS
kneath
240
18k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
94
Mind Mapping
helmedeiros
PRO
0
90
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
196
71k
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
190
Exploring the relationship between traditional SERPs and Gen AI search
raygrieselhuber
PRO
2
3.6k
Transcript
Rの基礎 9 基本的な統計と検定 2020/8/15 Ver. 1.0
基本統計量 ベクトルの平均・分散・標準偏差などは関数で簡単に求まる mean sd var max min quantile sum median
平均値 標準偏差 分散 最大値 最小値 4分位値 合計 中央値
summary関数 基本統計量はsummary関数で表示できる データがあれば、とりあえずsummary関数の引数にしてみる
確率分布と乱数 Rでは、確率分布に従った乱数を簡単に得ることができる *乱数: ランダムな数のこと。乱数シミュレーションなどで利用できる runif rnorm rbinom rpois 一様分布 正規分布
二項分布 ポアソン分布
確率分布のグラフ histやggplot2のgeom_densityを用いる *平均0、標準偏差1の正規乱数200000個を生成し、ヒストグラムや確率密度関数にしたもの
相関係数 相関係数も相関行列もcor関数で得られる
直線回帰 直線回帰はlm関数で計算できる • Rでは、Y~Xという表現で2数の関係を示す • Yが従属変数、Xが説明変数となる • Interceptは切片、説明変数の数字は傾きとなる 切片 傾き
直線回帰の詳しい情報 回帰の結果をsummary関数の引数に取る 切片と傾き 切片と傾きの検定結果 *検定では傾きや切片が有意にゼロから離れていることを示す
重回帰分析 重回帰もlm関数で計算できる • 説明変数を+でつなぐだけ • +を*に変えると、交互作用を計算できる
平均の差の検定: t検定 t検定は、t.test関数で実行できる t.test(1つ目の集団, 2つ目の集団)で計算できる これがp値 Welchは等分散でないときのt検定の拡張
平均の差の検定: ウィルコクソンの順位和検定 ウィルコクソンはt検定のノンパラメトリック*版 wilcox.test(1つ目の集団, 2つ目の集団)で計算できる *ノンパラメトリック: 集団が正規分布しないときに使用する検定手法。検出力が低い
分散分析 aov関数で計算できる aov(差を知りたいデータ~カテゴリデータ)で計算できる *線形回帰のlmをaovに変えただけ。summaryで情報が得られるのも同じ。+を使えば多元にできるし、*を使えば交互作用を調べられる
カテゴリデータ: factor(因子) カテゴリを示すときに因子を多用する • データフレームを読み込むと文字列は因子に変換*される • 数字に名前がついたもの • 同じ名前のものが同じカテゴリとして扱われる *stringAsFactors
= Tがデフォルトなので、read.table関数で読み込むと変換が起きる
多重比較: Tukeyの方法 総当りの比較にはTukeyの方法を用いる TukeyHSD(aovの結果)で計算できる *他にScheffeやDunnett、Kruskal-Wallis、holm、Bonferroniの方法などがある
検出力の計算 検定の検出力はpowerから始まる関数で行う power.t.test, power.prop.test, power.anova.testなどがある これが検出力
例数の計算 例数もpowerから始まる関数で計算できる これが例数
まとめ • Rには統計に関する手法・パッケージが豊富にある • カテゴリデータの扱いに因子を用いる • 「R 統計手法」で検索すれば、だいたい手法が見つかる