p 「分類」なので,他の計算の分類軸にする • 分類間のオッズ比を求めたり,分類間の代表値の差の検定をしたり n やってはいけないこと u 名義尺度そのものの数値計算全般 n ダメなアンケートの解析 u 性別欄に女性は1,男性は2 と記入してもらった u 性別欄のデータの 合計が1421,平均が1.45 だった 性別が 1421,1.45 とは? 性別って足したり,割ったりできるの? & たまたま女性を1にしただけで,女性が9999,男性が3,でもよかった
u 何かの機能の評価であれば,小さくなってほしい p 誰がどうやっても,同じ感じになってほしい p 例 • 平均点10で,分散がとても大きい:人によって0,20などばらつく • 平均点 6で,分散はとても小さい:だれがやっても 6前後 をとれる 44 目的や比較対象に照らして,適時意味を読み取るしかない
生成されたものとした場合に,こんな違いが出る確率は X% です。ということを示す n α:有意水準 u 前頁の最後 「小さかったら」の小さいの基準値 u 分野によって違うが概ね 5%,1%,0.1% のどれか p 昔の人が感覚的に決めたもので,特に意味はない • 「α=5%で有意」と言われたら「p値は5%以下でした」の意味 • “2つが同じである確率は5%より小さいです”という意味でもある 50
Amazonなどで検索すると,入門書・参考書が沢山出てきます p 「R 入門」とかで検索すると,参考サイトも沢山でてきます n 気をつけるべきポイント u 「統計的検定」には実は沢山の種類が… u データの尺度や,正規性の有無,後述する“対応の有無”など, 目的や条件によって,使うべき手法が異なります p 間違った手法を選ぶと,検定の意味がなくなります 51 「おまけ」のセクションにある チャートを使って適切な検定を選びましょう
p Amazonなどで検索すると,入門書・参考書が沢山出てきます p 「R 入門」とかで検索すると,参考サイトも沢山でてきます n 気をつけるべきポイント u 「相関係数」にも,いくつかの種類が… u データの尺度によって,使うべき手法が異なります p 間違った手法を選ぶと,相関の意味がなくなります 57 「おまけ」のセクションにある チャートを使って適切な手法を選びましょう
検出力の問題があるので,データの取り過ぎもよくないです u 計算式がありますが,まぁ Max 1000件 でしょうか? n 正規分布かどうか,分散が同じかわかりません u 「正規性の検定」と言うのがあるので,使ってみてください u 分散は「等分散性の検定」と言うのがあるので,そちらで n p値は小さい方が偉い・強い・格好いい・モテるんですか? u まあ,とりあえず 5% を下回っているかどうかだけを見ておけば 最低限はOKでしょうか u あとは0.1%でも4.9%でも一緒…くらいの気分がオススメです 67
http://www.minervashobo.co.jp/book/b48724.html n S.B Hulley, et al.:医学的研究のデザイン 第4版 - 研究の質を高める疫学的アプローチ -, メディカルサイエンスインターナショナル,2014 https://www.medsi.co.jp/books/products/detail.php?product_id=3400 n 統計学自習ノート(Webサイト) http://aoki2.si.gunma-u.ac.jp/lecture/tests.html u どんなときに,どの統計手法を使うか? u どういう数学的背景か? u Rのコマンドは? …などの情報がまとまっていて便利です 68
別に著者が存在しますので,改変等の際には, それぞれのライセンスに準じてご利用ください p クリップアートのライセンス • http://www.chojugiga.com/terms/ • http://icooon-mono.com/license/ u その他の部分(文字部分のほとんど) p 著作権の放棄はしませんが,再配布,改変,配信等ご自由に! 77