Upgrade to Pro — share decks privately, control downloads, hide ads and more …

用十分鐘瞭解 機率、統計、還有 R 軟體

陳鍾誠
November 11, 2016

用十分鐘瞭解 機率、統計、還有 R 軟體

陳鍾誠

November 11, 2016
Tweet

More Decks by 陳鍾誠

Other Decks in Education

Transcript

  1. 用十分鐘瞭解 機率、統計、還有 R 軟體 陳鍾誠 2016 年 7 月 1

    日 程式人《十分鐘系列》 程式人《十分鐘系列》 本文衍生自維基百科
  2. 以下是一些抽樣的範例 二項分布,正面機率 0.5 ,每次抽 5 個,會有幾個正面 ( 共抽 20 組

    ) 布瓦松分布, lambda=3.5 ,抽 20 次 3 到 8 之間的均等分布,抽 20 個樣本 常態分佈 ( 平均值 5, 標準差 2) ,抽 20 個樣本 指數分佈 ( 參數為 2) ,抽 20 個樣本
  3. 這個程式 • 會畫出 1 個、 2 個、 10 個、 20

    個樣本的平均值之分布圖。
  4. 為了處理這個問題 • 英國在酒廠工作的 Willam S. Gosset 於 1908 年提出了《 t

    分布》,可以用來修正 常態 N 分布在 σ 未知時難以套用中央極限 定理的問題。
  5. 然後我們就可以用 t 分布來檢定 95% 信賴區間 自由度 24 代表有 25 個樣本

    檢定母體平均值 mu 是否為 8 x 的樣本平均值為 8.168483
  6. 像是這樣 母體平均 mu 值是 0 到 10 之間的一個亂數 母體標準差 sd1

    是 1 到 2 之間的一個亂數 用上述參數進行常態分佈抽樣 25 個 然後進行 t 檢定 然後進行 t 檢定,看看 mu 是否為 5 P 值很小,代表 mu 幾乎不可能為 5 樣本平均數 x 為 3.308194 95% 信賴區間範圍
  7. 或者用成對 t 檢定去檢驗 • 攝氏 70 度與 80 度時某元件斷裂強度是否有差異 •

    某班對某主題第二次考試的成績是否比第一次考 試進步 • 同一人在服用某維生素後是否比較不容易感冒。 t.test(x, y, paired=TRUE)