Upgrade to Pro — share decks privately, control downloads, hide ads and more …

共テ前日からでも間に合う確率分布

しーぴー
December 12, 2022

 共テ前日からでも間に合う確率分布

※前日からやって間に合わなかったという苦情は受け付けません

共テの確率分布簡単だからみんなやろうぜという布教のために作りました。
確率分布なんもわからんという人でも公式を覚えて多少演習を積めばできるようになると思います。
皆も確率分布、解こう!

しーぴー

December 12, 2022
Tweet

More Decks by しーぴー

Other Decks in Education

Transcript

  1. 共テ前日からでも間に合う確率分布
    しーぴー (@__cp20__)

    View Slide

  2. 講習会の対象と目標
    - 対象:2Bの確率分布を履修していない/履修したけど不安な人
    - 目標:共テ2Bの確率分布を短時間で満点を取る実力を身に着ける
    2

    View Slide

  3. 確率分布ってなんだ
    例えば...
    - しーぴー君はとあるガチャを引くことにしました
    - そのガチャの★5の排出率は0.8%です
    - しーぴー君はこのガチャを200回分回しました
    という状況のとき
    - ★5を1回も引けない確率を求めなさい / ★5をただ1回引く確率を求めなさい
    とすると、ただの確率の問題(計算めんどいけど...)
    3

    View Slide

  4. 確率分布ってなんだ
    じゃあ確率分布ってなんだ
    - 何回出るかを変数(確率変数)とした確率をまとめた表のこと
    さっきの例で言えば
    4
    引く個数 X 0 1 2 3 4 …
    確率 P(X) 20.1% 32.4% 26.0% 13.8% 5.5% …

    View Slide

  5. わかると何が嬉しいの?
    世の中に確率分布はいっぱいある
    - ガチャはその代表例
    - その他にもダイス、偏差値、etc…
    共テに役立つ!
    - 今回のメインのテーマ
    - 数列・ベクトルに比べれば遥かに簡単
    - ただし個別入試では範囲から除かれていることが多いので役に立たない
    5

    View Slide

  6. 共テ確率分布を簡単に制覇するコツ
    公式とその適用方法を暗記する
    6

    View Slide

  7. 確率分布で押さえるべきポイント
    1. 期待値・分散の計算
    2. 二項分布の正規分布への近似
    3. 正規分布表の見方
    4. 信頼区間
    5. 確率密度関数による期待値
    太字は特に重要な部分
    7

    View Slide

  8. 1. 期待値・分散の計算
    8

    View Slide

  9. 1. 期待値・分散の計算 ー 用語の確認
    - 期待値:これぐらい出るんじゃね?っていう値
    例:サイコロの出目の期待値は 1×⅙+2×⅙+3×⅙+4×⅙+5×⅙+6×⅙ = 3.5
    - 分散:どれぐらい値がバラバラなのかな?っていう値
    例:さっきの分散は (3.5-1)²+(3.5-2)²+(3.5-3)²+(3.5-4)²+(3.5-5)²+(3.5-6)² = 35/12
    - 標準偏差:分散の平方根
    例:さっきの標準偏差は √(35/12)
    9

    View Slide

  10. 1. 期待値・分散の計算 ー 公式集
    - 期待値
    - E(X+Y) = E(X)+E(Y)
    - E(XY) = E(X)×E(Y)
    - E(aX+b) = aE(X)+b(a, bは定数)
    - 分散
    - V(X+Y) = V(X)+V(Y) ← XとYが無関係なら
    - V(aX+b)=a²V(X) ← 二乗されるので注意!
    - V(X) = E(X²)-{E(X)}²
    10
    - 標準偏差
    - σ(aX) = |a|σ(X)
    字が薄いものは重要度低め

    View Slide

  11. 1. 期待値・分散の計算 ー 練習問題
    - 1から10までの数が書いてるカードが1枚ずつある。そこから無作為に1枚取り出した
    ときのカードの数字をXとする。Xの期待値・分散・標準偏差を求めよ
    (解答)
    E(X) = (1+2+3+4+5+6+7+8+9+10) ÷ 10 = ½×10×(10+1) ÷ 10 = 11/2
    V(X) = (1²+2²+3²+4²+5²+6²+7²+8²+9²+10²) ÷ 10 - {E(X)}²
    = ⅙×10×11×21 ÷ 10 - (11/2)² = 33/4
    σ(X) = √{V(X)} = √(73/4) = √33/2
    11

    View Slide

  12. 2. 二項分布の正規分布への近似
    12

    View Slide

  13. 2. 二項分布の正規分布への近似 ー 用語の確認
    - 二項分布 B(n, p):確率pで起こることをn回やってみた時の確率分布
    例:0.8%の確率で当たるガチャを200回引く確率分布は B(200, 0.008)
    - 正規分布 N(m, σ²):いろいろ応用できるいい感じの分布
    二項分布はNが十分に大きいとき正規分布に近似できる
    13

    View Slide

  14. 2. 二項分布の正規分布への近似 ー 公式
    - Xが二項分布 B(n, p) に従うとき
    E(X) = np, V(X) = np(1-p), σ(X) = √{np(1-p)}
    - nが十分大きいとき
    B(n, p) ≒ N(np, np(1-p)) or B(回数, 確率) ≒ N(期待値, 分散)
    14

    View Slide

  15. 2. 二項分布の正規分布への近似 ー 練習問題
    - コイン1000枚を投げた時、表の枚数の確率分布を二項分布を用いて求めよ。また
    それを正規分布に近似して表せ。
    (解答)
    B(1000, ½), N(500, 250)
    15

    View Slide

  16. 3. 正規分布表の見方
    16

    View Slide

  17. 3. 正規分布表の見方 ー 用語の確認
    - 標準正規分布:平均0、標準偏差1の正規分布のこと。N(0, 1) と表される
    - 標準化:確率変数を標準正規分布に沿うように変換すること → 公式
    17

    View Slide

  18. 3. 正規分布表の見方 ー 公式
    Xが N(m, σ²) に従うとき
    Z = (X - m) / σ
    とするとZは N(0, 1) に従う
    18
    E(X-m) = E(X) - m
    V(aX) = a²V(X)

    View Slide

  19. 3. 正規分布表の見方 ー 正規分布表を見る
    - 正規分布表を見ると、標準正規分布Zに対して 0≦Z≦n となる確率がわかる
    - この確率を p(n) と表記することが多い
    - 左の行が小数点1桁以上、上の列が小数点2桁目を指定している
    - 例えば p(0.84) は□の部分
    19

    View Slide

  20. 3. 正規分布表の見方 ー 公式その2
    20
    - P(0≦Z≦n) = p(n)(定義) → ■ の部分
    - P(Z≧n) = 0.5 - p(n) → (■ + ■) - ■
    - P(|Z|≦n) = 2×p(n) → (■ + ■)
    - P(|Z|≧n) = 1 - 2×p(n)
    ※p(n)は正規分布表のnの値

    View Slide

  21. 3. 正規分布表の見方 ー 練習問題
    - Xが正規分布 N(20, 25) に従うとき、X≧25 となる確率を正規分布表を用いて答え

    (解答)
    標準化すると Z = (X - 20) / 5
    なので
     P(X≧25) = P(Z≧1) = 0.5 - p(1)
    正規分布表より
     p(1) = 0.1587
    21

    View Slide

  22. 4. 信頼区間
    22

    View Slide

  23. 4. 信頼区間 ー 標本調査
    今までは
    - (母集団の)期待値 → 確率分布
    を考えていたが、標本調査は
    - 確率分布 → (母集団の)期待値
    を求めるものである
    23
    母集団
    標本

    View Slide

  24. 4. 信頼区間 ー 母標準偏差と標本標準偏差
    - 母標準偏差 σ:母集団の標準偏差
    - 標本標準偏差 σ’:標本の標準偏差
    標本の大きさをnとすると σ’ = σ / √n が成り立つ
    ※ 標本を沢山とってきた方が正確性が上がるイメージ
    24

    View Slide

  25. 4. 信頼区間 ー 用語の確認
    - 95%の信頼区間:95%の確率で平均値(期待値)を含む*範囲
    ※稀に99%の信頼区間もある
    *95%の確率で平均値を含むとは、同じような集団を100コ取ってきた時に95コ程度は真の平均値を含むという意味
    25

    View Slide

  26. 4. 信頼区間 ー 公式
    平均値をm、標準偏差をσ、標本数をnとすると
    - 95%の信頼区間:[m - 1.96×σ÷√n, m + 1.96×σ÷√n]
    - 95%の信頼区間の幅: 2×1.96×σ÷√n
    母比率をp、標本数をnとすると
    - 95%の信頼区間:[m - 1.96×√{p(1-p)}÷√n, m + 1.96×√{p(1-p)}÷√n]
    - 95%の信頼区間の幅: 2×1.96×√{p(1-p)}÷√n
    ※99%の場合は1.96ではなく2.58を使う
    26
    標本標準偏差でも
    母標準偏差でもOK

    View Slide

  27. 4. 信頼区間 ー 練習問題
    - あるガチャからは一定の確率で★5のキャラが出る。そのガチャを10000回引いたと
    ころ100回★5のキャラが出た。このガチャの★5の排出率を信頼度95%で推定せ
    よ。ただし√11=3.3とし、答えは百分率で小数点1桁までで答えよ。
    (解答)
    母比率p = 100 ÷ 10000 = 0.01 と推定できる
    1.96×√{0.01(1-0.01)}÷√(10000) = 1.96×(3√11/100)÷100 ≒ 0.00194 なので
    95%の信頼区間は [0.8%, 1.2%]
    27

    View Slide

  28. 5. 確率密度関数による期待値
    28

    View Slide

  29. 5. 確率密度関数による期待値 ー 用語の確認
    - 確率密度関数:確率分布を表すなめらかな関数
    29
    画像の引用元:https://bellcurve.jp/statistics/course/6602.html

    View Slide

  30. 5. 確率密度関数による期待値 ー 公式
    確率密度関数 f(x) (a≦x≦b) とすると
    - ∫[a,b] f(x) dx = 1 ← 確率密度関数の条件
    - E(X) = ∫[a,b] x×f(x) dx
    - V(X) = ∫[a,b] (x-m)²×f(x) dx
    30

    View Slide

  31. 5. 確率密度関数による期待値 ー 練習問題
    - 確率変数Xが確率密度関数 f(x) = 2x (0≦x≦1) に従うとき、期待値E(X)と分散V(X)
    を求めよ
    (解答)
    E(X) = ∫[0,1] (x×2x) dx = ⅔
    V(X) = ∫[0,1] {(x-⅔)²×2x} dx = 1/18
    積分は頑張ってください ...
    31

    View Slide

  32. 実際の問題を解いてみよう
    32

    View Slide

  33. 令和3年度 共通テスト 本試 2B 第3問
    出典:https://www.dnc.ac.jp/kyotsu/kako_shiken_jouhou/r3/r3_jisshikekka/r3_dai1_mondai.html 33
    ア:B(100, 0.5)
    イウ:100×0.5 = 50
    エ:√{100×0.5×(1-0.5)} = 5

    View Slide

  34. 令和3年度 共通テスト 本試 2B 第3問
    出典:https://www.dnc.ac.jp/kyotsu/kako_shiken_jouhou/r3/r3_jisshikekka/r3_dai1_mondai.html 34
    オ:p₅ = P(X≦36) = P(Z≦-14/5)
    = 0.5 - p(2.8)
    ≒ 0.003
    カ:p₄ = P(Y≦36) = P(Z≦-√6/3)
    > P(Z≦-14/5)
    ∴p₄ > p₅
    XはN(50, 25)に従う
    →Z=(X-50) / 5
    YはB(100, 0.4)
    YはN(40, 24)に従う
    →Z=(Y-40) / 2√6

    View Slide

  35. 令和3年度 共通テスト 本試 2B 第3問
    出典:https://www.dnc.ac.jp/kyotsu/kako_shiken_jouhou/r3/r3_jisshikekka/r3_dai1_mondai.html 35
    キクケ:
     C₁ + C₂ = 2×m = 408
    コサ.シ:
     C₂ - C₁ = 2×1.96×150÷√(100)
    = 58.8
    ス:③
    信頼区間の中に95%の確率でmが入っているだ
    けでどちらも必ず成り立つとは限らない

    View Slide

  36. 令和3年度 共通テスト 本試 2B 第3問
    出典:https://www.dnc.ac.jp/kyotsu/kako_shiken_jouhou/r3/r3_jisshikekka/r3_dai1_mondai.html 36
    セ:③
    全く異なる調査=独立なので結果に関
    係はない

    View Slide

  37. 令和3年度 共通テスト 本試 2B 第3問
    出典:https://www.dnc.ac.jp/kyotsu/kako_shiken_jouhou/r3/r3_jisshikekka/r3_dai1_mondai.html 37
    ソ・タ:②・④
    ② 極端な場合を考えればあり得る
    ④ 信頼区間の幅は母標準偏差と標本数にの
    み比例する

    View Slide

  38. 追加問題
    38

    View Slide

  39. 追加問題 ー 解答・解説
    (1) Xは B(400, ½) に従うので、近似的に N(200, 100) に従うので、
      Z = (X / n) - ½ とするとZは N(0, (0.025)²) に従う
     P(|Z|≦0.01) = 2×p(0.4) = 0.310
    (2) 信頼区間の幅は
     2 × 1.96 × √{½(1-½)} ÷ √n ≦ 0.01
    ⇔ 196 ≦ √n
    ⇔ 38416 ≦ n
    よって求めるnは 38400
    39

    View Slide

  40. オマケ:偏差値
    40

    View Slide

  41. 偏差値ってなんだろう
    自分がどれぐらいすごいのかを数値化したもの
    - 偏差値 = (x - m) ×10 ÷ σ + 50(x:自分の点数, m:平均点, σ:標準偏差)
    この仕組みを知っていると偏差値に関する疑問が解決する
    - 偏差値ってマイナスになるの? → 理論上は可能(下位約0.00003%)
    - 偏差値が60って上位何%? → 15.9%ぐらい( ∵p(1.0) = 0.3413 )
    41

    View Slide

  42. オマケ2:公式集
    42

    View Slide

  43. - 正規分布の標準化:Z = (X - m) / σ
    - Xが N(m, σ²) に従うとき、この変換を行うとZは N(0, 1) に従う
    - 二項分布:B(n, p) ≒ N(np, np(1-p)) or B(回数, 確率) ≒ N(期待値, 分散)
    - 95%の信頼区間:[m - 1.96×σ÷√n, m + 1.96×σ÷√n]
    - 99%のときは1.96ではなく2.58
    - 分散の求め方:V(X) = E(X²) - {E(X)}²
    - 定義から求めるより早い(ことが多い)
    - 確率密度関数:∫[a,b] x×f(x) dx = 1 E(X) = ∫[a,b] x×f(x) dx
    43
    でる順 ー 確率分布の公式集

    View Slide