※前日からやって間に合わなかったという苦情は受け付けません
共テの確率分布簡単だからみんなやろうぜという布教のために作りました。 確率分布なんもわからんという人でも公式を覚えて多少演習を積めばできるようになると思います。 皆も確率分布、解こう!
共テ前日からでも間に合う確率分布しーぴー (@__cp20__)
View Slide
講習会の対象と目標- 対象:2Bの確率分布を履修していない/履修したけど不安な人- 目標:共テ2Bの確率分布を短時間で満点を取る実力を身に着ける2
確率分布ってなんだ例えば...- しーぴー君はとあるガチャを引くことにしました- そのガチャの★5の排出率は0.8%です- しーぴー君はこのガチャを200回分回しましたという状況のとき- ★5を1回も引けない確率を求めなさい / ★5をただ1回引く確率を求めなさいとすると、ただの確率の問題(計算めんどいけど...)3
確率分布ってなんだじゃあ確率分布ってなんだ- 何回出るかを変数(確率変数)とした確率をまとめた表のことさっきの例で言えば4引く個数 X 0 1 2 3 4 …確率 P(X) 20.1% 32.4% 26.0% 13.8% 5.5% …
わかると何が嬉しいの?世の中に確率分布はいっぱいある- ガチャはその代表例- その他にもダイス、偏差値、etc…共テに役立つ!- 今回のメインのテーマ- 数列・ベクトルに比べれば遥かに簡単- ただし個別入試では範囲から除かれていることが多いので役に立たない5
共テ確率分布を簡単に制覇するコツ公式とその適用方法を暗記する6
確率分布で押さえるべきポイント1. 期待値・分散の計算2. 二項分布の正規分布への近似3. 正規分布表の見方4. 信頼区間5. 確率密度関数による期待値太字は特に重要な部分7
1. 期待値・分散の計算8
1. 期待値・分散の計算 ー 用語の確認- 期待値:これぐらい出るんじゃね?っていう値例:サイコロの出目の期待値は 1×⅙+2×⅙+3×⅙+4×⅙+5×⅙+6×⅙ = 3.5- 分散:どれぐらい値がバラバラなのかな?っていう値例:さっきの分散は (3.5-1)²+(3.5-2)²+(3.5-3)²+(3.5-4)²+(3.5-5)²+(3.5-6)² = 35/12- 標準偏差:分散の平方根例:さっきの標準偏差は √(35/12)9
1. 期待値・分散の計算 ー 公式集- 期待値- E(X+Y) = E(X)+E(Y)- E(XY) = E(X)×E(Y)- E(aX+b) = aE(X)+b(a, bは定数)- 分散- V(X+Y) = V(X)+V(Y) ← XとYが無関係なら- V(aX+b)=a²V(X) ← 二乗されるので注意!- V(X) = E(X²)-{E(X)}²10- 標準偏差- σ(aX) = |a|σ(X)字が薄いものは重要度低め
1. 期待値・分散の計算 ー 練習問題- 1から10までの数が書いてるカードが1枚ずつある。そこから無作為に1枚取り出したときのカードの数字をXとする。Xの期待値・分散・標準偏差を求めよ(解答)E(X) = (1+2+3+4+5+6+7+8+9+10) ÷ 10 = ½×10×(10+1) ÷ 10 = 11/2V(X) = (1²+2²+3²+4²+5²+6²+7²+8²+9²+10²) ÷ 10 - {E(X)}²= ⅙×10×11×21 ÷ 10 - (11/2)² = 33/4σ(X) = √{V(X)} = √(73/4) = √33/211
2. 二項分布の正規分布への近似12
2. 二項分布の正規分布への近似 ー 用語の確認- 二項分布 B(n, p):確率pで起こることをn回やってみた時の確率分布例:0.8%の確率で当たるガチャを200回引く確率分布は B(200, 0.008)- 正規分布 N(m, σ²):いろいろ応用できるいい感じの分布二項分布はNが十分に大きいとき正規分布に近似できる13
2. 二項分布の正規分布への近似 ー 公式- Xが二項分布 B(n, p) に従うときE(X) = np, V(X) = np(1-p), σ(X) = √{np(1-p)}- nが十分大きいときB(n, p) ≒ N(np, np(1-p)) or B(回数, 確率) ≒ N(期待値, 分散)14
2. 二項分布の正規分布への近似 ー 練習問題- コイン1000枚を投げた時、表の枚数の確率分布を二項分布を用いて求めよ。またそれを正規分布に近似して表せ。(解答)B(1000, ½), N(500, 250)15
3. 正規分布表の見方16
3. 正規分布表の見方 ー 用語の確認- 標準正規分布:平均0、標準偏差1の正規分布のこと。N(0, 1) と表される- 標準化:確率変数を標準正規分布に沿うように変換すること → 公式17
3. 正規分布表の見方 ー 公式Xが N(m, σ²) に従うときZ = (X - m) / σとするとZは N(0, 1) に従う18E(X-m) = E(X) - mV(aX) = a²V(X)
3. 正規分布表の見方 ー 正規分布表を見る- 正規分布表を見ると、標準正規分布Zに対して 0≦Z≦n となる確率がわかる- この確率を p(n) と表記することが多い- 左の行が小数点1桁以上、上の列が小数点2桁目を指定している- 例えば p(0.84) は□の部分19
3. 正規分布表の見方 ー 公式その220- P(0≦Z≦n) = p(n)(定義) → ■ の部分- P(Z≧n) = 0.5 - p(n) → (■ + ■) - ■- P(|Z|≦n) = 2×p(n) → (■ + ■)- P(|Z|≧n) = 1 - 2×p(n)※p(n)は正規分布表のnの値
3. 正規分布表の見方 ー 練習問題- Xが正規分布 N(20, 25) に従うとき、X≧25 となる確率を正規分布表を用いて答えよ(解答)標準化すると Z = (X - 20) / 5なので P(X≧25) = P(Z≧1) = 0.5 - p(1)正規分布表より p(1) = 0.158721
4. 信頼区間22
4. 信頼区間 ー 標本調査今までは- (母集団の)期待値 → 確率分布を考えていたが、標本調査は- 確率分布 → (母集団の)期待値を求めるものである23母集団標本
4. 信頼区間 ー 母標準偏差と標本標準偏差- 母標準偏差 σ:母集団の標準偏差- 標本標準偏差 σ’:標本の標準偏差標本の大きさをnとすると σ’ = σ / √n が成り立つ※ 標本を沢山とってきた方が正確性が上がるイメージ24
4. 信頼区間 ー 用語の確認- 95%の信頼区間:95%の確率で平均値(期待値)を含む*範囲※稀に99%の信頼区間もある*95%の確率で平均値を含むとは、同じような集団を100コ取ってきた時に95コ程度は真の平均値を含むという意味25
4. 信頼区間 ー 公式平均値をm、標準偏差をσ、標本数をnとすると- 95%の信頼区間:[m - 1.96×σ÷√n, m + 1.96×σ÷√n]- 95%の信頼区間の幅: 2×1.96×σ÷√n母比率をp、標本数をnとすると- 95%の信頼区間:[m - 1.96×√{p(1-p)}÷√n, m + 1.96×√{p(1-p)}÷√n]- 95%の信頼区間の幅: 2×1.96×√{p(1-p)}÷√n※99%の場合は1.96ではなく2.58を使う26標本標準偏差でも母標準偏差でもOK
4. 信頼区間 ー 練習問題- あるガチャからは一定の確率で★5のキャラが出る。そのガチャを10000回引いたところ100回★5のキャラが出た。このガチャの★5の排出率を信頼度95%で推定せよ。ただし√11=3.3とし、答えは百分率で小数点1桁までで答えよ。(解答)母比率p = 100 ÷ 10000 = 0.01 と推定できる1.96×√{0.01(1-0.01)}÷√(10000) = 1.96×(3√11/100)÷100 ≒ 0.00194 なので95%の信頼区間は [0.8%, 1.2%]27
5. 確率密度関数による期待値28
5. 確率密度関数による期待値 ー 用語の確認- 確率密度関数:確率分布を表すなめらかな関数29画像の引用元:https://bellcurve.jp/statistics/course/6602.html
5. 確率密度関数による期待値 ー 公式確率密度関数 f(x) (a≦x≦b) とすると- ∫[a,b] f(x) dx = 1 ← 確率密度関数の条件- E(X) = ∫[a,b] x×f(x) dx- V(X) = ∫[a,b] (x-m)²×f(x) dx30
5. 確率密度関数による期待値 ー 練習問題- 確率変数Xが確率密度関数 f(x) = 2x (0≦x≦1) に従うとき、期待値E(X)と分散V(X)を求めよ(解答)E(X) = ∫[0,1] (x×2x) dx = ⅔V(X) = ∫[0,1] {(x-⅔)²×2x} dx = 1/18積分は頑張ってください ...31
実際の問題を解いてみよう32
令和3年度 共通テスト 本試 2B 第3問出典:https://www.dnc.ac.jp/kyotsu/kako_shiken_jouhou/r3/r3_jisshikekka/r3_dai1_mondai.html 33ア:B(100, 0.5)イウ:100×0.5 = 50エ:√{100×0.5×(1-0.5)} = 5
令和3年度 共通テスト 本試 2B 第3問出典:https://www.dnc.ac.jp/kyotsu/kako_shiken_jouhou/r3/r3_jisshikekka/r3_dai1_mondai.html 34オ:p₅ = P(X≦36) = P(Z≦-14/5)= 0.5 - p(2.8)≒ 0.003カ:p₄ = P(Y≦36) = P(Z≦-√6/3)> P(Z≦-14/5)∴p₄ > p₅XはN(50, 25)に従う→Z=(X-50) / 5YはB(100, 0.4)YはN(40, 24)に従う→Z=(Y-40) / 2√6
令和3年度 共通テスト 本試 2B 第3問出典:https://www.dnc.ac.jp/kyotsu/kako_shiken_jouhou/r3/r3_jisshikekka/r3_dai1_mondai.html 35キクケ: C₁ + C₂ = 2×m = 408コサ.シ: C₂ - C₁ = 2×1.96×150÷√(100)= 58.8ス:③信頼区間の中に95%の確率でmが入っているだけでどちらも必ず成り立つとは限らない
令和3年度 共通テスト 本試 2B 第3問出典:https://www.dnc.ac.jp/kyotsu/kako_shiken_jouhou/r3/r3_jisshikekka/r3_dai1_mondai.html 36セ:③全く異なる調査=独立なので結果に関係はない
令和3年度 共通テスト 本試 2B 第3問出典:https://www.dnc.ac.jp/kyotsu/kako_shiken_jouhou/r3/r3_jisshikekka/r3_dai1_mondai.html 37ソ・タ:②・④② 極端な場合を考えればあり得る④ 信頼区間の幅は母標準偏差と標本数にのみ比例する
追加問題38
追加問題 ー 解答・解説(1) Xは B(400, ½) に従うので、近似的に N(200, 100) に従うので、 Z = (X / n) - ½ とするとZは N(0, (0.025)²) に従う P(|Z|≦0.01) = 2×p(0.4) = 0.310(2) 信頼区間の幅は 2 × 1.96 × √{½(1-½)} ÷ √n ≦ 0.01⇔ 196 ≦ √n⇔ 38416 ≦ nよって求めるnは 3840039
オマケ:偏差値40
偏差値ってなんだろう自分がどれぐらいすごいのかを数値化したもの- 偏差値 = (x - m) ×10 ÷ σ + 50(x:自分の点数, m:平均点, σ:標準偏差)この仕組みを知っていると偏差値に関する疑問が解決する- 偏差値ってマイナスになるの? → 理論上は可能(下位約0.00003%)- 偏差値が60って上位何%? → 15.9%ぐらい( ∵p(1.0) = 0.3413 )41
オマケ2:公式集42
- 正規分布の標準化:Z = (X - m) / σ- Xが N(m, σ²) に従うとき、この変換を行うとZは N(0, 1) に従う- 二項分布:B(n, p) ≒ N(np, np(1-p)) or B(回数, 確率) ≒ N(期待値, 分散)- 95%の信頼区間:[m - 1.96×σ÷√n, m + 1.96×σ÷√n]- 99%のときは1.96ではなく2.58- 分散の求め方:V(X) = E(X²) - {E(X)}²- 定義から求めるより早い(ことが多い)- 確率密度関数:∫[a,b] x×f(x) dx = 1 E(X) = ∫[a,b] x×f(x) dx43でる順 ー 確率分布の公式集