Save 37% off PRO during our Black Friday Sale! »

統計的推測の心構え:正しい質問をする

2e636598caed4cc1016a0c8d56c78371?s=47 Shogo Osawa
September 06, 2021

 統計的推測の心構え:正しい質問をする

統計学の入門書などであまり語られることのない前提について話しました。

2e636598caed4cc1016a0c8d56c78371?s=128

Shogo Osawa

September 06, 2021
Tweet

Transcript

  1. 統計的推測 心構え:正しい質問え:正しい質問をす正しい質問をするしい質問をする質問をするをする

  2. 例題1 2人の野球選手の野球選手野球選手AとBの野球選手打率を比較したい。を比較したい。したい質問をする。 Aはルーキーでルーキーで100打席中30安打、 Bはルーキーでベテランでで3,000打席中600安打の野球選手成績だった。だった。 現時点での打率は、での野球選手打率を比較したい。はルーキーで、Aが0.3、Bが0.2である。 AとBどちらの野球選手生涯打率を比較したい。が高いと言えるか?い質問をすると言えるか?えるか?

  3. 数理統計を知らない者の議論らない質問をする者の議論の野球選手議論 現時点での打率は、の野球選手打率を比較したい。が高いと言えるか?い質問をするAの野球選手方がが 生涯打率を比較したい。も高いのではない高いと言えるか?い質問をするの野球選手ではルーキーでない質問をするか? Aはルーキーでまだ打席数が少ないので、ない質問をするの野球選手で、 これから大きく落ちるかもきく落ちるかもしれ落ちるかもしれなちるかも高いのではないしれない質問をする 現時点での打率は、での野球選手打率を比較したい。とい質問をするう 定量的なデータを無視しているを無視しているしてい質問をするる 打率を比較したい。が今以上に高くなる可能に高くなる可能性高いと言えるか?く落ちるかもしれなる可能性もも高いのではない あるし、Bに高くなる可能性も高いのではない同じことが言えるじことが言えるか?える 生涯打率を比較したい。が3割を超える選手はを超える選手はえる選手はルーキーで

    ほとんどい質問をするない質問をする Aがそうだと言えるか?える根拠はないはルーキーでない質問をする
  4. 良い点に気づいてい質問をする点での打率は、に高くなる可能性気づいてはいるがづい質問をするてはルーキーでい質問をするるが… 現時点での打率は、の野球選手打率を比較したい。が高いと言えるか?い質問をするAの野球選手方がが 生涯打率を比較したい。も高いのではない高いと言えるか?い質問をするの野球選手ではルーキーでない質問をするか? Aはルーキーでまだ打席数が少ないので、ない質問をするの野球選手で、 これから大きく落ちるかもきく落ちるかもしれ落ちるかもしれなちるかも高いのではないしれない質問をする 現時点での打率は、での野球選手打率を比較したい。とい質問をするう 定量的なデータを無視しているを無視しているしてい質問をするる 打率を比較したい。が今以上に高くなる可能に高くなる可能性高いと言えるか?く落ちるかもしれなる可能性もも高いのではない あるし、Bに高くなる可能性も高いのではない同じことが言えるじことが言えるか?える 生涯打率を比較したい。が3割を超える選手はを超える選手はえる選手はルーキーで

    ほとんどい質問をするない質問をする Aがそうだと言えるか?える根拠はないはルーキーでない質問をする
  5. 質問をするが事象の不確実性をの野球選手不確実性もを 正しい質問をするしく落ちるかもしれ反映しているか?してい質問をするるか?

  6. 数理統計を学んだ者の問題設んだ者の議論の野球選手問をする題設定 二人の野球選手の野球選手真の打率は常に一の野球選手打率を比較したい。はルーキーで常に一定であるとに高くなる可能性一定であるとい質問をするう仮定の野球選手も高いのではないと… • AとBの野球選手打率を比較したい。の野球選手差ははルーキーで95%の野球選手確率を比較したい。で 0.0039から0.20の野球選手間に入りますに高くなる可能性入りますります 母比率を比較したい。の野球選手差はの野球選手信頼区間に入ります ⇛母比率の差の信 • AとBの野球選手打率を比較したい。が同じことが言えるじだったとすると、 この野球選手データを無視しているより打率を比較したい。が開く確率はく落ちるかもしれ確率を比較したい。はルーキーで2%です

    統計的仮説検定 ⇛母比率の差の信
  7. • – データを無視しているだけからの野球選手推測ではルーキーで何も結論が出せなも高いのではない結論が出せないせない質問をする – 人の野球選手間に入りますの野球選手仮定、恣意性も、偏見が必要が必要 • 解答がが曖昧 – 不確実な事象の不確実性をに高くなる可能性つい質問をするて、 100%の野球選手正しい質問をするしさで判断を下すことはを下すことはすことはルーキーで不可能

    – 誤差はや誤り確率をまず誤り確率を比較したい。をまず受け入れる受け入れるけ入りますれる
  8. 無限にありうるモデに高くなる可能性ありうるモデル • 打率を比較したい。はルーキーで常に一定であるとに高くなる可能性一定 • 打率を比較したい。はルーキーで歳を重ねると単調を重ねると単調に減ねると単調に減少・増加すに高くなる可能性減少ないので、・増加するする • 打率を比較したい。はルーキーでn歳を重ねると単調頃にピークを迎えに高くなる可能性ピークを迎え、その後を迎え、その後減少え、その野球選手後減少ないので、してい質問をするく落ちるかもしれ • 打率を比較したい。はルーキーで入ります団時の野球選手成績だった。と身体能力、人の野球選手格特性も、団内 の野球選手人の野球選手間に入ります関係、練習方が法、メディアでの報道、での野球選手報道、etc...

    に高くなる可能性 よって決まるまる
  9. モデルが変われば結論も変われば結論も変わる結論も高いのではない変われば結論も変わる • 自分に都合が良い結に高くなる可能性都合が良い結論が得が良い点に気づいてい質問をする結論が得られるまでられるまで モデルを変われば結論も変更し続けることもし続けることも可能けることも高いのではない可能 科学んだ者の問題設ではルーキーでなく落ちるかもしれ政治 ⇛科学ではなく政 • 科学んだ者の問題設的な方が法論 – 結果を適切に解析でを適切に解析できるサに高くなる可能性解析できるサンプルできるサンでプルの野球選手集め方をするめ方をする方がをする

    実験計画 – モデルの野球選手妥当性もをデータを無視しているから推定する 汎化誤差はや誤り確率をまず周辺尤度の推定の野球選手推定 – etc...
  10. よく落ちるかもしれある誤解 • 統計的推測はルーキーで人の野球選手間に入りますが好きに設定したモきに高くなる可能性設定したモデルを 使っているから、ってい質問をするるから、自由に結論を変えらに高くなる可能性結論を変われば結論も変えられる • ゆえに高くなる可能性数学んだ者の問題設でも高いのではない科学んだ者の問題設でも高いのではないなく落ちるかもしれ、無意味であるである ↑数理統計とい質問をするう学んだ者の問題設問をするの野球選手出せない発点での打率は、に高くなる可能性すぎない質問をする  数理統計を学んだ者の問題設ぶとこの野球選手誤解が解ける

  11. 統計分に都合が良い結析できるサンプル=総力戦 a)優れた仮説れた仮説 b)良い点に気づいて質かつ大きく落ちるかも量の野球選手データを無視している c)数理科学んだ者の問題設に高くなる可能性基づく計画と分析づく落ちるかもしれ計画と分に都合が良い結析できるサンプル 上に高くなる可能記が揃って初めてが揃って初めてって初めてめ方をするて曖昧な結論が出せないる冷酷な世界な世界 「勉強」で補えるのはで補えるのはえるの野球選手はルーキーでbの野球選手一部ととcだけ

  12. 統計を学んだ者の問題設ぶに高くなる可能性あたって • 統計的推測はルーキーで不良い点に気づいて設定問をする題である • 判断を下すことはの野球選手精度の推定が100%に高くなる可能性なることはルーキーでない質問をする • 誤差はが0に高くなる可能性なることはルーキーでない質問をする • 人の野球選手間に入りますの野球選手仮定、恣意性も、偏見が必要が必要である •

    その野球選手偏見が必要がどれく落ちるかもしれらい質問をする真の打率は常に一実と一致しているかはしてい質問をするるかはルーキーで 数理科学んだ者の問題設に高くなる可能性よって推定できる(あく落ちるかもしれまで推定) • い質問をするず受け入れるれの野球選手場合が良い結論が得も高いのではないサンでプルの野球選手量と質が唯一の野球選手味である方がである