Upgrade to Pro — share decks privately, control downloads, hide ads and more …

第五章-交差検証と再標本化【数学嫌いと学ぶデータサイエンス・統計的学習入門】

 第五章-交差検証と再標本化【数学嫌いと学ぶデータサイエンス・統計的学習入門】

第五章【数学嫌いと学ぶデータサイエンス・統計的学習入門】

Ringa_hyj

June 15, 2020
Tweet

More Decks by Ringa_hyj

Other Decks in Technology

Transcript

  1. 5 第五章 5 第五章 ・訓練・検証・テスト データ 予測モデルを作るのは 未知(将来得られる予定)のデータを予測したい 手元のデータからモデルを作っても 未知のデータに対応できているか確認はできない

    データ Full dataset (sample) 学習 ロジスティック回帰 最小二乗法 モデル 未知のデータ データに対して 95%正解できる 何%?? 未知のデータに 対応している??
  2. 7 第五章 7 第五章 ・訓練・検証・テスト データ 機械学習の”学習”は何回も行い精度向上させる テストデータでの性能 & 訓練データの性能

    どちらも下げるように学習 交差検証(cross-validation) 学習用データ (訓練データ) train テストデータ test 学習 モデル 精度 確認 train 学習 まだ? 終わり
  3. 10 第五章 10 第五章 データ Full dataset (sample) ・訓練・検証・テスト データ

    未知のデータ (母集団) モデル 推定 未知のデータ (母集団) 抽出 sampling train valid test 再標本化 resampling
  4. 13 第五章 13 第五章 ・1つ抜き法(LOOCV) leave one out cross validation

    データ 一つだけのデータで性能を確認する ※たまたま外れ値のデータで検証してしまう可能性あり