Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
第五章-交差検証と再標本化【数学嫌いと学ぶデータサイエンス・統計的学習入門】
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Ringa_hyj
June 15, 2020
Technology
280
0
Share
第五章-交差検証と再標本化【数学嫌いと学ぶデータサイエンス・統計的学習入門】
第五章【数学嫌いと学ぶデータサイエンス・統計的学習入門】
Ringa_hyj
June 15, 2020
More Decks by Ringa_hyj
See All by Ringa_hyj
DVCによるデータバージョン管理
ringa_hyj
0
350
deeplakeによる大規模データのバージョン管理と深層学習フレームワークとの接続
ringa_hyj
0
100
Hydraを使った設定ファイル管理とoptunaプラグインでのパラメータ探索
ringa_hyj
0
200
ClearMLで行うAIプロジェクトの管理(レポート,最適化,再現,デプロイ,オーケストレーション)
ringa_hyj
0
210
Catching up with the tidymodels.[Japan.R 2021 LT]
ringa_hyj
3
870
多次元尺度法MDS
ringa_hyj
0
350
因子分析(仮)
ringa_hyj
0
180
階層、非階層クラスタリング
ringa_hyj
0
150
tidymodels紹介「モデリング過程料理で表現できる説」
ringa_hyj
0
670
Other Decks in Technology
See All in Technology
DevOpsDays2026 Tokyo Cross-border practices to connect "safety" and "DX" in healthcare
hokkai7go
0
110
Databricksを用いたセキュアなデータ基盤構築とAIプロダクトへの応用.pdf
pkshadeck
PRO
0
240
2026年度新卒技術研修 サイバーエージェントのデータベース 活用事例とパフォーマンス調査入門
cyberagentdevelopers
PRO
6
7.1k
AIペネトレーションテスト・ セキュリティ検証「AgenticSec」ご紹介資料
laysakura
0
1.6k
システムは「動く」だけでは足りない 実装編 - 非機能要件・分散システム・トレードオフをコードで見る
nwiizo
2
280
MCPゲートウェイ MCPass の設計と実装 エンタープライズで AI を「運用できる」状態にする
mtpooh
1
210
AIドリブン開発の実践知 ― AI-DLC Unicorn Gym実施から見えた可能性と課題
mixi_engineers
PRO
0
120
ログ基盤・プラグイン・ダッシュボード、全部整えた。でも最後は人だった。
makikub
5
1.3k
解剖"React Native"
hacusk
0
120
組織的なAI活用を阻む 最大のハードルは コンテキストデザインだった
ixbox
6
1.3k
スクラムを支える内部品質の話
iij_pr
0
350
Zero Data Loss Autonomous Recovery Service サービス概要
oracle4engineer
PRO
4
14k
Featured
See All Featured
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
370
[SF Ruby Conf 2025] Rails X
palkan
2
930
How STYLIGHT went responsive
nonsquared
100
6k
Building a Scalable Design System with Sketch
lauravandoore
463
34k
Google's AI Overviews - The New Search
badams
0
960
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
120
VelocityConf: Rendering Performance Case Studies
addyosmani
333
25k
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
100
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
760
Prompt Engineering for Job Search
mfonobong
0
250
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
110k
Statistics for Hackers
jakevdp
799
230k
Transcript
1 第五章 1 第五章 @Ringa_hyj 日本一の数学嫌いと学ぶ データサイエンス ~第五章:交差検証・再標本化~
2 第五章 2 第五章 対象視聴者: 数式や記号を見ただけで 教科書を閉じたくなるレベル
3 第五章 3 第五章 リサンプリング ・訓練・検証・テスト ・交差検証(ホールドアウト・一つ抜き・k分割) ・ブートストラップ
4 第五章 4 第五章 訓練・検証・テスト データ 交差検証
5 第五章 5 第五章 ・訓練・検証・テスト データ 予測モデルを作るのは 未知(将来得られる予定)のデータを予測したい 手元のデータからモデルを作っても 未知のデータに対応できているか確認はできない
データ Full dataset (sample) 学習 ロジスティック回帰 最小二乗法 モデル 未知のデータ データに対して 95%正解できる 何%?? 未知のデータに 対応している??
6 第五章 6 第五章 ・訓練・検証・テスト データ データを分割して学習用と、 未知データに対する精度の確認用として扱う データ 学習用データ
(訓練データ) train テストデータ test 学習 モデル
7 第五章 7 第五章 ・訓練・検証・テスト データ 機械学習の”学習”は何回も行い精度向上させる テストデータでの性能 & 訓練データの性能
どちらも下げるように学習 交差検証(cross-validation) 学習用データ (訓練データ) train テストデータ test 学習 モデル 精度 確認 train 学習 まだ? 終わり
8 第五章 8 第五章 ・訓練・検証・テスト データ テストデータの性能も見せてしまっているから、 未知のデータをカンニングした状態 学習用データ (訓練データ)
train テストデータ test 学習 モデル 精度 確認 train 学習 まだ? 終わり
9 第五章 9 第五章 ・訓練・検証・テスト データ さらにもう一つ分割する 検証データをカンニングさせ、 最後にテストで性能を確認する データ
学習用データ (訓練データ) train 検証データ valid 学習 モデル テストデータ test
10 第五章 10 第五章 データ Full dataset (sample) ・訓練・検証・テスト データ
未知のデータ (母集団) モデル 推定 未知のデータ (母集団) 抽出 sampling train valid test 再標本化 resampling
11 第五章 11 第五章 交差検証の手法(分割・確認) (ホールドアウト・一つ抜き・k分割・ブートストラップ)
12 第五章 12 第五章 ・ホールドアウト法(hold-out) データ だいたい半分 順番に関係がないならランダムに再標本化
13 第五章 13 第五章 ・1つ抜き法(LOOCV) leave one out cross validation
データ 一つだけのデータで性能を確認する ※たまたま外れ値のデータで検証してしまう可能性あり
14 第五章 14 第五章 ・K分割法(k-fold CV) データ データをK個(5~10くらい)に分割し、1つを検証用、残りを学習用 これでK-1回学習を行う ※一つ抜きよりも計算コストが少なく、
たまたまの外れ値を選ぶリスクも減る
15 第五章 15 第五章 ・ブートストラップ データ 重複を許す無作為抽出 ※標本データの性質を反映させやすい (多頻度登場するデータ) ブートストラップ標本
16 第五章 16 第五章
17 第五章 17 第五章
18 第五章 18 第五章
19 第五章 19 第五章
20 第五章 20 第五章
21 第五章 21 第五章
22 第五章 22 第五章
23 第五章 23 第五章
24 第五章 24 第五章
25 第五章 25 第五章
26 第五章 26 第五章
27 第五章 27 第五章
28 第五章 28 第五章
29 第五章 29 第五章
30 第五章 30 第五章
31 第五章 31 第五章