Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
簡単な機械学習 / Python 14
Search
kaityo256
PRO
January 14, 2020
Education
4
1.9k
簡単な機械学習 / Python 14
プログラム基礎同演習 14
kaityo256
PRO
January 14, 2020
Tweet
Share
More Decks by kaityo256
See All by kaityo256
モンテカルロ法(3) 発展的アルゴリズム / Simulation 04
kaityo256
PRO
7
1.4k
UMAPをざっくりと理解 / Overview of UMAP
kaityo256
PRO
5
2.3k
SSH公開鍵認証による接続 / Connecting with SSH Public Key Authentication
kaityo256
PRO
4
520
論文紹介のやり方 / How to review
kaityo256
PRO
15
85k
デバッグの話 / Debugging for Beginners
kaityo256
PRO
13
1.6k
ビット演算の話 / Let's play with bit operations
kaityo256
PRO
8
570
GNU Makeの使い方 / How to use GNU Make
kaityo256
PRO
15
5.3k
制限ボルツマンマシンの話 / Introduction of RBM
kaityo256
PRO
3
1.3k
論文の読み方 / How to survey
kaityo256
PRO
223
180k
Other Decks in Education
See All in Education
生成AI
takenawa
0
12k
人になにかを教えるときに考えていること(2025-05版 / VRC-LT #18)
sksat
4
1.1k
バックオフィス組織にも「チームトポロジー」の考えが使えるかもしれない!!
masakiokuda
0
120
SARA Annual Report 2024-25
sara2023
1
200
20250807_がんばらないコミュニティ運営
ponponmikankan
0
150
ANS-C01_2回不合格から合格までの道程
amarelo_n24
1
290
Alumnote inc. Company Deck
yukinumata
0
1.2k
Tutorial: Foundations of Blind Source Separation and Its Advances in Spatial Self-Supervised Learning
yoshipon
1
140
技術勉強会 〜 OAuth & OIDC 入門編 / 20250528 OAuth and OIDC
oidfj
5
1.6k
マネジメント「される側」 こそ覚悟を決めろ
nao_randd
10
5.4k
Webリテラシー基礎
takenawa
0
12k
シリコンバレーでスタートアップを共同創業したファウンディングエンジニアとしての学び
tomoima525
1
410
Featured
See All Featured
Speed Design
sergeychernyshev
32
1.1k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Music & Morning Musume
bryan
46
6.7k
Making the Leap to Tech Lead
cromwellryan
134
9.5k
Stop Working from a Prison Cell
hatefulcrawdad
271
21k
Measuring & Analyzing Core Web Vitals
bluesmoon
8
550
Agile that works and the tools we love
rasmusluckow
329
21k
Scaling GitHub
holman
462
140k
What's in a price? How to price your products and services
michaelherold
246
12k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
31
2.2k
StorybookのUI Testing Handbookを読んだ
zakiyama
30
6k
Testing 201, or: Great Expectations
jmmastey
45
7.6k
Transcript
1 簡単な機械学習 プログラミング基礎同演習 慶應義塾大学理工学部物理情報工学科 渡辺 2019/1/14
2 機械学習 ・機械学習の基礎 ・過学習 ・GAN
3 惑星の動きを観測する (大量のデータ) Ԧ = Ԧ モデル化 法則の抽出 (情報圧縮)
4 彗星の動きを予測できる (モデルが正しければ) Ԧ = Ԧ モデル計算 法則からスタート
5 惑星の動きを観測する (大量のデータ) なんらかのモデルを作る 彗星の動きを予測できる (モデルが正しければ) 情報圧縮
6 教師あり学習 (Supervised Learning) 教師なし学習 (Unsupervised Learning) 強化学習(Reinforcement Learning) 「問題と解答のセット」を与えて学習させる方法
・画像認識、家賃推定など データだけ与えて、データの分類を行う方法 ・売上データを解析し、一緒に売れそうな商品を推薦する等 エージェントの行動に適切に報酬を与えることで 最適な行動を学習させる方法 ・チェスや囲碁の思考ルーチンなど ネコ イヌ
7 分類問題 入力に対して「ラベル」を推定する問題 ネコ イヌ 回帰問題 入力に対して「値」を推定する問題 16万円 写真に写るものがネコか イヌか判定する
築年数、駅までの距離、 周辺施設などから家賃を 推定する 築年数: X年 駅から: 徒歩Y分 広さ: Z平米 近所にコンビニあり
8 荷重 x 伸び y バネの伸びと荷重の関係 とりあえずいろんな荷重に対して、伸びを測定してみる データセット 伸び 荷重
9 0 荷重 伸び 観測値 先程のデータセットをグラフにしてみる の関係が予想される 最小二乗法でaを決める
10 何が起きたか? 多数のデータセットから、モデルが決まった 情報が圧縮された このモデルは正しいか? どうすれば正しいと検証できるか?
11 データセット 訓練データ テストデータ モデルを決める モデルの予測性能を確認する データを2つのグループに分ける
12 0 入力 出力 訓練誤差 0 入力 出力 汎化誤差 訓練誤差
汎化誤差 訓練データとモデルとの誤差 テストデータとモデルとの誤差 訓練誤差が小さい=学習できている 汎化誤差が小さい=モデルが予測能力を持つ
13 0 出力 入力 0 出力 入力 訓練データ テストデータ 訓練データは完璧に再現するが…
テストデータが全然合わない 0 出力 入力 実はこんな関数だった 訓練データに最適化され過ぎ、 予測性能を失うことを 過学習(Over fitting)と呼ぶ
14 • 機械学習とは一種の情報圧縮 • 学習とは「訓練誤差」を減らす作業 • 過学習とは「訓練データ」に最適化 され過ぎ、未知のデータへの予測能 力を失うこと
15 偽造者 (Generator) 博物館 (Real Dataset) 鑑定者 (Discriminator) 提供されたデータが 本物か偽物か見分ける
ニセのデータを生成 本物のデータを提供