Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
簡単な機械学習 / Python 14
Search
kaityo256
PRO
January 14, 2020
Education
4
1.9k
簡単な機械学習 / Python 14
プログラム基礎同演習 14
kaityo256
PRO
January 14, 2020
Tweet
Share
More Decks by kaityo256
See All by kaityo256
モンテカルロ法(3) 発展的アルゴリズム / Simulation 04
kaityo256
PRO
8
1.4k
UMAPをざっくりと理解 / Overview of UMAP
kaityo256
PRO
6
2.5k
SSH公開鍵認証による接続 / Connecting with SSH Public Key Authentication
kaityo256
PRO
6
550
論文紹介のやり方 / How to review
kaityo256
PRO
16
85k
デバッグの話 / Debugging for Beginners
kaityo256
PRO
15
1.7k
ビット演算の話 / Let's play with bit operations
kaityo256
PRO
8
600
GNU Makeの使い方 / How to use GNU Make
kaityo256
PRO
15
5.4k
制限ボルツマンマシンの話 / Introduction of RBM
kaityo256
PRO
3
1.4k
論文の読み方 / How to survey
kaityo256
PRO
226
180k
Other Decks in Education
See All in Education
Pythonパッケージ管理 [uv] 完全入門
mickey_kubo
23
24k
社外コミュニティと「学び」を考える
alchemy1115
2
180
(2025) L'origami, mieux que la règle et le compas
mansuy
0
130
Common STIs in London: Symptoms, Risks & Prevention
medicaldental
0
140
『会社を知ってもらう』から『安心して活躍してもらう』までの プロセスとフロー
sasakendayo
0
260
みんなのコードD&I推進レポート2025 テクノロジー分野のジェンダーギャップとその取り組みについて
codeforeveryone
0
210
Data Management and Analytics Specialisation
signer
PRO
0
1.5k
AIの時代こそ、考える知的学習術
yum3
2
200
Padlet opetuksessa
matleenalaakso
4
14k
”育てる”から”育つ”仕組みへ!スクラムによる新入社員教育
arapon
0
150
シリコンバレーでスタートアップを共同創業したファウンディングエンジニアとしての学び
tomoima525
1
1.2k
【品女100周年企画】Pitch Deck
shinagawajoshigakuin_100th
0
6k
Featured
See All Featured
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
46
7.6k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
Side Projects
sachag
455
43k
Documentation Writing (for coders)
carmenintech
74
5k
Large-scale JavaScript Application Architecture
addyosmani
513
110k
How to Think Like a Performance Engineer
csswizardry
26
1.9k
How to train your dragon (web standard)
notwaldorf
96
6.2k
Rails Girls Zürich Keynote
gr2m
95
14k
Navigating Team Friction
lara
189
15k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.7k
Transcript
1 簡単な機械学習 プログラミング基礎同演習 慶應義塾大学理工学部物理情報工学科 渡辺 2019/1/14
2 機械学習 ・機械学習の基礎 ・過学習 ・GAN
3 惑星の動きを観測する (大量のデータ) Ԧ = Ԧ モデル化 法則の抽出 (情報圧縮)
4 彗星の動きを予測できる (モデルが正しければ) Ԧ = Ԧ モデル計算 法則からスタート
5 惑星の動きを観測する (大量のデータ) なんらかのモデルを作る 彗星の動きを予測できる (モデルが正しければ) 情報圧縮
6 教師あり学習 (Supervised Learning) 教師なし学習 (Unsupervised Learning) 強化学習(Reinforcement Learning) 「問題と解答のセット」を与えて学習させる方法
・画像認識、家賃推定など データだけ与えて、データの分類を行う方法 ・売上データを解析し、一緒に売れそうな商品を推薦する等 エージェントの行動に適切に報酬を与えることで 最適な行動を学習させる方法 ・チェスや囲碁の思考ルーチンなど ネコ イヌ
7 分類問題 入力に対して「ラベル」を推定する問題 ネコ イヌ 回帰問題 入力に対して「値」を推定する問題 16万円 写真に写るものがネコか イヌか判定する
築年数、駅までの距離、 周辺施設などから家賃を 推定する 築年数: X年 駅から: 徒歩Y分 広さ: Z平米 近所にコンビニあり
8 荷重 x 伸び y バネの伸びと荷重の関係 とりあえずいろんな荷重に対して、伸びを測定してみる データセット 伸び 荷重
9 0 荷重 伸び 観測値 先程のデータセットをグラフにしてみる の関係が予想される 最小二乗法でaを決める
10 何が起きたか? 多数のデータセットから、モデルが決まった 情報が圧縮された このモデルは正しいか? どうすれば正しいと検証できるか?
11 データセット 訓練データ テストデータ モデルを決める モデルの予測性能を確認する データを2つのグループに分ける
12 0 入力 出力 訓練誤差 0 入力 出力 汎化誤差 訓練誤差
汎化誤差 訓練データとモデルとの誤差 テストデータとモデルとの誤差 訓練誤差が小さい=学習できている 汎化誤差が小さい=モデルが予測能力を持つ
13 0 出力 入力 0 出力 入力 訓練データ テストデータ 訓練データは完璧に再現するが…
テストデータが全然合わない 0 出力 入力 実はこんな関数だった 訓練データに最適化され過ぎ、 予測性能を失うことを 過学習(Over fitting)と呼ぶ
14 • 機械学習とは一種の情報圧縮 • 学習とは「訓練誤差」を減らす作業 • 過学習とは「訓練データ」に最適化 され過ぎ、未知のデータへの予測能 力を失うこと
15 偽造者 (Generator) 博物館 (Real Dataset) 鑑定者 (Discriminator) 提供されたデータが 本物か偽物か見分ける
ニセのデータを生成 本物のデータを提供