Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
簡単な機械学習 / Python 14
Search
kaityo256
January 14, 2020
Education
4
1.9k
簡単な機械学習 / Python 14
プログラム基礎同演習 14
kaityo256
January 14, 2020
Tweet
Share
More Decks by kaityo256
See All by kaityo256
論文紹介のやり方 / How to review
kaityo256
14
76k
デバッグの話 / Debugging for Beginners
kaityo256
9
1.3k
ビット演算の話 / Let's play with bit operations
kaityo256
5
370
GNU Makeの使い方 / How to use GNU Make
kaityo256
15
5.1k
制限ボルツマンマシンの話 / Introduction of RBM
kaityo256
3
1.1k
論文の読み方 / How to survey
kaityo256
219
160k
リンゴゲームと貧富の差 / Origin of the disparity of wealth
kaityo256
14
14k
渡辺研Slackの使い方 / Slack Local Rule
kaityo256
9
8.9k
時間の矢について / Time's arrow
kaityo256
12
17k
Other Decks in Education
See All in Education
リバースバケットリスト 〜 「死ぬまでにやることリスト」の欠点と対処法
takibi333
0
130
Казармы и гарнизоны
pnuslide
0
180
OCIでインスタンス構築してみた所感
masakiokuda
0
150
OnShapeの紹介-概要編
shiba_8ro
0
110
2024年度秋学期 統計学 第12回 分布の平均を推測する - 区間推定 (2024. 12. 11)
akiraasano
PRO
0
130
CV_1_Introduction
hachama
0
160
付箋を使ったカラオケでワイワイしましょう / Scrum Fest Okinawa 2024
bonbon0605
0
140
2024年度秋学期 統計学 第11回 分布の「型」を考える - 確率分布モデルと正規分布 (2024. 12. 4)
akiraasano
PRO
0
120
中野区ミライ★ライター倶楽部presents『MINT』
nakamuramikumirai
0
730
(説明資料)オンラインゆっくり相談室
ytapples613
PRO
0
230
Da Necessidade da Devoção à Virgem Santíssima
cm_manaus
0
120
Mathematics used in cryptography around us
herumi
2
760
Featured
See All Featured
Designing Experiences People Love
moore
140
23k
Measuring & Analyzing Core Web Vitals
bluesmoon
6
250
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
49
2.3k
YesSQL, Process and Tooling at Scale
rocio
172
14k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.7k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
120k
GitHub's CSS Performance
jonrohan
1030
460k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.3k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
193
16k
Into the Great Unknown - MozCon
thekraken
35
1.6k
Faster Mobile Websites
deanohume
306
31k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
7k
Transcript
1 簡単な機械学習 プログラミング基礎同演習 慶應義塾大学理工学部物理情報工学科 渡辺 2019/1/14
2 機械学習 ・機械学習の基礎 ・過学習 ・GAN
3 惑星の動きを観測する (大量のデータ) Ԧ = Ԧ モデル化 法則の抽出 (情報圧縮)
4 彗星の動きを予測できる (モデルが正しければ) Ԧ = Ԧ モデル計算 法則からスタート
5 惑星の動きを観測する (大量のデータ) なんらかのモデルを作る 彗星の動きを予測できる (モデルが正しければ) 情報圧縮
6 教師あり学習 (Supervised Learning) 教師なし学習 (Unsupervised Learning) 強化学習(Reinforcement Learning) 「問題と解答のセット」を与えて学習させる方法
・画像認識、家賃推定など データだけ与えて、データの分類を行う方法 ・売上データを解析し、一緒に売れそうな商品を推薦する等 エージェントの行動に適切に報酬を与えることで 最適な行動を学習させる方法 ・チェスや囲碁の思考ルーチンなど ネコ イヌ
7 分類問題 入力に対して「ラベル」を推定する問題 ネコ イヌ 回帰問題 入力に対して「値」を推定する問題 16万円 写真に写るものがネコか イヌか判定する
築年数、駅までの距離、 周辺施設などから家賃を 推定する 築年数: X年 駅から: 徒歩Y分 広さ: Z平米 近所にコンビニあり
8 荷重 x 伸び y バネの伸びと荷重の関係 とりあえずいろんな荷重に対して、伸びを測定してみる データセット 伸び 荷重
9 0 荷重 伸び 観測値 先程のデータセットをグラフにしてみる の関係が予想される 最小二乗法でaを決める
10 何が起きたか? 多数のデータセットから、モデルが決まった 情報が圧縮された このモデルは正しいか? どうすれば正しいと検証できるか?
11 データセット 訓練データ テストデータ モデルを決める モデルの予測性能を確認する データを2つのグループに分ける
12 0 入力 出力 訓練誤差 0 入力 出力 汎化誤差 訓練誤差
汎化誤差 訓練データとモデルとの誤差 テストデータとモデルとの誤差 訓練誤差が小さい=学習できている 汎化誤差が小さい=モデルが予測能力を持つ
13 0 出力 入力 0 出力 入力 訓練データ テストデータ 訓練データは完璧に再現するが…
テストデータが全然合わない 0 出力 入力 実はこんな関数だった 訓練データに最適化され過ぎ、 予測性能を失うことを 過学習(Over fitting)と呼ぶ
14 • 機械学習とは一種の情報圧縮 • 学習とは「訓練誤差」を減らす作業 • 過学習とは「訓練データ」に最適化 され過ぎ、未知のデータへの予測能 力を失うこと
15 偽造者 (Generator) 博物館 (Real Dataset) 鑑定者 (Discriminator) 提供されたデータが 本物か偽物か見分ける
ニセのデータを生成 本物のデータを提供