Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
簡単な機械学習 / Python 14
Search
kaityo256
January 14, 2020
Education
4
1.9k
簡単な機械学習 / Python 14
プログラム基礎同演習 14
kaityo256
January 14, 2020
Tweet
Share
More Decks by kaityo256
See All by kaityo256
論文紹介のやり方 / How to review
kaityo256
14
76k
デバッグの話 / Debugging for Beginners
kaityo256
9
1.3k
ビット演算の話 / Let's play with bit operations
kaityo256
5
370
GNU Makeの使い方 / How to use GNU Make
kaityo256
15
5.1k
制限ボルツマンマシンの話 / Introduction of RBM
kaityo256
3
1.1k
論文の読み方 / How to survey
kaityo256
219
160k
リンゴゲームと貧富の差 / Origin of the disparity of wealth
kaityo256
14
14k
渡辺研Slackの使い方 / Slack Local Rule
kaityo256
9
8.9k
時間の矢について / Time's arrow
kaityo256
12
17k
Other Decks in Education
See All in Education
BrightonSEO, San Diego, CA 2024
mchowning
0
130
リバースバケットリスト 〜 「死ぬまでにやることリスト」の欠点と対処法
takibi333
0
130
子どものためのプログラミング道場『CoderDojo』〜法人提携例〜 / Partnership with CoderDojo Japan
coderdojojapan
4
15k
OCIでインスタンス構築してみた所感
masakiokuda
0
160
書を持って、自転車で町へ出よう
yuritaco
0
150
Monaca Education 活用事例セミナー:「年間通してMonaca Educationを活用する授業実践のご報告」
asial_edu
0
140
1127
cbtlibrary
0
190
Mathematics used in cryptography around us
herumi
2
760
(説明資料)オンラインゆっくり相談室
ytapples613
PRO
0
240
AI 時代軟體工程師的持續升級
mosky
1
2.2k
付箋を使ったカラオケでワイワイしましょう / Scrum Fest Okinawa 2024
bonbon0605
0
150
とある EM の初めての育休からの学び
clown0082
1
1.5k
Featured
See All Featured
Building an army of robots
kneath
303
45k
Music & Morning Musume
bryan
46
6.4k
Building Flexible Design Systems
yeseniaperezcruz
328
38k
BBQ
matthewcrist
87
9.5k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
7
650
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.3k
Product Roadmaps are Hard
iamctodd
PRO
50
11k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
366
25k
The Pragmatic Product Professional
lauravandoore
32
6.4k
Raft: Consensus for Rubyists
vanstee
137
6.8k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
10
520
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
4
430
Transcript
1 簡単な機械学習 プログラミング基礎同演習 慶應義塾大学理工学部物理情報工学科 渡辺 2019/1/14
2 機械学習 ・機械学習の基礎 ・過学習 ・GAN
3 惑星の動きを観測する (大量のデータ) Ԧ = Ԧ モデル化 法則の抽出 (情報圧縮)
4 彗星の動きを予測できる (モデルが正しければ) Ԧ = Ԧ モデル計算 法則からスタート
5 惑星の動きを観測する (大量のデータ) なんらかのモデルを作る 彗星の動きを予測できる (モデルが正しければ) 情報圧縮
6 教師あり学習 (Supervised Learning) 教師なし学習 (Unsupervised Learning) 強化学習(Reinforcement Learning) 「問題と解答のセット」を与えて学習させる方法
・画像認識、家賃推定など データだけ与えて、データの分類を行う方法 ・売上データを解析し、一緒に売れそうな商品を推薦する等 エージェントの行動に適切に報酬を与えることで 最適な行動を学習させる方法 ・チェスや囲碁の思考ルーチンなど ネコ イヌ
7 分類問題 入力に対して「ラベル」を推定する問題 ネコ イヌ 回帰問題 入力に対して「値」を推定する問題 16万円 写真に写るものがネコか イヌか判定する
築年数、駅までの距離、 周辺施設などから家賃を 推定する 築年数: X年 駅から: 徒歩Y分 広さ: Z平米 近所にコンビニあり
8 荷重 x 伸び y バネの伸びと荷重の関係 とりあえずいろんな荷重に対して、伸びを測定してみる データセット 伸び 荷重
9 0 荷重 伸び 観測値 先程のデータセットをグラフにしてみる の関係が予想される 最小二乗法でaを決める
10 何が起きたか? 多数のデータセットから、モデルが決まった 情報が圧縮された このモデルは正しいか? どうすれば正しいと検証できるか?
11 データセット 訓練データ テストデータ モデルを決める モデルの予測性能を確認する データを2つのグループに分ける
12 0 入力 出力 訓練誤差 0 入力 出力 汎化誤差 訓練誤差
汎化誤差 訓練データとモデルとの誤差 テストデータとモデルとの誤差 訓練誤差が小さい=学習できている 汎化誤差が小さい=モデルが予測能力を持つ
13 0 出力 入力 0 出力 入力 訓練データ テストデータ 訓練データは完璧に再現するが…
テストデータが全然合わない 0 出力 入力 実はこんな関数だった 訓練データに最適化され過ぎ、 予測性能を失うことを 過学習(Over fitting)と呼ぶ
14 • 機械学習とは一種の情報圧縮 • 学習とは「訓練誤差」を減らす作業 • 過学習とは「訓練データ」に最適化 され過ぎ、未知のデータへの予測能 力を失うこと
15 偽造者 (Generator) 博物館 (Real Dataset) 鑑定者 (Discriminator) 提供されたデータが 本物か偽物か見分ける
ニセのデータを生成 本物のデータを提供