Slide 1

Slide 1 text

1 ペパボ研究所 三宅悠介
 新卒研修 機械学習入門 補足資料#01
 (2020/07/12 Update)
 機械学習
 イントロダクション


Slide 2

Slide 2 text

2 2 機械学習とは何か
 そして、何ではないか


Slide 3

Slide 3 text

3 プログラムが、データから知識を学習すること、また それを用いてタスクを実行する手法のこと
 3 機械学習とは 機械学習とは何か

Slide 4

Slide 4 text

4 入力から出力を推測したい
 やりたいこと 4

Slide 5

Slide 5 text

5 入力から出力を推測したい
 やりたいこと 5 入力から出力を予測 する関数を考える


Slide 6

Slide 6 text

6 入力から出力を推測したい
 やりたいこと 6 切片w0と傾きw1を持 つ一次関数で表す


Slide 7

Slide 7 text

7 入力から出力を予測したい
 やりたくないこと 7 ② w0とw1を発見させるプロ グラムを書く
 ① w0とw1を自分で決める


Slide 8

Slide 8 text

8 入力から出力を予測したい
 やりたくないこと 8 ② w0とw1を発見させるプロ グラムを書く
 ① w0とw1を自分で決める
 ❌


Slide 9

Slide 9 text

9 9 データから学習する、とは 機械学習とは何か プログラムによって
 入力に対して
 望ましい出力を返すよう
 数式のパラメータを調整すること


Slide 10

Slide 10 text

10 ① データの生成規則をモデルとして記述する
 10 データから学習する、ためには 機械学習とは何か 入出力(変数)
 数式の構造
 数式のパラメータ


Slide 11

Slide 11 text

11 ① データの生成規則をモデルとして記述する
 ② モデルの良し悪しを定式化する
 11 データから学習する、ためには 機械学習とは何か

Slide 12

Slide 12 text

12 ① データの生成規則をモデルとして記述する
 ② モデルの良し悪しを定式化する
 ③ 現在のパラメータの良し悪しを②式で評価
 12 データから学習する、ためには 機械学習とは何か

Slide 13

Slide 13 text

13 ① データの生成規則をモデルとして記述する
 ② モデルの良し悪しを定式化する
 ③ 現在のパラメータの良し悪しを②式で評価
 ④ ③の評価に基づきパラメータを調整
 13 データから学習する、ためには 機械学習とは何か

Slide 14

Slide 14 text

14 ① データの生成規則をモデルとして記述する
 ② モデルの良し悪しを定式化する
 ③ 現在のパラメータの良し悪しを②式で評価
 ④ ③の評価に基づきパラメータを調整
 14 データから学習する、ためには 機械学習とは何か

Slide 15

Slide 15 text

15 ① データの生成規則をモデルとして記述する
 ② モデルの良し悪しを定式化する
 ③ 現在のパラメータの良し悪しを②式で評価
 ④ ③の評価に基づきパラメータを調整
 ⑤ モデルを用いてタスクを実行する
 15 データから学習する、ためには 機械学習とは何か

Slide 16

Slide 16 text

16 16 機械学習のタスク
 何のために学習するのか


Slide 17

Slide 17 text

17 プログラムが、データから知識を学習すること、また それを用いてタスクを実行する手法のこと
 17 機械学習とは(再掲) 機械学習とは何か

Slide 18

Slide 18 text

18 機械学習では、モデルが前提と するデータの生成規則におけ る、未知のデータに対してどれ だけそのタスクをよくこなせるか が求められる。
 18 モデルとタスクと汎化 機械学習とは何か

Slide 19

Slide 19 text

19 19 回帰 (Regression) 代表的な機械学習のタスク 入力から出力を予測する問題設定。
 出力は連続値として得られる。
 入出力の関係性は、訓練データ(ラベル付きの例) から学習する(教師あり学習)
 
 例)気温から売り上げを予測、土地の特徴から家屋の価格を予測


Slide 20

Slide 20 text

20 20 分類 (Classification) 代表的な機械学習のタスク 入力から出力を予測する問題設定。
 出力は離散値(有限集合の要素)で得られる。
 入出力の関係性は、訓練データ(ラベル付きの例) から学習する(教師あり学習)
 
 例)スパムメール分類、手書き文字認識


Slide 21

Slide 21 text

21 21 クラスタリング (Clustering) 代表的な機械学習のタスク 入力をいくつかのクラスタに分割する問題設定。
 クラスタは、入力データ自身の性質から学習する (教師なし学習)
 
 例)商品特徴による動的なカテゴリ生成


Slide 22

Slide 22 text

22 機械学習のタスクと手法 22 機械学習のタスク
 機械学習の手法(モデル、アルゴリズム)
 教師あり
 分類
 ロジスティック回帰
 SVM
 決定木
 ニューラルネットワークなど
 回帰
 線形回帰
 リッジ回帰
 決定木
 ニューラルネットワークなど
 教師なし
 クラスタリング 
 k-meansなど
 次元削減
 PCAなど
 など
 -


Slide 23

Slide 23 text

23 23 なぜ機械学習を学ぶのか


Slide 24

Slide 24 text

24 Webサービスの利用者の行動(や意図)はログをはじめ とするデータとして観測できる。
 データの背景を記述し学習する機械学習の手法を習 得することで、個々の利用者の振る舞いに適応する データ駆動なシステムを実現し、エンジニアリングに よってファンを増やすことにつながる。
 24 「ファンを増やす」 なぜ機械学習を学ぶのか