Upgrade to Pro — share decks privately, control downloads, hide ads and more …

機械学習イントロダクション/machine-learning-lecture-introduction

 機械学習イントロダクション/machine-learning-lecture-introduction

GMOペパボ新卒研修2020 機械学習入門 補足資料#01

monochromegane

July 13, 2020
Tweet

More Decks by monochromegane

Other Decks in Technology

Transcript

  1. 1
    ペパボ研究所 三宅悠介

    新卒研修 機械学習入門 補足資料#01

    (2020/07/12 Update)

    機械学習

    イントロダクション


    View full-size slide

  2. 2
    2
    機械学習とは何か

    そして、何ではないか


    View full-size slide

  3. 3
    プログラムが、データから知識を学習すること、また
    それを用いてタスクを実行する手法のこと

    3
    機械学習とは
    機械学習とは何か

    View full-size slide

  4. 4
    入力から出力を推測したい

    やりたいこと
    4

    View full-size slide

  5. 5
    入力から出力を推測したい

    やりたいこと
    5
    入力から出力を予測
    する関数を考える


    View full-size slide

  6. 6
    入力から出力を推測したい

    やりたいこと
    6
    切片w0と傾きw1を持
    つ一次関数で表す


    View full-size slide

  7. 7
    入力から出力を予測したい

    やりたくないこと
    7
    ② w0とw1を発見させるプロ
    グラムを書く

    ① w0とw1を自分で決める


    View full-size slide

  8. 8
    入力から出力を予測したい

    やりたくないこと
    8
    ② w0とw1を発見させるプロ
    グラムを書く

    ① w0とw1を自分で決める

    ❌


    View full-size slide

  9. 9
    9
    データから学習する、とは
    機械学習とは何か
    プログラムによって

    入力に対して

    望ましい出力を返すよう

    数式のパラメータを調整すること


    View full-size slide

  10. 10
    ① データの生成規則をモデルとして記述する

    10
    データから学習する、ためには
    機械学習とは何か
    入出力(変数)

    数式の構造

    数式のパラメータ


    View full-size slide

  11. 11
    ① データの生成規則をモデルとして記述する

    ② モデルの良し悪しを定式化する

    11
    データから学習する、ためには
    機械学習とは何か

    View full-size slide

  12. 12
    ① データの生成規則をモデルとして記述する

    ② モデルの良し悪しを定式化する

    ③ 現在のパラメータの良し悪しを②式で評価

    12
    データから学習する、ためには
    機械学習とは何か

    View full-size slide

  13. 13
    ① データの生成規則をモデルとして記述する

    ② モデルの良し悪しを定式化する

    ③ 現在のパラメータの良し悪しを②式で評価

    ④ ③の評価に基づきパラメータを調整

    13
    データから学習する、ためには
    機械学習とは何か

    View full-size slide

  14. 14
    ① データの生成規則をモデルとして記述する

    ② モデルの良し悪しを定式化する

    ③ 現在のパラメータの良し悪しを②式で評価

    ④ ③の評価に基づきパラメータを調整

    14
    データから学習する、ためには
    機械学習とは何か

    View full-size slide

  15. 15
    ① データの生成規則をモデルとして記述する

    ② モデルの良し悪しを定式化する

    ③ 現在のパラメータの良し悪しを②式で評価

    ④ ③の評価に基づきパラメータを調整

    ⑤ モデルを用いてタスクを実行する

    15
    データから学習する、ためには
    機械学習とは何か

    View full-size slide

  16. 16
    16
    機械学習のタスク

    何のために学習するのか


    View full-size slide

  17. 17
    プログラムが、データから知識を学習すること、また
    それを用いてタスクを実行する手法のこと

    17
    機械学習とは(再掲)
    機械学習とは何か

    View full-size slide

  18. 18
    機械学習では、モデルが前提と
    するデータの生成規則におけ
    る、未知のデータに対してどれ
    だけそのタスクをよくこなせるか
    が求められる。

    18
    モデルとタスクと汎化
    機械学習とは何か

    View full-size slide

  19. 19
    19
    回帰 (Regression)
    代表的な機械学習のタスク
    入力から出力を予測する問題設定。

    出力は連続値として得られる。

    入出力の関係性は、訓練データ(ラベル付きの例)
    から学習する(教師あり学習)


    例)気温から売り上げを予測、土地の特徴から家屋の価格を予測


    View full-size slide

  20. 20
    20
    分類 (Classification)
    代表的な機械学習のタスク
    入力から出力を予測する問題設定。

    出力は離散値(有限集合の要素)で得られる。

    入出力の関係性は、訓練データ(ラベル付きの例)
    から学習する(教師あり学習)


    例)スパムメール分類、手書き文字認識


    View full-size slide

  21. 21
    21
    クラスタリング (Clustering)
    代表的な機械学習のタスク
    入力をいくつかのクラスタに分割する問題設定。

    クラスタは、入力データ自身の性質から学習する
    (教師なし学習)


    例)商品特徴による動的なカテゴリ生成


    View full-size slide

  22. 22
    機械学習のタスクと手法
    22
    機械学習のタスク
 機械学習の手法(モデル、アルゴリズム)

    教師あり
 分類
 ロジスティック回帰

    SVM

    決定木

    ニューラルネットワークなど

    回帰
 線形回帰

    リッジ回帰

    決定木

    ニューラルネットワークなど

    教師なし
 クラスタリング 
 k-meansなど

    次元削減
 PCAなど

    など
 -


    View full-size slide

  23. 23
    23
    なぜ機械学習を学ぶのか


    View full-size slide

  24. 24
    Webサービスの利用者の行動(や意図)はログをはじめ
    とするデータとして観測できる。

    データの背景を記述し学習する機械学習の手法を習
    得することで、個々の利用者の振る舞いに適応する
    データ駆動なシステムを実現し、エンジニアリングに
    よってファンを増やすことにつながる。

    24
    「ファンを増やす」
    なぜ機械学習を学ぶのか

    View full-size slide