AI研修（イントロダクション）【ミクシィ22新卒技術研修】

新卒AI研修 01 Introduction

講義の目的機械学習(深層学習・勾配ブースティング)で • 何ができるか • 何が必要か • どうサービスと繋げるかを学びます 2

講義の目的と言っても、1日で時間が足りるわけがありませんあれに使えるかもしれない！自分から触ってみよう！と壁を取り払えることが一番の目的です 3

講義の概要 • 機械学習とは何か (01_introduction) • データと学習方法(02_data_and_training) • デプロイ(03_deployment) • サービスについて考える(04_service_in_mixi)
4

ハンズオンの概要 • 画像分類(01_image_classification) • プルーニング(01ex_pruning) (01が早く終わった人向け) • デプロイとサービング(02_deploy_and_serving) • パラメーターチューニング(03_parameter_tuning)
• 転移学習(04_transfer_learning) • 構造化データ予測(05_predict_structured_data)　 5

機械学習とはデータから知見を得て、それを次の決定に利用すること • 知見とはブラックボックスな関数 ◦ 何かしらのルールがある • データとは過去の出来事 ◦ 数値,
画像, 音声, テキスト, etc. • 決定：予測 ◦ 知見と今の状態がわかれば未来を予測できる 6

機械学習とは何かルールがあるということは、関数で表せるということ • 今日の全ての情報があれば明日の天気はわかるはず.. • 未来の株価は過去の動きで予測できるはず... • 人間は外部入力を受けてニューロンが... 世界の全ては（規模を無視すれば）関数で表現できるかも！ 7

プログラミングとの違いは？ルールを自分で決めて、表現することがプログラミング • 盤面のスコアリングをルールベースで決定し、次のアクションの結果を評価して駒を動かす過去のデータの中からルールを得るのが機械学習 • 大量の棋譜からパターンを見つけて、次の手を決定する 8 盤面のスコアリングから、
次の行動で一番点数の高い角を5一にしよう過去の棋譜と差し手のパターンから角を5一にしようプログラミング機械学習

統計との違いは？統計学はデータから可視化できる表現を得る • ある意思決定の理由を説明するのが目的機械学習は表現を得て、予測精度をあげることが目的 • 検証で良い数字がでるなら、なにかしらの表現を得たことになるデータから知見を得るという部分は同じだし、基礎理論も同じ • 良いデータサイエンティストは良いMLエンジニア
9

どんな問題を解決できるか? 様々な分野で様々な問題を解決することができる • 需要・コスト予測 • カスタマー対応 • ゲームデッキのレコメンド • 書類のチェック
• マーケティングプラン • ゲームAI • キャラクター生成 • 翻訳 • 競馬/競輪の予測 • 音声の変換 • メトリクスの異常検知 • コードレビューの補助 • モーションキャプチャ • 不審な決済ログの洗い出し • … 10

どんな問題を解決できるか? 自分のサービスに適用できないか？ • どんな解決できそうな問題があるか？ • 必要なデータはあるか？これを考えられるようになってもらうのが講義の主目的です 11

機械学習の分類 AI 機械学習教師あり学習教師なし学習強化学習 Deep Learning 勾配ブース
ティング 12

• 教師データと出力の損失を用いて学習教師あり学習モデル入力出力損失(loss) 教師デ
ター 13

教師なし学習 • 教師データが存在しない学習（データ内のパターンを見つける学習）クラスタリングオートエンコーダ Encoder Decoder 入力出力特徴量
次元圧縮クラスタ1 クラスタ2 クラスタ3 14

強化学習 • 環境とやりとりして行動の報酬をもらうことでエージェントが学習環境エージェント行動観測意思決定報酬学習
変化 15

強化学習 • 環境とやりとりして行動の報酬をもらうことでエージェントが学習 16 START +10 -10 環境エージェント START

分類(Classification)と回帰(Regression) 分類 • 出力が離散値 True or False 犬、猫、人... • あらかじめ与えられた
カテゴリー/クラス/分類を予測する際に使用 • 例モンストキャラの画像と種類から新たなキャラ画像が与えられた時にそのキャラがどの種類かを予測回帰 • 出力が連続値金額や人数、温度… • 数字の大小に意味が存在する値を予測する際に使用 • 例過去のモンストの売上から明日の売上を予測 17

分類(Classification)と回帰(Regression) QUIZ 1. ユーザの収入や家族構成、その他パラメータから預金額を予測する 2. ユーザの収入や家族構成、その他パラメータからある取引が不正かどうかを予測する 3. 画像に写っている物の種類を予測する 4.
画像に写っている物の位置を予測する 18

機械学習の流れ用意したデータモデル入力出力損失(loss) 教師データ(ラベル) 入力(特徴量) 教師
デター 19

機械学習の流れ用意したデータ入力出力教師データ(ラベル) 入力(特徴量) 教師デタ
ーモデル Parameters Hyper Parameters 損失(loss)から Parametersを更新 20

Parameters: Weights & Biases パラメーターは学習で変化する値　　 WeightとBiasがある　 y =
b + x * w この値を調整すると、出力の値が変わる 21

ーモデル Parameters Hyper Parameters 損失関数 Loss 最適化関数 (Optimizer) Parameters 更新 22

損失関数(loss function) 回帰問題の代表的な損失関数 ➢ RMSE 23

多クラス分類問題の代表的な損失関数損失関数(loss function) ➢ Categorical Cross Entropy Label Name オラゴン
ブルーリドラレッドリドラグリーンリドラ Output 3.57 0.27 1.80 - 0.83 Softmax 0.8200 0.0302 0.1397 0.0101 Label 1 0 0 0 Cross Entropy 0.086 0 0 0 24

最適化関数: 最急降下法(Gradient Descent) 最適化関数 ➢ Lossが最小になるようなWeightを決定例: 最急降下法(Gradient Descent) 更新式
学習率 (learning rate) Loss 25

最適化関数一覧 • Gradient Descent (GD) • Stochastic Gradient Descent (SGD)
• Nesterov Accelerated Descent (NAG) • Momentum • RMSProp • Adagrad • Adam • … 26

ーモデル Parameters Hyper Parameters 損失関数 Loss 最適化関数 (Optimizer) Parameters 更新 27

Hyper Parameters ハイパーパラメータ • 学習前に予め決めておく必要がある値 • 学習によって変化しない • 最適値はタスクによって異なる例
• learning rate, バッチサイズ • パラメーターの数 • 使用するアルゴリズムの係数 • … 28

Hyper Parameters: バッチサイズ一度でトレーニングでどれだけのデータをまとめて学習するか • 理想だけ言えば大きいほうがより安定する ➢ 大きくしすぎると精度悪化の可能性 ➢ 計算量やメモリの使用量が大きくなる
• バッチサイズと学習率には関係がある ➢ 学習率を固定してバッチサイズを5倍にするということは、バッチサイズを固定して学習率を1/5にするということに近い 29

機械学習の流れ用意したデータ入力出力教師データ(ラベル) 教師デター
モデル Parameters Hyper Parameters 損失関数 Loss 最適化関数 (Optimizer) Parameters 更新 30

AI研修（イントロダクション）【ミクシィ22新卒技術研修】

AI研修（イントロダクション）【ミクシィ22新卒技術研修】

MIXI ENGINEERS PRO

More Decks by MIXI ENGINEERS

Other Decks in Programming

Featured

Transcript

新卒AI研修 01 Introduction

講義の目的機械学習(深層学習・勾配ブースティング)で • 何ができるか • 何が必要か • どうサービスと繋げるかを学びます 2

講義の目的と言っても、1日で時間が足りるわけがありませんあれに使えるかもしれない！自分から触ってみよう！と壁を取り払えることが一番の目的です 3

講義の概要 • 機械学習とは何か (01_introduction) • データと学習方法(02_data_and_training) • デプロイ(03_deployment) • サービスについて考える(04_service_in_mixi)

ハンズオンの概要 • 画像分類(01_image_classification) • プルーニング(01ex_pruning) (01が早く終わった人向け) • デプロイとサービング(02_deploy_and_serving) • パラメーターチューニング(03_parameter_tuning)

機械学習とはデータから知見を得て、それを次の決定に利用すること • 知見とはブラックボックスな関数 ◦ 何かしらのルールがある • データとは過去の出来事 ◦ 数値,

どんな問題を解決できるか? 様々な分野で様々な問題を解決することができる • 需要・コスト予測 • カスタマー対応 • ゲームデッキのレコメンド • 書類のチェック

どんな問題を解決できるか? 自分のサービスに適用できないか？ • どんな解決できそうな問題があるか？ • 必要なデータはあるか？これを考えられるようになってもらうのが講義の主目的です 11

機械学習の分類 AI 機械学習教師あり学習教師なし学習強化学習 Deep Learning 勾配ブース

• 教師データと出力の損失を用いて学習教師あり学習モデル入力出力損失(loss) 教師デ

教師なし学習 • 教師データが存在しない学習（データ内のパターンを見つける学習）クラスタリングオートエンコーダ Encoder Decoder 入力出力特徴量

強化学習 • 環境とやりとりして行動の報酬をもらうことでエージェントが学習環境エージェント行動観測意思決定報酬学習

強化学習 • 環境とやりとりして行動の報酬をもらうことでエージェントが学習 16 START +10 -10 環境エージェント START

分類(Classification)と回帰(Regression) 分類 • 出力が離散値 True or False 犬、猫、人... • あらかじめ与えられた

機械学習の流れ用意したデータモデル入力出力損失(loss) 教師データ(ラベル) 入力(特徴量) 教師

機械学習の流れ用意したデータ入力出力教師データ(ラベル) 入力(特徴量) 教師デタ

Parameters: Weights & Biases パラメーターは学習で変化する値　　 WeightとBiasがある　 y =

機械学習の流れ用意したデータ入力出力教師データ(ラベル) 入力(特徴量) 教師デタ

損失関数(loss function) 回帰問題の代表的な損失関数 ➢ RMSE 23

多クラス分類問題の代表的な損失関数損失関数(loss function) ➢ Categorical Cross Entropy Label Name オラゴン

最適化関数: 最急降下法(Gradient Descent) 最適化関数 ➢ Lossが最小になるようなWeightを決定例: 最急降下法(Gradient Descent) 更新式

最適化関数一覧 • Gradient Descent (GD) • Stochastic Gradient Descent (SGD)

機械学習の流れ用意したデータ入力出力教師データ(ラベル) 入力(特徴量) 教師デタ

Hyper Parameters ハイパーパラメータ • 学習前に予め決めておく必要がある値 • 学習によって変化しない • 最適値はタスクによって異なる例

Hyper Parameters: バッチサイズ一度でトレーニングでどれだけのデータをまとめて学習するか • 理想だけ言えば大きいほうがより安定する ➢ 大きくしすぎると精度悪化の可能性 ➢ 計算量やメモリの使用量が大きくなる

機械学習の流れ用意したデータ入力出力教師データ(ラベル) 教師デター