Slide 1

Slide 1 text

ク ラ ウ ド ス ケ ー ル 分 析 で デ ー タ 活 用 に 無 限 の 可 能 性 を Find new value on Azure Azure Machine Learning ではじめる 大規模機械学習 女部田啓太 日本マイクロソフト株式会社 https://aka.ms/ml-at-scale

Slide 2

Slide 2 text

目的 対象ユーザ 本セッションでお話しないこと

Slide 3

Slide 3 text

ML

Slide 4

Slide 4 text

アジェンダ

Slide 5

Slide 5 text

アジェンダ

Slide 6

Slide 6 text

Azure Machine Learning 概要

Slide 7

Slide 7 text

No content

Slide 8

Slide 8 text

Azure M achine Learning service 実験的なモデル開発 ⾃動機械学習 デザイナー Pytyon / R モデル検証 パッケー ジ化と Azure Container Instnaces での検証 モデル学習 コンピュー ティング クラスター モニタリング モデルのモニタリング デプロイ スケー ラブルな kubernetes サ ー ビス へ のデプロイ CI/CD & モデル再学習 GitHub & Azure DevOps 統合・連携

Slide 9

Slide 9 text

クラウド CPU、GPU データセット プロファイル、ドリフト検知、 ラベリング 推論 バッチ、リアルタイム MLOps 再現性、自動化、GitHub、CLI、REST 機械学習の実験 Python SDK & CLI 、Notebook、ドラック & ドロップ UI、ウィザード形式 エッジ CPU、GPU、ONNX IoT Edge セキュリティ、管理、展開 計算環境 ジョブ管理、マネージドなワークステーション & クラスター モデル登録 モデル登録、イメージ化 モデル学習 実験管理、実行 (Runs)

Slide 10

Slide 10 text

No content

Slide 11

Slide 11 text

Compute Instance (コンピューティングインスタンス) Compute Clusters (コンピューティングクラスター) • 開発/テスト用途の環境 • 大規模なデータ処理、学習、推論用

Slide 12

Slide 12 text

アジェンダ

Slide 13

Slide 13 text

1. 分散学習

Slide 14

Slide 14 text

複数デバイスを用いた大規模モデルの構築 Data Model GPU0 GPU1 GPU2 + Data Model GPU0 GPU1 GPU2 GPU3

Slide 15

Slide 15 text

エラーハンドリング セキュリティ 結果の集計 複数 VM の起動 リソースのスケールアウト データの配布 ジョブのスケジューリング パッケージ依存性と コンテナー

Slide 16

Slide 16 text

学習ジョブの発行 Azure Storage Account Azure Container Registry Azure ML Experiment Logs and Results 学習スクリプト Mount/Download Azure ML Compute Cluster Azure ML Dataset/Datastore Azure ML Environment Job 設定 YAML ファイル DockerFile

Slide 17

Slide 17 text

サンプルコード https://aka.ms/ml-at-scale

Slide 18

Slide 18 text

Conv2d Max pooling Linear Linear Dropout Conv2d Conv2d Conv2d Max pooling Linear Linear Dropout Conv2d Conv2d

Slide 19

Slide 19 text

No content

Slide 20

Slide 20 text

No content

Slide 21

Slide 21 text

サンプルコード https://aka.ms/ml-at-scale

Slide 22

Slide 22 text

[python] [dask] add initial dask integration by SfinxCZ · Pull Request #3515 · microsoft/LightGBM (github.com) Image credit: James Bourbeau

Slide 23

Slide 23 text

No content

Slide 24

Slide 24 text

2. ハイパーパラメータチューニング

Slide 25

Slide 25 text

No content

Slide 26

Slide 26 text

No content

Slide 27

Slide 27 text

No content

Slide 28

Slide 28 text

microsoft/nni: An open source AutoML toolkit

Slide 29

Slide 29 text

サンプルコード https://aka.ms/ml-at-scale

Slide 30

Slide 30 text

HyperBand

Slide 31

Slide 31 text

No content

Slide 32

Slide 32 text

3. モデル探索

Slide 33

Slide 33 text

No content

Slide 34

Slide 34 text

ユーザーの入力 特徴量 エンジニアリング アルゴリズム の選択 ハイパーパラメータ のチューニング モデルの リーダーボードと解釈 データセット 設定と制約 76% 34% 82% 41% 88% 72% 81% 54% 73% 88% 90% 91% 95% 68% 56% 89% 89% 79% 順位 モデル スコア 1 95% 2 76% 3 53% … 自動機械学習 AutoML (Automated Machine Learning) は、 与えられたデータと設定に基づいて、「特徴量エンジニアリング」 「アルゴリズム」とその「ハイパーパラメーター」の最良な組み合わせを探索します。

Slide 35

Slide 35 text

microsoft/FLAML: A fast and lightweight AutoML library. (github.com)

Slide 36

Slide 36 text

サンプルコード https://aka.ms/ml-at-scale

Slide 37

Slide 37 text

Head node Worker nodes +

Slide 38

Slide 38 text

No content

Slide 39

Slide 39 text

No content

Slide 40

Slide 40 text

Azure/machine-learning-at-scale: machine learning at scale on Azure Machine Learning (github.com) Azure Machine Learning - サービスとしての ML | Microsoft Azure Azure/azureml-examples: Official community-driven Azure Machine Learning examples, tested with GitHub Actions. Azure/MachineLearningNotebooks: Python notebooks with ML and deep learning examples with Azure Machine Learning Python SDK | Microsoft (github.com) Distributed Data Parallel — PyTorch 1.10.0 documentation Distributed Learning Guide — LightGBM 3.3.1.99 documentation microsoft/nni: An open source AutoML toolkit (github.com) Dask: Scalable analytics in Python What is Ray? — Ray v1.8.0

Slide 41

Slide 41 text

41 本セッションについて、日本マイクロソフト株式会社によるアンケートへご回答ご協力お願いいたします。 [D14:Azure Machine Learning で始める大規模機械学習] アンケートご回答のお願い https://aka.ms/dbts2021D14 ※アンケートURL 有効期限 : 2021/12/10

Slide 42

Slide 42 text

42 クラウドによるデータ活用やAI導入により、 ビジネスを無限に成長させるための事例や手法をご 紹介するポータルサイト https://aka.ms/AAe3f4o 2021年12月14日(火)~15日(水)の2日間に渡って Azure AI活用のベストプラクティスをお届けする オンラインイベント https://aka.ms/AAe3moh

Slide 43

Slide 43 text

No content

Slide 44

Slide 44 text

No content