Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Azure Machine Learning 大規模機械学習

konabuta
November 18, 2021

Azure Machine Learning 大規模機械学習

db tech showcase 2021 講演資料
Title : Azure Machine Learning で始める大規模機械学習 @ 女部田啓太

konabuta

November 18, 2021
Tweet

More Decks by konabuta

Other Decks in Technology

Transcript

  1. ク ラ ウ ド ス ケ ー ル 分 析 で デ ー タ 活 用 に 無 限 の 可 能 性 を
    Find new value on Azure
    Azure Machine Learning ではじめる
    大規模機械学習
    女部田啓太
    日本マイクロソフト株式会社
    https://aka.ms/ml-at-scale

    View Slide

  2. 目的
    対象ユーザ
    本セッションでお話しないこと

    View Slide

  3. ML

    View Slide

  4. アジェンダ

    View Slide

  5. アジェンダ

    View Slide

  6. Azure Machine Learning 概要

    View Slide

  7. View Slide

  8. Azure M achine Learning service
    実験的なモデル開発
    ⾃動機械学習
    デザイナー
    Pytyon / R
    モデル検証
    パッケー
    ジ化と
    Azure Container
    Instnaces での検証
    モデル学習
    コンピュー
    ティング
    クラスター
    モニタリング
    モデルのモニタリング
    デプロイ
    スケー
    ラブルな
    kubernetes サ

    ビス

    のデプロイ
    CI/CD & モデル再学習
    GitHub & Azure DevOps 統合・連携

    View Slide

  9. クラウド
    CPU、GPU
    データセット
    プロファイル、ドリフト検知、
    ラベリング
    推論
    バッチ、リアルタイム
    MLOps
    再現性、自動化、GitHub、CLI、REST
    機械学習の実験
    Python SDK & CLI 、Notebook、ドラック & ドロップ UI、ウィザード形式
    エッジ
    CPU、GPU、ONNX
    IoT Edge
    セキュリティ、管理、展開
    計算環境
    ジョブ管理、マネージドなワークステーション & クラスター
    モデル登録
    モデル登録、イメージ化
    モデル学習
    実験管理、実行 (Runs)

    View Slide

  10. View Slide

  11. Compute Instance
    (コンピューティングインスタンス)
    Compute Clusters
    (コンピューティングクラスター)
    • 開発/テスト用途の環境 • 大規模なデータ処理、学習、推論用

    View Slide

  12. アジェンダ

    View Slide

  13. 1. 分散学習

    View Slide

  14. 複数デバイスを用いた大規模モデルの構築
    Data Model
    GPU0
    GPU1
    GPU2
    +
    Data Model
    GPU0
    GPU1
    GPU2
    GPU3

    View Slide

  15. エラーハンドリング
    セキュリティ
    結果の集計
    複数 VM の起動
    リソースのスケールアウト
    データの配布
    ジョブのスケジューリング
    パッケージ依存性と
    コンテナー

    View Slide

  16. 学習ジョブの発行
    Azure Storage Account
    Azure Container Registry
    Azure ML Experiment
    Logs and
    Results
    学習スクリプト
    Mount/Download
    Azure ML
    Compute Cluster
    Azure ML
    Dataset/Datastore
    Azure ML
    Environment
    Job 設定 YAML ファイル
    DockerFile

    View Slide

  17. サンプルコード
    https://aka.ms/ml-at-scale

    View Slide

  18. Conv2d
    Max pooling
    Linear
    Linear
    Dropout
    Conv2d
    Conv2d
    Conv2d
    Max pooling
    Linear
    Linear
    Dropout
    Conv2d
    Conv2d

    View Slide

  19. View Slide

  20. View Slide

  21. サンプルコード
    https://aka.ms/ml-at-scale

    View Slide

  22. [python] [dask] add initial dask integration by SfinxCZ ·
    Pull Request #3515 · microsoft/LightGBM (github.com)
    Image credit: James Bourbeau

    View Slide

  23. View Slide

  24. 2. ハイパーパラメータチューニング

    View Slide

  25. View Slide

  26. View Slide

  27. View Slide

  28. microsoft/nni: An open source AutoML toolkit

    View Slide

  29. サンプルコード
    https://aka.ms/ml-at-scale

    View Slide

  30. HyperBand

    View Slide

  31. View Slide

  32. 3. モデル探索

    View Slide

  33. View Slide

  34. ユーザーの入力
    特徴量
    エンジニアリング
    アルゴリズム
    の選択
    ハイパーパラメータ
    のチューニング
    モデルの
    リーダーボードと解釈
    データセット
    設定と制約
    76% 34% 82%
    41%
    88%
    72%
    81% 54% 73%
    88% 90% 91%
    95% 68%
    56%
    89% 89% 79%
    順位 モデル スコア
    1 95%
    2 76%
    3 53%

    自動機械学習 AutoML (Automated Machine Learning) は、
    与えられたデータと設定に基づいて、「特徴量エンジニアリング」
    「アルゴリズム」とその「ハイパーパラメーター」の最良な組み合わせを探索します。

    View Slide

  35. microsoft/FLAML: A fast and lightweight AutoML library. (github.com)

    View Slide

  36. サンプルコード
    https://aka.ms/ml-at-scale

    View Slide

  37. Head node
    Worker nodes

    View Slide

  38. View Slide

  39. View Slide

  40. Azure/machine-learning-at-scale: machine learning at scale on Azure Machine Learning (github.com)
    Azure Machine Learning - サービスとしての ML | Microsoft Azure
    Azure/azureml-examples: Official community-driven Azure Machine Learning examples, tested with GitHub Actions.
    Azure/MachineLearningNotebooks: Python notebooks with ML and deep learning examples with Azure Machine Learning Python SDK | Microsoft (github.com)
    Distributed Data Parallel — PyTorch 1.10.0 documentation
    Distributed Learning Guide — LightGBM 3.3.1.99 documentation
    microsoft/nni: An open source AutoML toolkit (github.com)
    Dask: Scalable analytics in Python
    What is Ray? — Ray v1.8.0

    View Slide

  41. 41
    本セッションについて、日本マイクロソフト株式会社によるアンケートへご回答ご協力お願いいたします。
    [D14:Azure Machine Learning で始める大規模機械学習]
    アンケートご回答のお願い
    https://aka.ms/dbts2021D14
    ※アンケートURL 有効期限 : 2021/12/10

    View Slide

  42. 42
    クラウドによるデータ活用やAI導入により、
    ビジネスを無限に成長させるための事例や手法をご
    紹介するポータルサイト
    https://aka.ms/AAe3f4o
    2021年12月14日(火)~15日(水)の2日間に渡って
    Azure AI活用のベストプラクティスをお届けする
    オンラインイベント
    https://aka.ms/AAe3moh

    View Slide

  43. View Slide

  44. View Slide