Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Azure Machine Learning 大規模機械学習

konabuta
November 18, 2021

Azure Machine Learning 大規模機械学習

db tech showcase 2021 講演資料
Title : Azure Machine Learning で始める大規模機械学習 @ 女部田啓太

konabuta

November 18, 2021
Tweet

More Decks by konabuta

Other Decks in Technology

Transcript

  1. ク ラ ウ ド ス ケ ー ル 分 析

    で デ ー タ 活 用 に 無 限 の 可 能 性 を Find new value on Azure Azure Machine Learning ではじめる 大規模機械学習 女部田啓太 日本マイクロソフト株式会社 https://aka.ms/ml-at-scale
  2. ML

  3. Azure M achine Learning service 実験的なモデル開発 ⾃動機械学習 デザイナー Pytyon /

    R モデル検証 パッケー ジ化と Azure Container Instnaces での検証 モデル学習 コンピュー ティング クラスター モニタリング モデルのモニタリング デプロイ スケー ラブルな kubernetes サ ー ビス へ のデプロイ CI/CD & モデル再学習 GitHub & Azure DevOps 統合・連携
  4. クラウド CPU、GPU データセット プロファイル、ドリフト検知、 ラベリング 推論 バッチ、リアルタイム MLOps 再現性、自動化、GitHub、CLI、REST 機械学習の実験

    Python SDK & CLI 、Notebook、ドラック & ドロップ UI、ウィザード形式 エッジ CPU、GPU、ONNX IoT Edge セキュリティ、管理、展開 計算環境 ジョブ管理、マネージドなワークステーション & クラスター モデル登録 モデル登録、イメージ化 モデル学習 実験管理、実行 (Runs)
  5. 学習ジョブの発行 Azure Storage Account Azure Container Registry Azure ML Experiment

    Logs and Results 学習スクリプト Mount/Download Azure ML Compute Cluster Azure ML Dataset/Datastore Azure ML Environment Job 設定 YAML ファイル DockerFile
  6. Conv2d Max pooling Linear Linear Dropout Conv2d Conv2d Conv2d Max

    pooling Linear Linear Dropout Conv2d Conv2d
  7. [python] [dask] add initial dask integration by SfinxCZ · Pull

    Request #3515 · microsoft/LightGBM (github.com) Image credit: James Bourbeau
  8. ユーザーの入力 特徴量 エンジニアリング アルゴリズム の選択 ハイパーパラメータ のチューニング モデルの リーダーボードと解釈 データセット

    設定と制約 76% 34% 82% 41% 88% 72% 81% 54% 73% 88% 90% 91% 95% 68% 56% 89% 89% 79% 順位 モデル スコア 1 95% 2 76% 3 53% … 自動機械学習 AutoML (Automated Machine Learning) は、 与えられたデータと設定に基づいて、「特徴量エンジニアリング」 「アルゴリズム」とその「ハイパーパラメーター」の最良な組み合わせを探索します。
  9. Azure/machine-learning-at-scale: machine learning at scale on Azure Machine Learning (github.com)

    Azure Machine Learning - サービスとしての ML | Microsoft Azure Azure/azureml-examples: Official community-driven Azure Machine Learning examples, tested with GitHub Actions. Azure/MachineLearningNotebooks: Python notebooks with ML and deep learning examples with Azure Machine Learning Python SDK | Microsoft (github.com) Distributed Data Parallel — PyTorch 1.10.0 documentation Distributed Learning Guide — LightGBM 3.3.1.99 documentation microsoft/nni: An open source AutoML toolkit (github.com) Dask: Scalable analytics in Python What is Ray? — Ray v1.8.0