2019.07.05 Cloud Native Kansai #04 MLOpsで必要なflowを考えてみる

2019.07.05 Cloud Native Kansai #04 MLOpsで必要なflowを考えてみる

2019.07.05 Cloud Native Kansai #04 MLOpsで必要なflowを考えてみる

F0940359a23a1d02661e8715487a729b?s=128

Takayoshi Kobayashi

July 05, 2019
Tweet

Transcript

  1. #cnjp 2019.07.05 Cloud Native Kansai #04 ABEJA, Inc / Takayoshi

    Kobayashi / @koba_taka MLOpsで必要なflowを考えてみる
  2. #cnjp 2 What is MLOps ?

  3. #cnjp 3 ML will run on Kubernetes

  4. #cnjp 4 MLOps ✕ Kubernetes

  5. #cnjp 5 @koba_taka Twitter Like takayoshi.kobayashi.16 Facebook AWS Drinking Job

    Takayoshi Kobayashi Who is ? ABEJA Co., Ltd. ABEJA Platform Customer Success
  6. None
  7. #cnjp 7 Deep Learningの実装、運用プロセスを効率化する ABEJA Platform。 来客属性、動線分析、リピート推定といった 顧客行動データの取得・分析を基軸とする、 AIを活用した 店舗解析サービス。

    商品仕分け、メンテナンスサポートの効率化、熟練工の行動分析といった、 AIを用いた多用なソリューションを展開。   製造業、インフラ業、物流業や小売業まで、 150社以上のAI導入実績で得た知見・ノウハウをもとに、 AI導入・活用まで一気通貫で支援します。 AIのビジネス実装 What`s ABEJA?
  8. #cnjp 8 インフラやってますか?

  9. #cnjp 9 機械学習やってますか?

  10. #cnjp 10 機械学習インフラしたいなー?

  11. #cnjp 11 We are hiring!!

  12. #cnjp 12 What is MLOps ?

  13. #cnjp 13 MLOps Pipeline Low Data Data Wrangling Data Preprocessing

    Validation Training New Data Training Data Model Inference Predictions Input Data
  14. #cnjp 14 Why Machine Learning on Kubernetes? Low Data Data

    Wrangling Data Preprocessing Validation Training New Data Training Data Model Inference Predictions Input Data データ収集・蓄積 開発・学習 推論・予測
  15. #cnjp 15 Hidden Technical Debt in Machine Learning Systems [Sculley+,

    NIPS 2015] 正直、MLOpsって設計より管理が大変‥
  16. #cnjp 16 We have Kubernetes!!

  17. #cnjp 17 構成としてはこんな感じ?

  18. #cnjp 18 just only?

  19. #cnjp 19 Noooo!!!!

  20. #cnjp 20 Make it Easy for Everyone to Learn, Deploy

    and Manage Portable, Distributed ML on Kubernetes (Everywhere) by Michelle Casbon (Google)
  21. #cnjp 21 Agree with you

  22. #cnjp 22 The ML Toolkit for Kubernetes

  23. #cnjp 23 Why Machine Lerning on Kubeflow? Composability Portability Scalability

  24. #cnjp 24 Ambassador Service Ambassador Ambassador Ambassador CentralUI JupyterHub TFJobDashBoard

    KubeDash Kubeflowを構成するもの
  25. #cnjp 25 Kubeflowを構成するもの part.1 Ambassador ・Kubernetes上で動作するAPI Gateway ・役目はModelの提供 ・Envoyをイイ感じに構成 ・自分のServerに暗号化や認証認可を付与可能

    ・ルーティングとスケーリングの運用が簡単 モデルのサービングをKubernetes上で快適に!
  26. #cnjp Soldon Core 26 Kubeflowを構成するもの part.2 ・機械学習のモデルをKubernetesクラスタ上にデプロイ ・多様な言語やフレームワークに対応している ・機械学習のモデルを、RESTやgRPCを介した公開可能 ・モデルの継続的なアップデート、スケーリング、

     モニタリングなどを可能 モデルのデプロイをKubernetes上で快適に!
  27. #cnjp Soldon Core main supported 27

  28. #cnjp 28 Kubeflowを構成するもの part.3 Argo ・コンテナネイティブなワークフローエンジン ・Kubernates Cluster上で稼働 ・ワークフローをYAMLで宣言的に書ける ・MLOpsでは各タスクを記載

     (整形・登録など) ・resources指定なども可能 ・簡単に操作ができ、スゴイやつ パイプラインジャングルをKubernates上で解決!
  29. #cnjp 29

  30. #cnjp 30 Example:EKS on Kubeflow Overview

  31. #cnjp 31 Why Machine Learning on Kubernetes? Low Data Data

    Wrangling Data Preprocessing Validation Training New Data Training Data Model Inference Predictions Input Data データ収集・蓄積 開発・学習 推論・予測
  32. #cnjp 32 Demo

  33. #cnjp 33 まとめ ・機械学習のモデル作成/提供はインフラやることいっぱい ・MLOpsのパイプラインを意識して設計が大事 ・極力、省力化した運用を心がけよう ・Kubeflowなどのオーケストレーションツールの検討を

  34. #cnjp 34 宣伝:ABEJA PLATFORM 04 デプロイ 01 取得 05 推論・再学習

    03 学習 02 蓄積 AIの継続的 インテグレーションを実現 01 取得 02 蓄積 03 学習 04 デプロイ 05 推論・再学習 モニタリング トリガー デプロイ データレイク アノテーション データセット 学習 AIのモデル開発工程における継続的インテグレーションの各タスクを機能として提供しています。
  35. #cnjp 35 フローを理解して快適なMLOpsライフを!

  36. #cnjp 36 Thank you!!