Getting started with MLOps

MLOpsのはじめ方 2021/04/21 shibui yusuke

自己紹介 shibui yusuke • 自動運転スタートアップのティアフォー所属 • よろず屋 • MLOpsコミュニティのオーガナイザー •
もともとクラウド基盤の開発、運用。 • ここ5年くらいMLOpsで仕事。 • Github: @shibuiwilliam • Qiita: @cvusk • FB: yusuke.shibui • 最近やってること: FlutterとIstio cat : 0.55 dog: 0.45 human : 0.70 gorilla : 0.30 物体検知

今日話すこと MLOps勉強会でMLOpsをどう取り入れていくのかって話をしてなくない？

CatOps! 放置しているとネコに椅子を奪われる。ネコ障害対応（餌、遊ぶ）。「遊ぶ」を自動化する。椅子に座っていてもハンズフリーで遊べる。 day 奪わ
れ回数ハンズフリー導入飽き始める Dev Data-driven 4 Ops

なぜ機械学習にDevOpsが必要か

• 機械学習の有用性を試す PoCから次の段階に行くためには機械学習の DevOpsが必要 • 機械学習を含むプロダクトの価値を継続的に引き出すのが MLOps 0->1の次を目指す PoCの数々ようやく成功した
プロダクト成長するにはなにが足りない？ →ビジネス指標から機械学習を評価する →機械学習だけにフォーカスしない

機械学習を使ったプロダクト例画像処理写真を撮るタイトル入力説明入力登録する自然言語処理違反検知登録情報から違反をフィルタリング
入力情報から入力補助超解像による画質改善ねこ検索協調フィルタリングやランク学習による並べ替えあるコンテンツ登録アプリ画像分類と検索

機械学習を使ったプロダクト例画像処理写真を撮るタイトル入力説明入力登録する自然言語処理違反検知登録情報から違反をフィルタリング
入力情報から入力補助超解像による画質改善ねこ検索協調フィルタリングやランク学習による並べ替えあるコンテンツ登録アプリ画像分類と検索タグどう学習する？ →定期的 →不定期 →評価が悪くなったときいつ推論する？ →検索時 →データ登録時 →1時間ごとにまとめてどう評価する？ →Accuracy, Confusion Matrix →検索数、CTR、いいね数

MLOpsのはじめ方

Good • プロダクトの課題からはじめる • リリースからはじめる • プロダクトの価値からはじめる Bad • 機械学習からはじめる
• 汎用基盤からはじめる • 技術的な課題からはじめる Issueからはじめる

プロダクトを設計する • 課題：画像データの検索に時間がかかっている • 状況：大量の画像データが保存されており、有効活用したいが必要な画像を検索することができない •
成功の定義：利用者が画像を選択するまでの時間を **分以内に短縮する

検索を容易にするために画像にタグをつけるネコ月ネコネコネコネコ宗谷岬空山
木コアラフライパンカーテン夜上海デザートフルーツイヌ

使い方を考えるネコネコイヌ・・・ネコ個数位置明るさ場所
容易さ便利さ画像をアップロード用途次第カテゴリを選択画像分類フリーテキスト入力画像分類＋自然言語処理フリーテキストと属性画像分類＋物体検知＋自然言語処理画像から類似画像を検索特徴量抽出＋ANN 3 暗外上

評価方法を考える • 目的を手段で要素分解する仮説を立てる • はやめに仮説検証できる技術を選択する目的のコンテンツを収集するまでの時間日時検索画像認識目的のコンテンツを
収集するまでの時間適切にタグ付けされたコンテンツ数と正解率目的のコンテンツを収集するまでの時間画像分類の Accuracy 物体検知の Ave. Precision

機械学習の目的と価値と可否を定義する • この写真にどうタグをつける？カテゴリ数画像分類物体検知セグメンテーションデータを作る所要時間検索カテゴリランキング
最低限使えるだいぶ便利いらない

学習の頻度と推論のタイミングを決めるデータ収集時定期バッチ検索時不定期定期的学習推論推論器が常時稼働している必要あり
類似画像検索バッチジョブが必要アノテーションとバッチジョブが必要ときどきサーバを起動して実行データ収集検索使う

学習を管理する実験フェーズ個人の効率性＞共有の価値チーム開発フェーズ共有の価値＞個人の効率性学習経過を記録学習結果を記録データを記録コードを管理実行環境を管理
可視化

（参考）機械学習の管理系ライブラリ • モデルの管理 ◦ modeldb: https://github.com/VertaAI/modeldb ◦ keepsake: https://keepsake.ai/ •
データも管理 ◦ DVC: https://dvc.org/ • 学習の経過も記録 ◦ TensorBoard: https://www.tensorflow.org/tensorboard • 学習パイプラインと経過とモデルを記録 ◦ mlflow: https://mlflow.org/ • 学習パイプラインと基盤 ◦ Metaflow: https://metaflow.org/ ◦ KubeFlow: https://www.kubeflow.org/ • 学習済みモデルを解析 ◦ Tensorflow Model Analysis: https://www.tensorflow.org/tfx/guide/tfma ◦ Netron: https://github.com/lutzroeder/netron

推論システムを作るモデルファイル推論コード or データベースストレージキューワーカー推論推論ビルド
キャッシュ検索UI 検索システム

（参考）機械学習の推論ライブラリ • TensorFlow, Keras ◦ サーバサイド：TensorFlow Serving　https://www.tensorﬂow.org/tfx/guide/serving ◦ スマホ：TensorFlow Lite　https://www.tensorﬂow.org/lite?hl=ja
• PyTorch ◦ サーバサイド：ONNX Runtime　https://github.com/microsoft/onnxruntime ◦ サーバサイド：Torch Serve　https://pytorch.org/serve/ ◦ スマホ：PyTorch Mobile　https://pytorch.org/mobile/home/ • scikit-learn ◦ サーバサイド：ONNX Runtime　https://github.com/microsoft/onnxruntime

間違いを修正するネコイヌ検知方法通報他モデルの推論と比較閲覧率見つける対策
再学習特定カテゴリ新モデル完全新モデル違うアルゴリズム

リリース基準を作る機械学習の基準システムの基準セキュリティの基準 Precision RMSE データと推論の偏り Accuracy F-score ログ
監視テスト網羅率負荷遅延コストの基準・・・切り戻す基準

• 手法1 推論するデータを分ける O　コスト O　全ユーザから新モデルの評価を得る X　同じデータの比較ができない • 手法2 アクセスするユーザを分ける O　同じデータで比較できる
O　新モデルへの移行が比較的簡単 X　コスト A/Bテストを作る新モデル現モデル新モデル現モデル

アンチパターン：機械学習だけ更新するねこ v1 v2 v3 ・・・汎用的に使えるモデル部分的に物体検知を活用動物の検索に有効同じUI/UXで
効果ある？

まとめ

本を出版します！ • AIエンジニアのための機械学習システムデザインパターン • 2021年5月17日出版 • https://www.amazon.co.jp/dp/4798169447/

Getting started with MLOps

Getting started with MLOps

shibuiwilliam

More Decks by shibuiwilliam

Other Decks in Technology

Featured

Transcript

MLOpsのはじめ方 2021/04/21 shibui yusuke

自己紹介 shibui yusuke • 自動運転スタートアップのティアフォー所属 • よろず屋 • MLOpsコミュニティのオーガナイザー •

今日話すこと MLOps勉強会でMLOpsをどう取り入れていくのかって話をしてなくない？

CatOps! 放置しているとネコに椅子を奪われる。ネコ障害対応（餌、遊ぶ）。「遊ぶ」を自動化する。椅子に座っていてもハンズフリーで遊べる。 day 奪わ

なぜ機械学習にDevOpsが必要か

• 機械学習の有用性を試す PoCから次の段階に行くためには機械学習の DevOpsが必要 • 機械学習を含むプロダクトの価値を継続的に引き出すのが MLOps 0->1の次を目指す PoCの数々ようやく成功した

機械学習を使ったプロダクト例画像処理写真を撮るタイトル入力説明入力登録する自然言語処理違反検知登録情報から違反をフィルタリング

機械学習を使ったプロダクト例画像処理写真を撮るタイトル入力説明入力登録する自然言語処理違反検知登録情報から違反をフィルタリング

MLOpsのはじめ方

Good • プロダクトの課題からはじめる • リリースからはじめる • プロダクトの価値からはじめる Bad • 機械学習からはじめる

プロダクトを設計する • 課題：画像データの検索に時間がかかっている • 状況：大量の画像データが保存されており、有効活用したいが必要な画像を検索することができない •

検索を容易にするために画像にタグをつけるネコ月ネコネコネコネコ宗谷岬空山

使い方を考えるネコネコイヌ・・・ネコ個数位置明るさ場所

評価方法を考える • 目的を手段で要素分解する仮説を立てる • はやめに仮説検証できる技術を選択する目的のコンテンツを収集するまでの時間日時検索画像認識目的のコンテンツを

機械学習の目的と価値と可否を定義する • この写真にどうタグをつける？カテゴリ数画像分類物体検知セグメンテーションデータを作る所要時間検索カテゴリランキング

学習の頻度と推論のタイミングを決めるデータ収集時定期バッチ検索時不定期定期的学習推論推論器が常時稼働している必要あり

学習を管理する実験フェーズ個人の効率性＞共有の価値チーム開発フェーズ共有の価値＞個人の効率性学習経過を記録学習結果を記録データを記録コードを管理実行環境を管理

（参考）機械学習の管理系ライブラリ • モデルの管理 ◦ modeldb: https://github.com/VertaAI/modeldb ◦ keepsake: https://keepsake.ai/ •

推論システムを作るモデルファイル推論コード or データベースストレージキューワーカー推論推論ビルド

（参考）機械学習の推論ライブラリ • TensorFlow, Keras ◦ サーバサイド：TensorFlow Serving　https://www.tensorﬂow.org/tfx/guide/serving ◦ スマホ：TensorFlow Lite　https://www.tensorﬂow.org/lite?hl=ja

間違いを修正するネコイヌ検知方法通報他モデルの推論と比較閲覧率見つける対策

リリース基準を作る機械学習の基準システムの基準セキュリティの基準 Precision RMSE データと推論の偏り Accuracy F-score ログ

• 手法1 推論するデータを分ける O　コスト O　全ユーザから新モデルの評価を得る X　同じデータの比較ができない • 手法2 アクセスするユーザを分ける O　同じデータで比較できる

アンチパターン：機械学習だけ更新するねこ v1 v2 v3 ・・・汎用的に使えるモデル部分的に物体検知を活用動物の検索に有効同じUI/UXで

まとめ

本を出版します！ • AIエンジニアのための機械学習システムデザインパターン • 2021年5月17日出版 • https://www.amazon.co.jp/dp/4798169447/