Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AI研修(Deployment編)【ミクシィ22新卒技術研修】

 AI研修(Deployment編)【ミクシィ22新卒技術研修】

22新卒技術研修で実施したAI研修の講義資料(Deployment編)です。

ハンズオン用リポジトリ
https://github.com/nami73b/machine-learning-notebooks

<<AI研修資料一覧>>
#01 イントロダクション
https://speakerdeck.com/mixi_engineers/2022-ai-training-number-01-introduction

#02 data & training編
https://speakerdeck.com/mixi_engineers/2022-ai-training-number-02-data-and-training

#03 Deployment編
https://speakerdeck.com/mixi_engineers/2022-ai-training-number-03-deployment

#04 サービスへの導入編
https://speakerdeck.com/mixi_engineers/2022-ai-training-number-04-service

MIXI ENGINEERS

May 09, 2022
Tweet

More Decks by MIXI ENGINEERS

Other Decks in Programming

Transcript

  1. 要件定義 • ビジネス的な指標の設定 ユースケースによって、機械学習に求められる指標が異なる 例) 不良品検知の場合 ◦ recall(再現率): TP /

    (TP + FN) ➢ 正常品の巻き込みリスク ◦ precision(適合率): TP / (TP + FP) ➢ 不良品の見逃しリスク この2つは基本的にトレードオフ どちらを優先するか検討する必要がある 4 TP FP FN TN 正解 正例 負例 正例 負例 予測
  2. ケース: ねこ画像の投稿サービスでの投稿禁止コンテンツの検出 考えるべきこと1: 実行タイミング • 画像を選択したとき ➢ 誤選択時も推論時間分待たせることになる • 投稿ボタンを押した後

    ➢ 推論した結果投稿可の場合終了する • 投稿後に非同期で推論する ➢ 投稿後`掲載まで今しばらくお待ちください`と表示し終了する 掲載の可否はメール等で通知する ケースを考える 7
  3. ケース: ねこ画像の投稿サービスでの投稿禁止コンテンツの検出 考えるべきこと2: 指標 • 掲載したコンテンツのうち禁止コンテンツの割合 • 禁止コンテンツのうち、掲載可のコンテンツの割合 ➢ これらを集計するには人手による正解データが必要

    現実的には、 禁止コンテンツのうち本当に禁止コンテンツであった割合 としたほうが良いかもしれません ケースを考える TP FP FN TN 正解 正例 負例 正例 負例 予測 8
  4. • モデルをデプロイして終了ではない ◦ モデルの管理 ➢ バージョニングによって切り替え可能な状態にしておく ◦ モデルの挙動/パフォーマンス検証 ➢ テスト通りの性能を継続して発揮できているか

    ◦ 再学習 ➢ 定期的?精度低下を検知? ➢ 再学習したモデルは自動でデプロイ?精度を判断してから? これらを継続的に行えるシステム(MLOps)の構築が重要 価値を安定的にユーザーに届ける 14 データ収集 前処理 学習 推論 デプロイ ビルド 評価 利用 フィードバック
  5. ハンズオン2 15 https://github.com/nami73b/machine-learning-notebooks • 02_deploy_and_serving • 03_parameter_tuning • 04_transfer_learning •

    05_predict_structured_data • ハンズオン1と同じ環境で下記のハンズオンにトライしてみてください
  6. 16