Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ABEJA PlatformとAIで作るサブスクリプションビジネス

ABEJA
March 05, 2019

ABEJA PlatformとAIで作るサブスクリプションビジネス

SIX 2019 biz-f-3
「ABEJA PlatformとAIで作るサブスクリプションビジネス」
Shogo Muranushi @ABEJA, Inc.

前半は、自社の課題解決に止まらず業界の課題解決にビジネスを転換した事例をもとに、スケールさせるビジネスとAIで持続的価値を提供する方法についてお話しします。後半では、それらを実現する上で必要な技術要素の説明と、ABEJA Platformを活用して如何にスピーディーにビジネスを始めるか、デモを交えながらご紹介します。

ABEJA

March 05, 2019
Tweet

More Decks by ABEJA

Other Decks in Technology

Transcript

  1. サブスクリプションビジネスとは 概要 所有権の移転 途中解約 利益 販売 売り切り あり (顧客へ) ✕

    販売時点で 確定 リース リース会社と契約する⾦融取引 なし ✕ 継続的 レンタル レンタルする対象商品の中から選んで 借りるモデル なし ◯ 継続的 サブスクリプション 顧客ニーズに合った商品やサービス を、定額で提供するモデル なし ◯ 継続的 早いサイクルで顧客に向き合って、改善・成⻑しないと成り⽴たないビジネスモデル
  2. 従来の製品開発との違い 売り切り 購⼊ ɹܧଓ՝ۚ ɹ ड஫ ϚʔέɾӦۀ サブスク リプション 継続

    解約 ܧଓར༻ͯ͠΋Β͏ͨΊʹ ͢͹΍͘վળͷαΠΫϧΛճ͢ ੡඼αϙʔτ ɹ ड஫ ϚʔέɾӦۀ
  3. ։ൃ؀ڥ͔Βຊ൪؀ڥ΁ͷҾ͖౉͠ データ、モデル、結果のバージョン管理 冗⻑性やGPUリソースの担保、 エッジ側との連携プロセス構築 ⼤量データの取得に必要なAPIや負担分 散の仕組みや準備、セキュリティ担保 教師データの作成に必要なツールと⼈材の準備 データウェアハウス の準備と管理 データのバリエーション(正確性)の確認

    0からのモデル設計 GPU環境の準備 と⾼度な分散化 デプロイ後のモデルの挙動を監視し、 必要に応じてモデルをアップデート データ 取得 データ 蓄積 データ 確認 教師 データ 作成 モデル 設計 学習 評価 デプロイ 推論 再学習 教師 データ 作成 デプロイ 推論 再学習
  4. ։ൃ؀ڥ͔Βຊ൪؀ڥ΁ͷҾ͖౉͠ データ、モデル、結果のバージョン管理 冗⻑性やGPUリソースの担保、 エッジ側との連携プロセス構築 ⼤量データの取得に必要なAPIや負担分 散の仕組みや準備、セキュリティ担保 教師データの作成に必要なツールと⼈材の準備 データウェアハウス の準備と管理 データのバリエーション(正確性)の確認

    0からのモデル設計 GPU環境の準備 と⾼度な分散化 デプロイ後のモデルの挙動を監視し、 必要に応じてモデルをアップデート データ 取得 データ 蓄積 データ 確認 教師 データ 作成 モデル 設計 学習 評価 デプロイ 推論 再学習 教師 データ 作成 デプロイ 推論 再学習 AI活⽤までに数多くの課題が存在
  5. “ As the machine learning (ML) community continues to accumulate

    years of experience with live systems ” “ 開発およびMLシステムを導⼊することは⽐較的⾼速で安価ですが、時間をかけて それを維持することは困難かつ⾼価である”
  6. ։ൃ؀ڥ͔Βຊ൪؀ڥ΁ͷҾ͖౉͠ データ、モデル、結果のバージョン管理 冗⻑性やGPUリソースの担保、 エッジ側との連携プロセス構築 ⼤量データの取得に必要なAPIや負担分 散の仕組みや準備、セキュリティ担保 教師データの作成に必要なツールと⼈材の準備 データウェアハウス の準備と管理 データのバリエーション(正確性)の確認

    0からのモデル設計 GPU環境の準備 と⾼度な分散化 デプロイ後のモデルの挙動を監視し、 必要に応じてモデルをアップデート データ 取得 データ 蓄積 データ 確認 教師 データ 作成 モデル 設計 学習 評価 デプロイ 推論 再学習
  7. ։ൃ؀ڥ͔Βຊ൪؀ڥ΁ͷҾ͖౉͠ データ、モデル、結果のバージョン管理 冗⻑性やGPUリソースの担保、 エッジ側との連携プロセス構築 ⼤量データの取得に必要なAPIや負担分 散の仕組みや準備、セキュリティ担保 教師データの作成に必要なツールと⼈材の準備 データウェアハウス の準備と管理 データのバリエーション(正確性)の確認

    0からのモデル設計 GPU環境の準備 と⾼度な分散化 デプロイ後のモデルの挙動を監視し、 必要に応じてモデルをアップデート データ 取得 データ 蓄積 データ 確認 モデル 設計 学習 評価 教師 データ 作成 デプロイ 推論 再学習
  8. ։ൃ؀ڥ͔Βຊ൪؀ڥ΁ͷҾ͖౉͠ データ、モデル、結果のバージョン管理 冗⻑性やGPUリソースの担保、 エッジ側との連携プロセス構築 ⼤量データの取得に必要なAPIや負担分 散の仕組みや準備、セキュリティ担保 教師データの作成に必要なツールと⼈材の準備 データウェアハウス の準備と管理 データのバリエーション(正確性)の確認

    0からのモデル設計 GPU環境の準備 と⾼度な分散化 デプロイ後のモデルの挙動を監視し、 必要に応じてモデルをアップデート データ 取得 データ 蓄積 データ 確認 モデル 設計 学習 評価 教師 データ 作成 デプロイ 推論 再学習
  9. Datalake • 実質無制限にデータ保存 • 1ファイル毎に任意のメタデータを付与 • ⾃動バックアップ、⼀定期間後に⾃動削除 • セキュリティの⾃動強化 •

    認証認可やアクセスコントロール、データ 暗号化などのセキュリティ設定済み Unstructured data Metadata Auto backup Access control Authentication Encrypt data
  10. ։ൃ؀ڥ͔Βຊ൪؀ڥ΁ͷҾ͖౉͠ データ、モデル、結果のバージョン管理 冗⻑性やGPUリソースの担保、 エッジ側との連携プロセス構築 ⼤量データの取得に必要なAPIや負担分 散の仕組みや準備、セキュリティ担保 教師データの作成に必要なツールと⼈材の準備 データウェアハウス の準備と管理 データのバリエーション(正確性)の確認

    0からのモデル設計 GPU環境の準備 と⾼度な分散化 デプロイ後のモデルの挙動を監視し、 必要に応じてモデルをアップデート データ 取得 データ 蓄積 データ 確認 モデル 設計 学習 評価 教師 データ 作成 デプロイ 推論 再学習
  11. Model v1 Model v2 Model v3 Model v4 Week 1

    91.2% Week 2 91.9% Week 3 92.5% Week 4 94.8% 93.6% 特定条件下はv2の精度が⾼い。なぜ? 数個前のモデルに本番のデータで精度評価をしてますか?
  12. Deployment - 学習済みモデルのバージョン管理  - DataSetと連携管理 - 作成したモデルを1クリックでWebAPIに  - APIのBlue Green

    Deployment - 推論結果の保存機能をサポート B/G Deployment Few click deploy Auto Save High Scalability High Availability High Security
  13. やること 開発・運⽤ コスト最適化 耐障害性 セキュリティ 運⽤・保守 安全なデプロイ、データの保存、精度の可視化、デプロイ前の評価、アノ テーションツール、etc オートスケール(ステートレス)、Docker、CPU最適化 /

    Intel MKL、推 論⽤GPU / Amazon Elastic Inference、スポットインスタンス アクセスコントロール、認証認可、暗号化、ロギング、クラウド関連( IAM / SecurithGroup / KMS / CloudTrail / etc ) AWS Well Architected、Kubernetes、etc モニタリング、トラブルシュート
  14. やること スキルセット 複数⼈体制 作り直し システム陳腐化 継続的カイゼン 通常のWebシステムの知識に加えて、これまでのポイントを理解、把握し て設計・構築・開発できる⼈が必要。 さらに、これらのシステムを運⽤・トラブルシュートできるスキルセット を持っている⼈たち(⼀⼈では運⽤できない)が必要。

    機械学習基盤はまだまだベストプラクティスが固まっていない。ディープ ラーニングライブラリのアップデート頻度が⾼く、すぐに陳腐化する。 1回で完璧なシステムは作れない。ABEJA Platformも各機能何回か作り直 している。 システムは作って終わりじゃない、改善して成⻑させ、持続的に価値を提 供する必要がある。
  15. やること スキルセット 複数⼈体制 作り直し システム陳腐化 継続的カイゼン 通常のWebシステムの知識に加えて、これまでのポイントを理解、把握し て設計・構築・開発できる⼈が必要。 さらに、これらのシステムを運⽤・トラブルシュートできるスキルセット を持っている⼈たち(⼀⼈では運⽤できない)が必要。

    機械学習基盤はまだまだベストプラクティスが固まっていない。ディープ ラーニングライブラリのアップデート頻度が⾼く、すぐに陳腐化する。 1回で完璧なシステムは作れない。ABEJA Platformも各機能何回か作り直 している。 システムは作って終わりじゃない、改善して成⻑させ、持続的に価値を提 供する必要がある。 どの程度のスキルセットで どのくらいの⼈数で どのくらいの期間が必要か
  16. データ 取得 データ 蓄積 データ 確認 教師 データ 作成 モデル

    設計 学習 評価 デプロイ 推論 再学習 教師 データ 作成 デプロイ 推論 再学習 1/3 1/20
  17. service amount repletion Datalake storage: 1TB - transfer: 1TB (Outbound)

    - Annotation πʔϧར༻Մ ར༻ྔʹԠͨ͡՝ۚʢैྔ՝ۚʣ Learning 168࣌ؒ - Deploy (WebAPI) Max 4CPU / 16GB෼ 0.25CPU / 0.75GB୯ҐͰར༻Մೳ Database 1CPU/1GB - Support Platformར༻αϙʔτ Ϟσϧ։ൃɾٕज़αϙʔτ͸Φϓγϣϯ ABEJA Platform 利⽤料: ¥600,000/⽉
  18. service amount repletion Datalake Storage: 1TB ¥20,000 transfer: 100GB (Outbound)

    ¥10,000 Learning 168h ¥100,000 Deploy (WebAPI) 1CPU/3.5GB෼ ¥100,000 Database 2CPU/15GB ¥50,000 Support Ϟσϧ։ൃɾٕज़αϙʔτ͸Φϓγϣϯ ಺༰ʹΑΓཁ૬ஊ オプション(⽉額)
  19. NEW

  20. ։ൃ؀ڥ͔Βຊ൪؀ڥ΁ͷҾ͖౉͠ データ、モデル、結果のバージョン管理 冗⻑性やGPUリソースの担保、 エッジ側との連携プロセス構築 ⼤量データの取得に必要なAPIや負担分 散の仕組みや準備、セキュリティ担保 教師データの作成に必要なツールと⼈材の準備 データウェアハウス の準備と管理 データのバリエーション(正確性)の確認

    0からのモデル設計 GPU環境の準備 と⾼度な分散化 デプロイ後のモデルの挙動を監視し、 必要に応じてモデルをアップデート データ 取得 データ 蓄積 データ 確認 モデル 設計 学習 評価 教師 データ 作成 デプロイ 推論 再学習 લஈͷϓϩηεΛѹ౗తʹޮ཰Խ