ABEJA PlatformとAIで作るサブスクリプションビジネス

DAY 2 “藝” Business Day ABEJA PlatformͱAIͰ࡞Δ αϒεΫϦϓγϣϯϏδωε ଜओ ૖ޛʢΉΒ͵͠
͠ΐ͏͝ʣABEJA, Inc. Product Owner

• サブスクリプションビジネスについて少し分かる • 継続的に価値を上げるにはデータが重要 • 他社事例を元に⾃社に応⽤できるイメージが湧く • AIをビジネスに実装することは⾃社のビジネスを成⻑させる上で今後必須になること •
ABEJA Platformは何が出来るのか今⽇のゴール

サブスクリプションビジネスの結論

製品の売るのではなくて、結果を売る

サブスクリプションビジネスとは

サブスクリプションビジネスとは概要所有権の移転途中解約利益販売売り切りあり（顧客へ） ✕
販売時点で確定リースリース会社と契約する⾦融取引なし ✕ 継続的レンタルレンタルする対象商品の中から選んで借りるモデルなし ◯ 継続的サブスクリプション顧客ニーズに合った商品やサービスを、定額で提供するモデルなし ◯ 継続的早いサイクルで顧客に向き合って、改善・成⻑しないと成り⽴たないビジネスモデル

なぜサブスクリプションなのかお客様のニーズ所有利⽤

なぜサブスクリプションなのかお客様のニーズ所有利⽤例メールサーバファイルサーバ

なぜサブスクリプションなのか直ぐ始められる直ぐ辞められる事業成⻑に合わせられる管理不要お客様のニーズ所有利⽤
例メールサーバファイルサーバ

従来のビジネスモデルの違いコストコスト売上 ੡඼αϙʔτ ɹ ड஫ ϚʔέɾӦۀ 売り切り

従来のビジネスモデルの違いコストコスト売上コスト ɹܧଓ՝ۚ ɹ ड஫ ϚʔέɾӦۀ ੡඼αϙʔτ
ɹ ड஫ ϚʔέɾӦۀ 売上売り切りサブスクリプション

従来の製品開発との違い売り切り購⼊ ɹܧଓ՝ۚ ɹ ड஫ ϚʔέɾӦۀ サブスクリプション継続
解約 ੡඼αϙʔτ ɹ ड஫ ϚʔέɾӦۀ

従来の製品開発との違い売り切り購⼊ ɹܧଓ՝ۚ ɹ ड஫ ϚʔέɾӦۀ サブスクリプション継続
解約 ܧଓར༻ͯ͠΋Β͏ͨΊʹ ͢͹΍͘վળͷαΠΫϧΛճ͢ ੡඼αϙʔτ ɹ ड஫ ϚʔέɾӦۀ

ref: https://pbs.twimg.com/media/DrS9_fPU8AEVRQf.jpg

継続利⽤してもらうために重要なこと

継続利⽤してもらうためには顧客の⾏動を知ることが重要

継続利⽤してもらうためには顧客の⾏動を知ることが重要⾃社顧客売り切り⾃社にデータが貯まらない

継続利⽤してもらうためには顧客の⾏動を知ることが重要⾃社顧客サブスクリプション⾃社にデータを貯めて顧客、製品の状態・情報を分析する⾃社顧客売り切り

Webの場合はトラッキングしやすい

Webの場合はトラッキングしやすい Webサービスは貯めやすいメーカーは貯めにくい？

フェンダーの例ギターを買う練習する少し出来るようになると挫折する辞める ੜ֔ͷސ٬ 乗り越える

オンライン教育サービスをリリース

フェンダーの例 ʮࢲ͸ͨͩΪλʔΛചͬͯɺࣙΊͳ͍Ͱ͘Εɻ ͱفΔϏδωε͸΍Γͨ͘ͳ͔ͬͨʯ ސ٬ΛΪλʔͷॴ༗ऀͰ͸ͳ͘ Ϊλʔԋ૗ऀͱͯ͠ݟ͍ͯͨ

どうやってデータを集める

鍵はオンライン

ここで話を本来論に戻して、そもそも顧客が求めているもの

ここで話を本来論に戻して、そもそも顧客が求めているもの温かい美味しい⾷べ物

ここで話を本来論に戻して、そもそも顧客が求めているもの温かい美味しい⾷べ物製品結果

ここで話を本来論に戻して、そもそも顧客が求めているもの • 私は、トヨタを「⾃動⾞をつくる会社」から、「モビリティカンパニー」にモデルチェンジすることを決断しました。すなわち、世界中の⼈々の「移動」に関わるあらゆるサービスを提供する会社になるということです。 • https://www.toyota.co.jp/jpn/company/
message/

ここで話を本来論に戻して、そもそも顧客が求めているもの A஍఺ B஍఺ クルマは AからBへの移動⼿段

ここで話を本来論に戻して、そもそも顧客が求めているもの A地点からB地点までの間に顧客に出来ることは？ A஍఺ B஍఺ クルマは AからBへの移動⼿段

ここで話を本来論に戻して、そもそも顧客が求めているもの移動に際して顧客に満⾜してもらためにどんなデータが必要？ A地点からB地点までの間に顧客に出来ることは？ A஍఺ B஍఺ クルマは AからBへの移動⼿段

ͲͷΑ͏ʹσʔλΛऩू͢Δͷ͔

鍵はオンライン

先程の例

先程の例 ڞ௨఺͸೗Կʹސ٬ʹ͍ۙͱ͜ΖͰ σʔλΛऔಘͰ͖Δ͔

継続的に⾼い価値を顧客に提供するサイクルを確⽴顧客に近いところでデータを集める顧客を知るすぐにカイゼンする満⾜度が上がる顧客が増える継続利⽤になる

継続的に⾼い価値を顧客に提供するサイクルを確⽴顧客に近いところでデータを集める顧客を知るすぐにカイゼンする満⾜度が上がる顧客が増える継続利⽤になる
AI

• 沢⼭のデータが必要 • ⼤量のデータを元に徐々に改善（学習させる、⼿法変える含めて）し、成⻑させる必要がある • ではもっとデータを集めるにはどうしたら良いか AIは簡単に精度を達成できるものではない

εέʔϧ͢ΔϏδωεͷ࿩

⾃社だけに留まらず他社にもサービスを展開する Data ⾃社のみ他社へもサービス Data Data Data Data

⾃社だけに留まらず他社にもサービスを展開する Data ⾃社のみ他社へもサービス Data Data Data Data 事業投資業務改善

継続的にカイゼンするビジネスと AIを実装するには

やりたいことの確定 AI導⼊効果により結果的に業績が向上 AI ՝୊ઃఆ͕ॏཁ ͜͜Ͱؒҧ͑Δͱ ౸ୡͰ͖ͳ͍

¥ 活⽤⽅針策定 PoC 開発運⽤ AI案件の主な進め⽅

1〜2ヶ⽉ AI案件の主な進め⽅ ✓ AIが説くべき課題か ✓ 費⽤対効果が得られるか活⽤⽅針策定 PoC 開発運⽤

2〜3ヶ⽉ Proof of Concept (コンセプト実証) ✓ 本当にAIで解決できる課題か？ AI案件の主な進め⽅活⽤⽅針策定 PoC
開発運⽤

3〜4ヶ⽉実⽤化に向けたAIモデルの開発 ✓ 運⽤環境の構築 AI案件の主な進め⽅活⽤⽅針策定 PoC 開発運⽤

この時点から実現場で利⽤することが可能 ✓ 現場でも本当に活⽤できるのか？ ✓ AIを踏まえてのオペレーション AI案件の主な進め⽅活⽤⽅針策定 PoC 開発運⽤

⼀気通貫で⽀援活⽤⽅針の策定から運⽤まで活⽤⽅針策定 PoC ABEJAでは活⽤⽅針策定 PoC 開発運⽤開発
運⽤

NEW AI Development Partner Glia Computing

։ൃ؀ڥ͔Βຊ൪؀ڥ΁ͷҾ͖౉͠ データ、モデル、結果のバージョン管理冗⻑性やGPUリソースの担保、エッジ側との連携プロセス構築⼤量データの取得に必要なAPIや負担分散の仕組みや準備、セキュリティ担保教師データの作成に必要なツールと⼈材の準備データウェアハウスの準備と管理データのバリエーション（正確性）の確認
0からのモデル設計 GPU環境の準備と⾼度な分散化デプロイ後のモデルの挙動を監視し、必要に応じてモデルをアップデートデータ取得データ蓄積データ確認教師データ作成モデル設計学習評価デプロイ推論再学習教師データ作成デプロイ推論再学習

0からのモデル設計 GPU環境の準備と⾼度な分散化デプロイ後のモデルの挙動を監視し、必要に応じてモデルをアップデートデータ取得データ蓄積データ確認教師データ作成モデル設計学習評価デプロイ推論再学習教師データ作成デプロイ推論再学習 AI活⽤までに数多くの課題が存在

“ As the machine learning (ML) community continues to accumulate
years of experience with live systems ” “ 開発およびMLシステムを導⼊することは⽐較的⾼速で安価ですが、時間をかけてそれを維持することは困難かつ⾼価である”

0からのモデル設計 GPU環境の準備と⾼度な分散化デプロイ後のモデルの挙動を監視し、必要に応じてモデルをアップデートデータ取得データ蓄積データ確認教師データ作成モデル設計学習評価デプロイ推論再学習

0からのモデル設計 GPU環境の準備と⾼度な分散化デプロイ後のモデルの挙動を監視し、必要に応じてモデルをアップデートデータ取得データ蓄積データ確認モデル設計学習評価教師データ作成デプロイ推論再学習

データの保存 Data saving

σʔλอଘͷ՝୊ ⼤容量ストレージデータ暗号化アクセスコントロール検索性機械学習⽤の⼤容量データを保管できる容量ストレージ個⼈情報や機微な情報はデータの暗号化が必要アクセス権の管理、アクセスログの記録、⼀定期間後にデータを削除するなどの実装が必要
⼤量のデータから任意のデータを探せるような検索性も考慮

Datalake

Datalake • 実質無制限にデータ保存 • 1ファイル毎に任意のメタデータを付与 • ⾃動バックアップ、⼀定期間後に⾃動削除 • セキュリティの⾃動強化 •
認証認可やアクセスコントロール、データ暗号化などのセキュリティ設定済み Unstructured data Metadata Auto backup Access control Authentication Encrypt data

教師データの作成 Annotation

アノテーションとは？アノテーションとは、モデルに学習させる為の『問い』と『答え』となる教師データを⼈間が作成するプロセスのことを指します。機械学習や深層学習の教師あり学習などの研究分野においては、⼤量に学習した『問い』と『答え』の情報から、問いに対して答えを算出するまでの関数を⾃動的に導き出していくことが特徴となります。 Dog Dog Cat ඇߏ଄σʔλ Ξϊςʔγϣϯ
ߏ଄σʔλ

Annotation

Annotation - ラベリングのためのツール - 10万⼈を超えるアノテーターリソースによる委託サービスの提供 - 品質向上のための仕組み事前推論によるアノテーションの省⼒化機能
Segmentation Detection Polygon Text Video Voice

学習 Training

Training

Traing • 学習ジョブの実⾏ • 各種バージョン管理 • 学習⽤データ、学習⽤コード、学習結果を保存し、再現性、ノウハウの共有を⾏う • 並列学習でリードタイムを短縮
• 学習結果と精度をGUI上で⽐較、記録 Parallel training GPU Major DL Library Tensorboard Jupyter notebook Local develop

0からのモデル設計 GPU環境の準備と⾼度な分散化デプロイ後のモデルの挙動を監視し、必要に応じてモデルをアップデートデータ取得データ蓄積データ確認モデル設計学習評価教師データ作成デプロイ推論再学習

どれだけ前⾏程を頑張っても、価値が出るのはデリバリーしてから  つまり、本番運⽤するデリバリー以降が⼤事活⽤⽅針策定 PoC 開発運⽤

推論 Deploy / Serving 仮説・検証 Hypothesis verification 洞察 Insight Fast
Delivery

推論 Deploy / Serving

Serving 推論結果データ保存 Deploy 推論 Deploy / Serving 仮説・検証 Hypothesis
verification 洞察 Insight Fast Delivery

デプロイ Deploy

94.3% リリースする前に本番のデータで精度評価をしてますか？ Old Model

94.3% 91.6% リリースする前に本番のデータで精度評価をしてますか？ Old Model New Model

数個前のモデルに本番のデータで精度評価をしてますか？ Model v1 Model v2 Model v3 Model v4 Week
1 91.2% Week 2 91.9% Week 3 92.5% Week 4 93.6%

Model v1 Model v2 Model v3 Model v4 Week 1
91.2% Week 2 91.9% Week 3 92.5% Week 4 94.8% 93.6% 特定条件下はv2の精度が⾼い。なぜ？数個前のモデルに本番のデータで精度評価をしてますか？

Model v1 Model v2 LB 安全に切り替えることはできますか？

安全に切り替えることはできますか？ LB Model v2

Alias 安全に切り替えることはできますか？ Model v1 Model v2

安全に切り替えることはできますか？ Alias Model v1 Model v2

91.2% 93.4% 並⾏して精度を確認できたら？ Alias Model v1 Model v2

並⾏して精度を確認できたら？ 91.2% 93.4% Alias Model v1 Model v2

Endpoint

Endpoint Version URL 1.0.1 Primary https://abeja-internal.api.abeja.io/deployments/1625779592631/services/ser-9ac6cf0253fc4d33 https://abeja-internal.api.abeja.io/deployments/1625779592631 1.0.0 https://abeja-internal.api.abeja.io/deployments/1625779592631/services/ser-585213887b554196 •
バージョン毎にURLを発⾏ • 安全に切り替え可能 • リリース前に精度を評価 • 複数の推論APIに対して結果を可視化

サービング Serving

Servingͷ՝୊ ⾼可⽤性スケーラビリティセキュリティ複数のアベイラビリティゾーンに分散？  障害時の⾃動復旧？  24/365の体制やローテーション？意図した通りにスケールアウトする？スケールインする？  オートスケールはCPUベース？レイテンシーベース？GPUベース？  ステートレス？
認証認可？ユーザ管理？  暗号化？アクセス権限？ロギング？  クラウド特有のセキュリティ？

Well-Architected フレームワークは、クラウドアーキテクトがアプリケーション向けに実装可能な、安全で⾼いパフォーマンス、障害耐性を備え、効率的なインフラストラクチャを構築するのをサポートする⽬的で開発されました。このフレームワークでは、5 つの柱 (運⽤上の優秀性、セキュリティ、信頼性、パフォーマンス効率、コスト最適化) に基づいて、お客様とパートナーがアーキテクチャを評価し、時間と共にスケールする設計を実装するための⼀貫したアプローチが提供されます。
基準の⼀つ：AWS Well Architected

SaaS API PaaS IaaS Retail Manufacture Infrastructure Logistics

Deployment

Deployment - 学習済みモデルのバージョン管理 - DataSetと連携管理 - 作成したモデルを1クリックでWebAPIに - APIのBlue Green
Deployment - 推論結果の保存機能をサポート B/G Deployment Few click deploy Auto Save High Scalability High Availability High Security

推論結果と⽣データの保存 Save raw data and inference result

ਪ࿦݁Ռͷอଘͷඞཁੑ 推論結果のチェック間違いのフィードバック学習・検証データとして再利⽤推論の精度は100%は無い実際はどうだったのかチェックする必要がある精度に問題があればフィードバックを⾏う必要がある
再度学習するためのデータとして、もしくは検証するためのデータとして再利⽤することも可能

Dataset

Dataset • ⽣データとアノテーション済みデータを紐付け • 学習ジョブとのラベルによる紐付け、履歴管理 • 推論結果とのラベルによる紐付け、履歴管理 • 仮想データセットの作成 •
ラベル・タグによるフィルタ

洞察 Insight

可視化 KPI 推論 Deploy / Serving 仮説・検証 Hypothesis verification 洞察
Insight Fast Delivery

可視化 Visualization

ਫ਼౓ͷՄࢹԽͱϞχλϦϯά • 推論した結果が正しいのか例）⼈数カウント件数のブレ幅は許容範囲内か • PCDA・仮説検証の結果、精度はどう変わったのか

KPIの管理 KPI Management

Ϗδωε্ͷՁ஋Λܭଌ • 精度は出ているが、ビジネス的価値はどうなのか • 価値に対して計測することが必要

仮説検証 Hypothesis verification

仮説・データ整理アノテーション学習評価・⽐較推論 Deploy / Serving 仮説・検証 Hypothesis
verification 洞察 Insight Fast Delivery

ここからは⼈の話

やること開発・運⽤コスト最適化耐障害性セキュリティ運⽤・保守安全なデプロイ、データの保存、精度の可視化、デプロイ前の評価、アノテーションツール、etc オートスケール（ステートレス）、Docker、CPU最適化 /
Intel MKL、推論⽤GPU / Amazon Elastic Inference、スポットインスタンスアクセスコントロール、認証認可、暗号化、ロギング、クラウド関連（ IAM / SecurithGroup / KMS / CloudTrail / etc ） AWS Well Architected、Kubernetes、etc モニタリング、トラブルシュート

やることスキルセット複数⼈体制作り直しシステム陳腐化継続的カイゼン通常のWebシステムの知識に加えて、これまでのポイントを理解、把握して設計・構築・開発できる⼈が必要。さらに、これらのシステムを運⽤・トラブルシュートできるスキルセットを持っている⼈たち（⼀⼈では運⽤できない）が必要。
機械学習基盤はまだまだベストプラクティスが固まっていない。ディープラーニングライブラリのアップデート頻度が⾼く、すぐに陳腐化する。 1回で完璧なシステムは作れない。ABEJA Platformも各機能何回か作り直している。システムは作って終わりじゃない、改善して成⻑させ、持続的に価値を提供する必要がある。

やることスキルセット複数⼈体制作り直しシステム陳腐化継続的カイゼン通常のWebシステムの知識に加えて、これまでのポイントを理解、把握して設計・構築・開発できる⼈が必要。さらに、これらのシステムを運⽤・トラブルシュートできるスキルセットを持っている⼈たち（⼀⼈では運⽤できない）が必要。
機械学習基盤はまだまだベストプラクティスが固まっていない。ディープラーニングライブラリのアップデート頻度が⾼く、すぐに陳腐化する。 1回で完璧なシステムは作れない。ABEJA Platformも各機能何回か作り直している。システムは作って終わりじゃない、改善して成⻑させ、持続的に価値を提供する必要がある。どの程度のスキルセットでどのくらいの⼈数でどのくらいの期間が必要か

データ取得データ蓄積データ確認教師データ作成モデル
設計学習評価デプロイ推論再学習教師データ作成デプロイ推論再学習 1/3 1/20

ABEJA PlatformではML/DLの複雑な問題を継続的に解決していきます

Pricing

service amount repletion Datalake storage: 1TB - transfer: 1TB (Outbound)
- Annotation πʔϧར༻Մ ར༻ྔʹԠͨ͡՝ۚʢैྔ՝ۚʣ Learning 168࣌ؒ - Deploy (WebAPI) Max 4CPU / 16GB෼ 0.25CPU / 0.75GB୯ҐͰར༻Մೳ Database 1CPU/1GB - Support Platformར༻αϙʔτ Ϟσϧ։ൃɾٕज़αϙʔτ͸Φϓγϣϯ ABEJA Platform 利⽤料: ¥600,000/⽉

service amount repletion Datalake Storage: 1TB ¥20,000 transfer: 100GB (Outbound)
¥10,000 Learning 168h ¥100,000 Deploy (WebAPI) 1CPU/3.5GB෼ ¥100,000 Database 2CPU/15GB ¥50,000 Support Ϟσϧ։ൃɾٕज़αϙʔτ͸Φϓγϣϯ ಺༰ʹΑΓཁ૬ஊ オプション（⽉額）

MLaaS Manufacture Infrastructure Logistics

0からのモデル設計 GPU環境の準備と⾼度な分散化デプロイ後のモデルの挙動を監視し、必要に応じてモデルをアップデートデータ取得データ蓄積データ確認モデル設計学習評価教師データ作成デプロイ推論再学習 લஈͷϓϩηεΛѹ౗తʹޮ཰Խ

対象データのアップロードアノテーション AIモデルの作成評価レポートの取得ダウンロード ABEJA Platform Accelerator

ありがとうございました。

ABEJA PlatformとAIで作るサブスクリプションビジネス

ABEJA PlatformとAIで作るサブスクリプションビジネス

More Decks by ABEJA

Other Decks in Technology

Featured

Transcript