ノーコードAI開発プラットフォーム「AIMINA」のシステム設計コンセプトと技術的チャレンジ

/ アイミナノーコード開発AIプラットフォーム AIMINAサービス紹介

1. 会社紹介及び発表者紹介 2. AIMINA(アイミナ)とは • サービス紹介 • 活用事例 • 利用について
3. AIMINAのシステム構築について • システム設計コンセプト • 技術的チャレンジアジェンダ

SB C&S株式会社会社概要

3 コンシューマ法人流通 ※従業員数は2020年4月現在 ※SB C&S株式会社第6期（2020年3月期）決算より（日本基準単体）
売上 5,081億円ヤフー従業員数 1,865人その他ソフトバンクグループ株式会社戦略的持株会社ソフトバンク株式会社ソフトバンク事業の主要セグメントの一角を担う投資事業ファンド事業 SoftBank Vision Fund ソフトバンク事業 SB C&Sの位置づけ

4 IoT Core Business Base Business Drone AI Robot Cloud
New Focus Business License Package PC Peripheral etc Any Cloud Distribution Technical Support Post Support 販売パートナー全国10,000社取扱メーカー 4,000社 SB C&Sのビジネス

5 渡邉敬介 SB C&S株式会社 AIMINA事業推進室室長米国UNIVERSITY OF MIAMにてBBA取得
日本IBMにて営業及びマーケティング、アパレル企業にて経営企画、 1年間かけアジアからアフリカまでバックパック、米国へ移住しITコンサル企業にてシステムコンサル、その後、2017年9月にSB C&S株式会社入社し、 202年4月より現職につく。発表者紹介金井良太 SB C&S株式会社 AIMINA事業推進室エンジニアエンジニアとしてiOSアプリケーションの開発や機械学習関連のPJへの従事、 Kaggle参加などの経験を経て、 2021年8月にSB C&S株式会社に入社。趣味は絵画や美術館巡り。

6 AIMINA（アイミナ）とは • ノーコード開発AIプラットフォームの紹介

AIをみんなの手段に。ここからはじまる、AIの新体験。誰でも手軽にAIを使うことができるプラットフォームが生まれました。「AIで何かできないか？」「AIで試したいアイデアがある…」ビジネスの最前線で悩むあなたに、ぴったりの場所です。 AIMINAとは

AIMINAの特徴 AIを手軽に「学べる・作れる・試せる」クラウド型AIプラットフォームの誕生です。 AIMINAは、情報発信も、モデル開発も、モデル評価もできるクラウドサービス。 AIについて学ぶことから、データを使ったシミュレーションまで、幅広い使い方を想定して作られたのがAIMINAの特徴です。 AIに関して初歩から学びたい人も、持っているデータを使って今すぐ試したい人も。ひとりひとりに合った使い方がきっと見るかるはず。時間と開発費を最小限に、あなたのアイデアをAIで拡張してみませんか。

ノーコード開発 AIプラットフォーム 2022年5月より本格稼働後、約7か月間でご興味いただいた方ご利用いただいた方さまざまな業種で活用多くのみなさまにご利用いただいております！

以上のモデルを搭載結果を取得お客様データ AIを手軽に！やりたいことを選んでデータをドラッグ＆ドロップ画像系 x ６
・物体検知・画像分類・異常検知・ｾｸﾞﾒﾝﾃｰｼｮﾝ・姿勢推定など言語系 x ４・QA *2モデル・文書分類・文書要約数値系 x １０・時系列予測・ﾃｰﾌﾞﾙ回帰予測・時系列異常検知・時系列ｸﾗｽﾀｰ・離職者予測など音声系 x １

AIMINA活用事例 • 画像系、言語系、数値系などの活用事例 • 製造業、建設業、流通業、小売業、エネルギー、IT、公共など

ドラレコで撮影した物体(信号機、標識、電柱など)をAIで検知良品データをAIに学習させ、良品と異なる特徴をもったデータを識別建設現場の安全管理として、クレーン下の作業員を検知公共測量事業製造業建設業物体検知
プロジェクト毎に必要な AI開発を自社で運用！画像異常検知検品作業の自動化で生産コストを削減！物体検知危険を検知することで安全管理の向上！

保守/メンテビジネス拡大に向けて過去実績からオポチュニティ発掘発注システムに登録された情報をAIで分析可能なデータへ社内の様々な部署で行われている問合せ業務の効率化に挑戦 IT企業流通業製造業 QA（質疑応答）
3名体制の問合せ業務を 4割削減にチャレンジ！文書分類活用できていなかった社内データを有効活用！文書要約/文書分類活用できていなかった社内データから売上拡大！

週次で作成するレポート業務を時系列予測モデルで効率化発電機の状態監視業務を数値系AIモデルで効率化社員属性及び勤怠情報から離職の可能性がる属性を予測流通業電力・ガス業 IT企業時系列予測
月16時間以上かかるレポート業務をAIで数分に！数値系AI 障害時対応を迅速にし、安定性向上に向けた挑戦！離職者者予測働き方改革が進む中早めの社員ケアを！

AIMINAの使い方 • AIプロジェクトにおけるAIMINAの位置づけ • AIMINAが選ばれる理由 • フリートライアル紹介 • 教育＋AIMINA

17 ▪AI活用アセスメント -AIで実現したい課題を定義 -AI活用スコープを定義 -データ要件定義 •PrePoCで実現性を確認 •結果をふまえ戦略策定 ▪プロジェクト計画 -ビジネスプランの作成 -プロジェクト体制構築
▪社内承認 ▪データの収集 ▪データ分析 ▪データ作成 ▪モデルの設計 ▪学習 ▪精度検証・評価 ※繰り返し実施 ▪モデル構築 ▪AIモデル利用クラウド/オンプレ ▪アプリケーション開発 ▪システム環境構築 ▪デプロイ ▪ユーザートレーニング ▪運用体制構築、稼働 ▪精度検証 ▪データ再収集 ▪データ作成 ▪モデル再構築 ▪再デプロイ構想データ収集開発運用 PoC データ収集／アノテーション／学習／評価 PoCを繰り返し実用可能な精度へ AIプロジェクトの進め方

18 ⚫ AIでやりたいことがどこまででできるのか？ ⚫ 業務効率化させたい内容はAIで解決できるのか？ ⚫ データは揃っているか？どのようなデータが必要か？構想データ収集開発
運用 PoC まずは試してみる！事前PoCの実施事前PoCができればプロジェクト化に向けた構想フェーズが進められます！（要件定義、社内承認、予算化など） AIの目的利用 AI手法活用データ AIMINAでできること１プロジェクト化に向けた要件定義に

19 お手持ちのデータでAIMINAでAIモデルを作って、評価することで、実業務に最適なAIモデルを生成！データ収集開発運用 PoC 画像系、言語系、数値系など 20種ほどのAI
を使って繰り返しPoCを実施！構想ノーコードでAI開発AIMINAでPoCの実施複数種類のモデル生成最適なデータ作成精度の比較 AIMINAでできること２ AI開発PoCをノーコードで実施

20 AIMINAで作成した学習済AIモデルを使って日々の運用し、最新のデータでモデルを更新。データ収集開発運用 1. リアルタイム性を伴わない月次の売上予測などは AIMINA上で実運用（推論）
2. リアルタイム性を伴う生産ラインの画像異常検知などはモデルダウンロード機能で学習済モデルをダウンロードしシステムに組み込んで活用 *システムへの組込み開発はAIMINAサービスに含まれておりません構想 AIMINAで作成したAIで実運用 AIMINA上で実運用モデルダウンロード機能活用 PoC AIMINAでできること３ AIMINAと使って運用

① 幅広い利用シーンに対応 ② 使いやすい ③ 低価格 ①幅広い利用シーン ②使いやすい ③低価格

出荷予測による在庫や欠品削減回帰予測で不動産/車両価格予測画像分類による未装着検出異常検知による不良品検知文書分類による
メールの仕分け質疑応答による自動回答検証需要予測AI 画像処理AI 文書処理AI 期間： 1か月料金：無料利用時間： 60h/月 AIプラットフォーム「AIMINA」フリートライアルプラン受付中！ 20種類以上のAIを、今なら1か月間ご利用可能！試したかったAI開発を是非この機会に！

AIMINAのシステム構築について • システム設計コンセプト • 技術的チャレンジ

24 Challenges • ユーザの挙動 • 気軽に試してもらいたい • 使われ方が未知数 • ワークロードの違い
• 学習モデルによっては数分〜数日間 • 同じモデルでもデータ量に数分〜数日間 • 開発リソース • 人的リソースの制限や期間の制約 • AIモデル開発にフォーカスしたい

25 Serverless サーバーの存在を意識せずに構築・運用保守をすることなく、必要なリソースを動的に利用するクラウド・コンピューティングモデル

26 Serverless • サーバーの構築 • OSセットアップ、ネットワークの設定 • ランタイムやミドルウェアのセットアップ • サーバーの運用管理
• キャパシティ • スケーラビリティ • 耐障害性 • セキュリティパッチ • ビジネスの差別化に繋がらない機能 • 認証 • APIスロットリング Undifferentiated Heavy Lifting （ビジネス価値を産まない作業）

27 •開発効率の向上 •開発サイクルの高速化 •より本質的な機能に注力 Undifferentiated Heavy Lifting （ビジネス価値を産まない作業） • サーバーの構築
• OSセットアップ、ネットワークの設定 • ランタイムやミドルウェアのセットアップ • サーバーの運用管理 • キャパシティ • スケーラビリティ • 耐障害性 • セキュリティパッチ • ビジネスの差別化に繋がらない機能 • 認証 • APIスロットリング Serverless

全体構成図

全体構成図 (1) (2) (3)

30 学習・推論データのアップロード

31 SPA on s3/CloudFront • ウェブサーバーからの開放 API Gateway + Lambda
+ DynamoDB • 業務APIの高速開発 Cognito • 認証機構が不要 s3 presigned URL • ファイルのアップロードが簡単学習・推論データのアップロード

32 イベント駆動アンチウィルス＆キューイング

33 S3 events + Lambda • イベント駆動により常時起動のサーバーが不要 • 拡張性が容易 SQS
• 疎結合にし後続処理を分離 • 障害影響の分離 • 負荷の分散イベント駆動アンチウィルス＆キューイング

34 学習・推論のAI処理

35 さまざまなワークロード • AWS Batch（GPU job）で対応 • ECSに比べて抽象度が高い • キューに応じてスケーリング可能
課題 • AWS Batchの起動・停止オーバーヘッド • 今後はワークロードの差による効率化を検討 • Step Functionsによるワークフロー管理学習・推論のAI処理

36 Flexibility • さまざまなアクセスパターンに対応可能 Scalability • ワークロードやスケール処理のオフロード Agility • 開発サイクルの高速化・効率化
• サーバー構築・管理・運用コストの削減 Conclusions AIモデル開発にフォーカスできた

AIMINAのシステム構築について • Inf1インスタンスの導入検証

38 • AWS が設計開発した高機能の機械学習推論チップである AWS Inferentia チップを搭載 • neuronSDKの使用が必要
Inf1インスタンスとはインスタンスサイズ vCPU メモリ (GiB) インスタンスストレージ Inferentia チップ Inferentia チップ間相互接続ネットワーク帯域幅 (Gbps) EBS 帯域幅 (Gbps) オンデマンドの料金 1 年スタンダードリザーブドインスタンス 3 年スタンダードリザーブドインスタンス inf1.xlarge 4 8 EBS のみ 1 該当なし最大 25 最大 4.75 0.228 USD/時間 0.137 USD/時間 0.101 USD/時間 inf1.2xlarge 8 16 EBS のみ 1 該当なし最大 25 最大 4.75 0.362 USD/時間 0.217 USD/時間 0.161 USD/時間 inf1.6xlarge 24 48 EBS のみ 4 有 25 4.75 1.180 USD/時間 0.709 USD/時間 0.525 USD/時間 inf1.24xlarge 96 192 EBS のみ 16 有 100 19 4.721 USD/時間 2.835 USD/時間 2.099 USD/時間

全体構成図

40 学習・推論のAI処理

41 対応AIモデル一覧

42 Inferentia検証対応AIモデル一覧

43 ・想定用途：チャットボット、受付ボット・自然言語処理系・PyTorch + Bert (Transformer) + adamw 質問に対し、回答一覧候補から最適な回答を返却
モデル：質疑応答 (Question Answering)

44 Benchmark Baseline Instance type chip Inferrence time (s) Throughput
(q/s) Cost (usd/hr) m5a.2xlarge cpu 749.287 2.562 0.448 g4dn.2xlarge gpu 235.825 8.1416 1.015 ・推論データ量（質問数）：1920 ・回答候補数：63 ・推論回数（質問数 x 回答候補数）:120,960 モデル：質疑応答 (Question Answering)

45 Neuron SDKを組み込み、いざ、実行！モデル：質疑応答 (Question Answering)

46 いざ、実行！ Neuron SDKを組み込み、いざ、実行！エラー。。モデル：質疑応答 (Question Answering)

47 現在のNeuron SDKのMaxPool2Dでは 4Dのinput tensor以外は未実装。 AWSに相談し、以下で対応 tensor = tensor[None,:,:,:] tensor
= self.pooling(tensor) tensor = torch.squeeze(tensor, dim=0) ※今後、Neuron SDKのアップデートで改善予定とのフィードバックありモデル：質疑応答 (Question Answering)

48 inf1.xlarge initial performance Instance type chip Inferrence time (s)
Throughput (q/s) Cost (usd/hr) q/ 0.01usd m5a.2xlarge cpu 749.287 2.562 0.448 205.875 g4dn.2xlarge gpu 235.825 8.1416 1.015 288.744 Inf1.xlarge inf1 471.343 4.073 0.308 476.064 gpuより遅いけど、コスパは良い。。？モデル：質疑応答 (Question Answering)

49 inferentia chip 4 neuron cores/chip 全部活用出来てない？モデル：質疑応答 (Question Answering)

50 inf1.xlarge – neuron-top 1 coreしか使われてなかったモデル：質疑応答 (Question Answering)

51 複数coreをロードするように修正 for _ in range(INF_CHIP_NUM): model = torch.jit.load(“qa.pt”) models.append(model)
モデル：質疑応答 (Question Answering)

52 inf1.xlarge – neuron-top 改修後、全coreの活用モデル：質疑応答 (Question Answering)

53 inf1.xlarge performance パフォーマンス向上！コスト効率はcore数に比例 gpuと比較して・約2倍の高速化・3倍のコストダウン Instance type chip
cores Inferrence time (s) Throughput (q/s) Cost (usd/hr) q/ 0.01usd m5a.2xlarge cpu 749.287 2.562 0.448 205.875 g4dn.2xlarge gpu 235.825 8.141 1.015 288.744 Inf1.xlarge inf1 1 471.343 4.073 0.308 476.064 Inf1.xlarge inf1 4 119.958 16.005 0.308 1870.714 モデル：質疑応答 (Question Answering)

54 inf1.6xlarge 4 chips 改修前は1 coreのみだったモデル：質疑応答 (Question Answering)

55 inf1.6xlarge 4 chips x 4 cores 改修後、4chip x 4
coreのフル活用モデル：質疑応答 (Question Answering)

56 他のinf1 typeのベンチマーク比較表 Instance type chip Inferrence time (s) Throughput
(q/s) Cost (usd/hr) m5a.2xlarge cpu 749.287 2.562 0.448 g4dn.2xlarge gpu 235.825 8.1416 1.015 Inf1.xlarge inf1 471.343 4.073 0.308 Inf1.xlarge inf1 119.958 16.005 0.308 Inf1.2xlarge inf1 Inf1.2xlarge inf1 Inf1.6xlarge inf1 Inf1.6xlarge inf1 Instance type chip cores Inferrence time (s) Throughput (q/s) Cost (usd/hr) q/ 0.01usd m5a.2xlarge cpu 749.287 2.562 0.448 205.875 g4dn.2xlarge gpu 235.825 8.141 1.015 288.744 Inf1.xlarge inf1 1 471.343 4.073 0.308 476.064 Inf1.xlarge inf1 4 119.958 16.005 0.308 1870.714 Inf1.2xlarge inf1 1 471.343 4.057 0.489 298.674 Inf1.2xlarge inf1 4 119.487 16.068 0.489 1182.92 Inf1.6xlarge inf1 1 472.809 4.060 1.695 86.230 Inf1.6xlarge inf1 16 30.499 62.951 1.695 1337.012 モデル：質疑応答 (Question Answering)

57 他のinf1 typeのベンチマーク比較図モデル：質疑応答 (Question Answering)

58 Conclusion Performance & Cost • gpuと比較して、性能・コスト面において優秀 Ease of Implementation
• Neuron SDKの組み込み・検証で1週間ほど Future Expectations • 今後、他のモデルで展開していきたい • 推論のみならず、学習用のTraniumの活用も視野に入れ検証していきたい

ノーコードAI開発プラットフォーム「AIMINA」のシステム設計コンセプトと技術的チャレンジ

ノーコードAI開発プラットフォーム「AIMINA」のシステム設計コンセプトと技術的チャレンジ

More Decks by SoftBank Tech Night

Other Decks in Technology

Featured

Transcript