Mercar Gears MercariにおけるEdgeAIについて

メルカリにおけるEdgeAIの活用 @y-oshima

2 多くの機能をリリース • 検索の改善 • 画像検索 • 違反出品検知 • AI出品
• レコメンデーション Mercariにおける機械学習の取り組み機械学習プラットフォーム

3 EdgeAI モバイルのようなデバイス上で機械学習の推論を行う技術

5 Agenda • なぜEdgeAIが必要なのか • EdgeAIを用いた機能の開発 • EdgeAIを支える技術 • EdgeAIを支える技術を支える基盤

6 なぜEdgeAIが必要なのか

7 売れるかチェックアイテムを撮影すると • 売れている価格平均 • 売り切れ率がわかる UXを改善し利用率を上げたい

8 利用率を向上のために結果表示タップ領域検出写真撮影カメラ画面売れるかチェックのステップ

9 利用率を向上のために結果表示タップ物体認識写真撮影カメラ画面各ステップの遷移率をログから集計ここでやめてしまうお客様が多い写真の撮影は想定以上にハードルが高いのでは？
写真撮影のステップをなくせないか

10 「かざす」UI スニーカー〇〇円

11 • 応答性 ◦ 素早く結果を返せるか • 連続性 ◦ 状態の遷移が連続的か •
フィードバック ◦ アクションの結果が伝わるか • 柔軟性 ◦ 変更を加えるのが容易か UIの評価指標 [Aagesen, P. T., & Heyer, C. 2016]

12 応答性結果表示タップ領域検出写真撮影カメラ画面 1秒 1秒

13 応答性スニーカー〇〇円かざした瞬間結果が出る応答性高

14 連続性結果表示タップ領域検出写真撮影カメラ画面画面遷移画面遷移

15 連続性スニーカー〇〇円物体検出や結果表示に画面遷移がない連続性高

16 フィードバック結果表示タップ領域検出写真撮影カメラ画面画面遷移の後でしかフィードバックが得られない

17 フィードバックスニーカー〇〇円注目されたアイテムや結果が即座にわかるフィードバック高

18 柔軟性結果表示タップ領域検出写真撮影カメラ画面写真の修正は撮影のやり直し

19 柔軟性サングラス △△円カメラを動かすだけで別のアイテムに移る柔軟性高

20 「かざす」UI実現の課題 ② 物体検出や画像検索 ① 写真を送信 ③ 結果を返すサーバで推論を行う場合全体で１sec程度
ネットワークの影響を受ける

21 「かざす」UI実現の課題サーバで推論を行う場合滑らかな体験を実現するためには 100 msec 未満が理想 [Card, S. K.,
Robertson, G. G., & Mackinlay, J. D. (1991, March)] サーバでの推論では間に合わない

22 Edge AI 1 sec 〜〜 50ms • 100ms未満を実現可能
• ネット環境の影響がない

23 なぜEdgeAIが必要なのか　まとめ • EdgeAI ◦ モバイルなどの上で機械学習の推論を行う技術 • EdgeAIによってレイテンシを大幅に小さくできる • インタラクティブなUXを実現できる

24 EdgeAIを用いた機能の開発

25 売れるかチェックの仕組み画像検索物体検出画像送信写真撮影結果表示検出結果確認

26 「かざす」UI実現のために画像検索物体検出カメラ起動結果表示

27 「かざす」UI実現のために画像検索物体検出カメラ起動結果表示 MLモデルを端末上で推論

28 Core ML モバイル上でのML推論用ライブラリ

29 Core ML • マルチプラットフォーム • 柔軟なランタイムオプション TensorFlow Lite を採用
モバイル上でのML推論用ライブラリ

30 EdgeAIにおけるMLモデル • 学習データの作成 • MLモデルの学習 MLモデルの変換数百MB~数GB 変換されたMLモデルを実行 10
MB 程度

31 動画上での推論動画入力結果表示推論毎フレーム繰り返される前処理うまく制御しないとだんだん動画が遅れたりする

32 Mediapipe Google製のOSS 動画などストリーミングメディアでのML推論用ライブラリ

33 ストリーミングでの推論各処理をノードとしたパイプラインを構築ノードレベルで並列化が可能

34 動画上での推論動画入力結果表示推論前処理 N フレーム目 N+1 フレーム目

35 UI上の工夫 AI/MLは間違う • なぜこの値段なのか • 想像している値段と大きな差がある XXX円で売れます！かざすUIでは表示領域が狭いので注意が必要

36 スニーカー売れている価格 XXX ~ △△△ 円 Nike エアマックス UI上の工夫
AIが間違ったときに納得できるように認識結果の情報を提示することで間違っていた場合に納得感がある* 売れている価格の範囲であり絶対の価格と思わせない * [J. Zhou et al. 2019] https://pair.withgoogle.com/

37 • MLモデルの推論 • ストリーミング処理 • お客様を混乱させないUI設計 EdgeAIを用いた機能の開発　まとめ TensorFlowLite Mediapipe

38 EdgeAIを支える技術

39 「かざす」UI実現のために画像検索物体検出カメラ起動結果表示

40 「かざす」UI実現のために画像検索物体検出カメラ起動結果表示目標：100ms以内で推論

41 Edgeデバイス上でのモデル実行オブジェクト検出モデル例：SSDlite-mobilenetv2 前処理等も含むと不十分 device CPU Pixel3 120 msec
Pixel4 90 msec

42 Java API Objective C API Core C Library Delegate
GPU CPU CoreML NNAPI TensorFlow Liteのアーキテクチャ

43 • GPU ◦ iOS, Android両方をサポート • XNNPack ◦ iOS,
Android両方：特定の行列演算をCPU上で高速化 • NNAPI ◦ Android向け：Pixel4ではEdgeTPUを利用できる • CoreML ◦ iOS向け：iPhone 11ではNPUが利用可能 TFLite でサポートされる Delegate

44 Edgeデバイス上でのモデル実行オブジェクト検出モデル例：SSDlite-mobilenetv2 device CPU GPU Pixel3 120 msec
30 msec Pixel4 90 msec 13 msec

45 MediaPipeの公式サンプル https://google.github.io/mediapipe/solutions/box_tracking.html BoxTracking

46 BoxTrackingのパイプライン

47 BoxTrackingのパイプライン検出されたオブジェクトをカメラの移動方向から以前のフレームのオブジェクトと紐付けるフレームをまたいでオブジェクトを追跡できる

48 出口に近いほど高優先度パイプライン優先度

49 検出が終わるまで入力を待つ検出が途切れてもなめらかな出力滑らかな表示の工夫

50 類似カテゴリでも価格や売れやすさは違う日々新しい商品が追加される静的な分類器や端末上にIndexを持つことが困難サーバ上で画像検索を行う必要があるメルカリでの問題：巨大かつ複雑な商品カテゴリ

51 アイテムを検出したタイミングで切り出してサーバに送る • 予期しない画像をサーバに送る可能性 • 画像のアップロードに時間がかかる類似商品の検索

52 サーバ上の画像検索を使う懸念点 • 予期しない画像をサーバに送る可能性 • 画像のアップロードに時間がかかる 01110 11010 101.. 端末上で特徴量化して送信
画像は復元できない転送サイズ大幅削減数百KB → 数KB 類似商品の検索

53 GPU CPU or NPU/TPU パイプラインの最適化

54 Before After

55 • Delegateによる推論の高速化 • 端末上で特徴量化まで行うことで ◦ プライバシーに配慮 ◦ 低レイテンシなサーバ呼び出し EdgeAIを支える技術まとめ

56 EdgeAIを支える技術を支える基盤

57 オブジェクト認識に使われるモデル • SSD-Mobilenetv2 [Sandler, Mark, et al. 2018] •
SSD-Mobilenetv3-small [Howard, Andrew, et al. 2019] • SSD-MobileDet [Xiong, Yunyang, et al. 2020] EdgeにおけるMLモデルの選定精度だけでは決められない

58 • モデルアーキテクチャ • 変換オプション • Delegation • デバイス EdgeにおけるMLモデルで意識すべきこと

60 EdgeAIにおけるMLモデル • 学習データの作成 • MLモデルの学習 MLモデルの変換数百MB~数GB 変換されたMLモデルを実行 10
MB 程度

61 • FLOAT32 ◦ サーバでモデルを学習・推論するときと同じ • FLOAT16 ◦ 重みを単精度で表現することで軽量化 •
Weight only quantization (UINT8) ◦ 重みをUINT8量子化 • Full quantization (UINT8) ◦ 重みと活性化関数を量子化 TF Liteの変換オプション

62 変換オプションサイズレイテンシ精度劣化 FLOAT32 ✕ △ なし FLOAT16
△ △ 小 UINT8: weight only quant ◎ △ 中 UINT8: full quant ◯ ◎ 大 ※劣化の可能性が高い変換オプションによる比較 ※

64 Delegateオプションと実行デバイス Delegate • CPU • GPU • XNNPACK •
NNAPI • CoreML iOS Android デバイスごとにCPU, GPUの性能は異なる [Wu, C. J., et. al. 2019]

65 EdgeにおけるMLモデルの選定変換形式 Delegate デバイスモデル

66 EdgeにおけるMLモデルの選定変換形式 Delegate デバイスモデル自動化！

67 Edgeモデル検証用プラットフォーム

69 Kubernetes上にML基盤を構築するプロジェクト複数のコンポーネントを持つ • Kubeﬂow pipeline ◦ 機械学習モデルの学習や評価のパイプラインの管理 • Kubeﬂow
metadata ◦ 機械学習モデルのメタデータ管理

71 モデルの学習モデルの評価 metadata保存モデルの変換ベンチマーク実行ベンチマークを metadataに保存

73 精度比較と変換による劣化の検証モデルA モデルB ﬂoat16 ﬂoat32 uint8

74 デバイスごとのベンチマーク iPhone 11 iPhone 8 CoreML GPU CPU XNNPack

76 メルカリのEdgeAIの取り組み UX設計 • EdgeAIでインタラクティブなUXを実現 • お客様を混乱させないUI設計クライアントサイド • どこまでをクライアントサイドで行えるかの設計
• ms単位の最適化バックエンド • 広範なデバイスをサポートするためのプラットフォーム

77 今回お話できなかったこと • KPI設計とリリース後の監視・改善 • クライアントサイドのモデル更新

Mercar Gears MercariにおけるEdgeAIについて

Mercar Gears MercariにおけるEdgeAIについて

More Decks by oshima

Other Decks in Technology

Featured

Transcript