SansanにおけるエッジAIの実用例とMLOps

SansanにおけるエッジAI の実⽤例とMLOps 第26回MLOps勉強会 Sansan 研究開発部 Architectグループ堤修一 @shu223

⾃⼰紹介堤修⼀ - 12年間iOSエンジニア（主にフリーランス） - ID: shu223 - GitHub・・・25.1k Stars
- Twitter, Qiita, Zenn, note, etc. - YouTube, Podcast - 著書：

⾃⼰紹介 - 2022年4月より、Sansan株式会社研究開発部マネージャー - 12年間iOSだけやってきたエンジニアのキャリアチェンジ - MLのプロではない＆
現職での現場経験なし

アジェンダ - SansanにおけるエッジAIの実例 - エッジAI × MLOps

SansanにおけるエッジAIの実例

- 名刺のデータ化 - NineOCR：名刺に特化した独自開発のOCRエンジン（記事） - Smart Captured（スマキャプ） - etc...
- 請求書・契約書etc.のデータ化 - 名刺同様に多々ある - メール署名取り込み - ニュース配信 - 名寄せ - etc... Sansan研究開発部におけるML

スマキャプについて 1/2 - 名刺データ化システム「GEES」は人力＋AI - 読み取り直後にデータ化できるわけではない

スマキャプについて 2/2 - モバイルアプリから直接 OCRサーバを叩いて結果を即時に返す - ユーザーはすぐに名刺の認識結果を確認できる -
GEESのデータ化が終わったら差分更新 - 速度と精度を両立

デモ ※動画内の名刺はダミー名刺です。

スマキャプの処理フロー - モバイル上で名刺の検出・切り取り - 名刺画像をサーバーに転送して OCR結果を受け取る

エッジ側のML処理は2段構成以下の推論処理をオンデバイスで実行 - Detection: 名刺矩形検出 - Segmentation: 名刺切り出し ※使用している名刺画像はダミー名刺です •
同時に4枚までの切り出しが可能 • プレビュー時はリアルタイムに名刺を検出 • 影や複雑背景等に対応

エッジ側のモデル - Detection: 名刺矩形検出 - SSD - Segmentation: 名刺切り出し -
U-Netベース - 一工夫して軽量化している - 両モデルともTensorFlowで学習

学習データの⼯夫軽量化の必要があるため、モデルの表現力はどうしても落ちてしまう ➔ エッジケースがどうしても弱い ➔ Data Augmentationのバリエーションで工夫

Core ML化によるパフォーマンス向上 - before: TensorFlowから出力したProtocol Buffers 形式のモデル（.pb） - after: Core
MLモデル（.mlmodel） ➔ 結果 - 名刺検出は300%高速化 - 3年前の端末で18 fps → 55 fps - セグメンテーションも推論時間は0.01～0.02[s]に

➔ UIの描画やユーザーインタラクションのレスポンスも改善 CPU負荷も激減旧モデル使⽤時新モデル（Core ML）使⽤時

機械学習モデルをアプリ（iOS, macOS, watchOS, …）に組み込むためのフレームワーク, モデルフォーマット Core MLとは Core ML
model Core ML Your app

デバイスの性能を最も活かせるのはCore ML - Tensor Flow for iOS → CPU・・・変換前バージョン -
Tensor Flow Lite → CPU, GPU - PyTorch Mobile / LibTorch → CPU - Core ML → CPU, GPU, Neural Engine なぜCore ML化すると速くなるのか

- ニューラルネットワークの演算を高速処理するプロセッサ - ANE (Apple Neural Engine) とも略される - NPU
(Neural Processing Unit) の一種 - GoogleのTPUみたいなもの Neural Engineとは

- 2017発売のiPhone 8, iPhone X以降のiPhone / iPadに搭載 - 搭載端末（非搭載端末）一覧 -
Core MLによって利用されるANEはA12 Bionic (2018) 以降 - ANE自体の性能も毎年上がっている > The A14 has a 16-core Neural Engine that is twice as fast as the previous generation, and can perform 11 trillion operations per second. > The A15 has a 16-core Neural Engine, with the same amount of cores it can perform 15.8 trillion operations per second (43% faster than the previous generation). Neural Engine搭載端末

Core ML化する⽅法 coremltoolsというApple製OSSツールを利用する - https://github.com/apple/coremltools - 変換がうまくいかない場合の考え方 - coremltoolsを用いたCore MLモデルへの変換
- Sansan Tech Blog

エッジAI × MLOps

※ - ここからは弊社での実運用の例ではなく、私個人のアイデアレベルのものになります。 - 実運用はしていないものの、一応実際に使ったことがある要素を組み合わせて考えています。 - 一部実現性不明なものはその旨明示しています。 -
Sansanで行っているMLOpsの例 - Data Version Control による実験管理の実務での適用事例 - 自社OCRエンジン「NineOCR」の学習効率化のためFeature Storeを導入した話 - Sansan Tech Blog

Core ML × MLOpsのアイデア - パターン1: Core ML × 実験管理
- パターン2: 実機での新モデルの検証 - テスターにだけ新モデルを配布する - クラウド経由でモデルを更新

評価 Core MLモデル変換パターン1: Core ML × 実験管理既存の学習パイプラインにcoremltoolsによる変換を組み込めばOK 前処理
学習 PyTorch, TensorFlow, etc… coremltools 詳しくはこちらの資料へ：MLOps for Core ML #iOSDC 2022 データ取得

パターン2: 実機での新モデルの検証検証⽤にテスターにだけ新モデルを配布する新モデル一般ユーザーには配布しないテスターだけに配布 Core ML model
本番アプリステージング版アプリ

クラウド（iCloud）経由でモデルを更新 ➔ アプリ側の更新不要でモデルを更新できる Core ML Model Deployment

ステージング用とリリース用で別々のModel Collectionを用意しておく事前準備（iCloud） FooModelCollectionStaging FooModel BarModel

- ステージング／リリースビルドで利用するModel Collectionを分けるよう実装 - 更新されたら通知が届くようにしておく - テスターにステージング版をTestFlightで配布事前準備（アプリ）

ステージング用のModel Collectionに新モデルを登録新モデル検証時 ➔ ステージング版アプリに通知が届く ➔ アプリを起動するとモデルが更新される FooModel.mlarchive FooModel

- 量子化やスパース化も可能 - https://apple.github.io/coremltools/source/coremltools.models.html#com pression-utils - アプリのバイナリには含めず、あとからダウンロードさせる方法もある - Core ML
Models - iCloud - Apple Developer - iOSビルトインの特徴抽出器を利用すれば劇的に小さくなる - Core MLモデルを連結してひとつのモデルにするパイプライン機能 - Create MLのモデルはなぜ小さいのか〜coremltoolsでパイプラインモデルの中身をのぞいてみる - Sound Analysisのビルトイン音声分類器補⾜資料： Core MLモデルサイズに関するTips

- 育児関連サービス：アルバムから子供が写っている写真だけを抽出 - 超解像ライブラリ - 動画へのエフェクト（姿勢検出、Style Transfer, …） - 動画の4コマ漫画化
- Core MLモデルへの変換（YOLOv5, etc.） - LiDARデータ収集（エッジAIではない） etc… 補⾜資料：経験したiOS × MLの実案件

- R&D MLOps/DevOpsエンジニア | Sansan株式会社 - R&D MLOps/DevOpsエンジニア(中部) |
Sansan株式会社 MLOpsエンジニア絶賛募集中です！

SansanにおけるエッジAIの実用例とMLOps

SansanにおけるエッジAIの実用例とMLOps

Sansan

More Decks by Sansan

Other Decks in Technology

Featured

Transcript

SansanにおけるエッジAI の実⽤例とMLOps 第26回MLOps勉強会 Sansan 研究開発部 Architectグループ堤修一 @shu223

⾃⼰紹介堤修⼀ - 12年間iOSエンジニア（主にフリーランス） - ID: shu223 - GitHub・・・25.1k Stars

⾃⼰紹介 - 2022年4月より、Sansan株式会社研究開発部マネージャー - 12年間iOSだけやってきたエンジニアのキャリアチェンジ - MLのプロではない＆

アジェンダ - SansanにおけるエッジAIの実例 - エッジAI × MLOps

SansanにおけるエッジAIの実例

- 名刺のデータ化 - NineOCR：名刺に特化した独自開発のOCRエンジン（記事） - Smart Captured（スマキャプ） - etc...

スマキャプについて 1/2 - 名刺データ化システム「GEES」は人力＋AI - 読み取り直後にデータ化できるわけではない

スマキャプについて 2/2 - モバイルアプリから直接 OCRサーバを叩いて結果を即時に返す - ユーザーはすぐに名刺の認識結果を確認できる -

デモ ※動画内の名刺はダミー名刺です。

スマキャプの処理フロー - モバイル上で名刺の検出・切り取り - 名刺画像をサーバーに転送して OCR結果を受け取る

エッジ側のML処理は2段構成以下の推論処理をオンデバイスで実行 - Detection: 名刺矩形検出 - Segmentation: 名刺切り出し ※使用している名刺画像はダミー名刺です •

エッジ側のモデル - Detection: 名刺矩形検出 - SSD - Segmentation: 名刺切り出し -

学習データの⼯夫軽量化の必要があるため、モデルの表現力はどうしても落ちてしまう ➔ エッジケースがどうしても弱い ➔ Data Augmentationのバリエーションで工夫

Core ML化によるパフォーマンス向上 - before: TensorFlowから出力したProtocol Buffers 形式のモデル（.pb） - after: Core

➔ UIの描画やユーザーインタラクションのレスポンスも改善 CPU負荷も激減旧モデル使⽤時新モデル（Core ML）使⽤時

機械学習モデルをアプリ（iOS, macOS, watchOS, …）に組み込むためのフレームワーク, モデルフォーマット Core MLとは Core ML

デバイスの性能を最も活かせるのはCore ML - Tensor Flow for iOS → CPU・・・変換前バージョン -

- ニューラルネットワークの演算を高速処理するプロセッサ - ANE (Apple Neural Engine) とも略される - NPU

- 2017発売のiPhone 8, iPhone X以降のiPhone / iPadに搭載 - 搭載端末（非搭載端末）一覧 -

Core ML化する⽅法 coremltoolsというApple製OSSツールを利用する - https://github.com/apple/coremltools - 変換がうまくいかない場合の考え方 - coremltoolsを用いたCore MLモデルへの変換

エッジAI × MLOps

Core ML × MLOpsのアイデア - パターン1: Core ML × 実験管理

評価 Core MLモデル変換パターン1: Core ML × 実験管理既存の学習パイプラインにcoremltoolsによる変換を組み込めばOK 前処理

パターン2: 実機での新モデルの検証検証⽤にテスターにだけ新モデルを配布する新モデル一般ユーザーには配布しないテスターだけに配布 Core ML model

クラウド（iCloud）経由でモデルを更新 ➔ アプリ側の更新不要でモデルを更新できる Core ML Model Deployment

ステージング用とリリース用で別々のModel Collectionを用意しておく事前準備（iCloud） FooModelCollectionStaging FooModel BarModel

- ステージング／リリースビルドで利用するModel Collectionを分けるよう実装 - 更新されたら通知が届くようにしておく - テスターにステージング版をTestFlightで配布事前準備（アプリ）

ステージング用のModel Collectionに新モデルを登録新モデル検証時 ➔ ステージング版アプリに通知が届く ➔ アプリを起動するとモデルが更新される FooModel.mlarchive FooModel

- 量子化やスパース化も可能 - https://apple.github.io/coremltools/source/coremltools.models.html#com pression-utils - アプリのバイナリには含めず、あとからダウンロードさせる方法もある - Core ML

- 育児関連サービス：アルバムから子供が写っている写真だけを抽出 - 超解像ライブラリ - 動画へのエフェクト（姿勢検出、Style Transfer, …） - 動画の4コマ漫画化

- R&D MLOps/DevOpsエンジニア | Sansan株式会社 - R&D MLOps/DevOpsエンジニア(中部) |