機械学習をアプリケーションに組み込む様子を見てみよう / Let's see how machine learning is integrated into an application

機械学習をアプリケーションに組み込む様子を見てみよう

自己紹介 ➢ 名前：大嶋勇樹 ➢ サーバサイド・インフラ中心のエンジニア ◦ Java、AWS、GCP、Docker、Kubernetes、etc… ➢ データ分析・機械学習関連の業務経験 ◦
AWS 環境でのデータ分析基盤の構築 ◦ Docker、Kubernetes などを活用した機械学習アプリケーションの基盤構築 ➢ 最近の興味 ◦ MLOps、Linux、電子工作、VR ➢ Twitter：@oshima_123

今日のテーマ “ ” 機械学習をアプリケーションに組み込む様子を見てみよう一方で、実際のアプリケーションに組み込むのに手こずっている例も少なくない機械学習は一般に認知されるようになり、 R&D 的にデータサイエンティストが試行錯誤する段階の取り組みはかなり増えている

難しい理由の 1 つ機械学習の知識と、アプリケーション開発の知識の壁データサイエンティストや PM・PdM といったポジションの方には、アプリケーション開発の知見がない場合も少なくない機械学習の知識とアプリケーション開発の知識は全然異なる

そこで今日は機械学習については前提知識のある「データサイエンティスト」「PM」「PdM」といった方を主な対象者として、機械学習を実際にアプリケーションに組み込む例をお見せしつつ、登場する技術要素を解説していきます今日の目標 • 機械学習をアプリケーションに組み込むイメージが、なんとなくつかめる •
実際に自分で構築するためには、どんなことを勉強する必要がありそうか分かる

アジェンダ • Web アプリケーションの基本 • MNIST を使ったサンプルアプリケーションの紹介と、構成の概要解説 • デモンストレーションと、ソースコードの解説 •
より本格的な構成について ※ 合計 1 時間程度の予定です

Web アプリケーションの基本

Web アプリケーションの前に... • 世の中には、様々な「アプリケーション」がある ◦ Web アプリケーション ◦ モバイルアプリケーション ◦
デスクトップアプリケーション ◦ 組み込み ◦ ゲーム ◦ etc… 今回は最近 IT エンジニアが入門として学ぶケースが多い、「Web アプリケーション」を題材にします

「Web アプリケーション」とは • Wikipedia によると... ◦ > ウェブアプリケーション（Web application）は、ウェブ（World Wide
Web）技術を基盤としたアプリケーションソフトウェアである。 • 例えば ◦ 検索エンジン ◦ EC サイト ◦ SNS ◦ ブログ ◦ etc… • ざっくり言えば、Web ブラウザで利用できるサービス全般が「Web アプリケーション」 https://www.google.com https://www.amazon.com https://twitter.com/os1ma https://hatenablog.com/ 出展「ウェブアプリケーション - Wikipedia」（2021 年 12 月 17 日） https://ja.wikipedia.org/wiki/%E3%82%A6%E3%82%A7%E3%83%96%E3%82%A2%E3%83%97%E3 %83%AA%E3%82%B1%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3

「Web アプリケーション」と「静的サイト」の違い • 静的サイト ◦ 固定のデータで実現されているサイト ◦ 例 ▪ コーポレートサイト
◦ 登場する技術要素 ▪ HTML、CSS、JavaScript ▪ Web サーバ • Web アプリケーション ◦ ユーザの入力や DB のデータに応じて、プログラムが HTML を動的に組み立てたりする ◦ 例 ▪ 検索エンジン、EC サイト、SNS、ブログ ◦ 静的サイトの要素に加えて登場する技術要素 ▪ アプリケーションサーバ・各種言語のプログラム ▪ DB Web ブラウザ Web サーバアプリケーションサーバ DB HTML JavaScript プログラム CSS Web ブラウザ Web サーバ HTML JavaScript CSS ※ 実際にはもっと多数の方式があり、登場する技術要素も様々

MNIST を使ったサンプルアプリケーションの紹介と構成の概要解説

MNIST を使ったサンプルアプリケーション • 機能 ◦ MNIST で学習したモデルに対して、自分が手書きした文字で推論を試すことができる ◦ 書いた文字は履歴として保存され、モデルを更新した際は、新しいモデルで推論し直すことができる（あとで詳しく説明します）

推論の様子 • 0 〜 9 まで推論を試してみる • 実際に手書きした文字に対して、最も確率が高い値はどれか、履歴が保存されていく ※ 最初のモデルでは、あえて精度が低くなるようになっています

構成の全体像アプリケーション部分学習部分 Web ブラウザ Web サーバ (nginx) アプリケーションサーバ (Uvicorn
+ Gunicorn + FastAPI) DB (MySQL) HTML JavaScript Python MLflow UI PyTorch ./mlruns ONNX ./images FastAPI コンテナイメージ • 簡易的な構成にするため、1 台のマシン上でこれらをそれぞれ Docker コンテナとして実行するようにしています ONNX ONNX

デモンストレーションとソースコードの解説

学習部分について • PyTorch ◦ ディープラーニングのフレームワーク ◦ 今回はシンプルなネットワークを使用 • MLflow ◦
実験管理ツール ◦ どんなパラメータでどんな結果だったかなどを管理するために使用 ◦ Web の UI から様々な操作が可能 • ONNX ◦ 機械学習モデルの形式 ◦ PyTorch のモデルは最終的に ONNX 形式で MLflow 管理下のディレクトリに保存学習部分 MLflow UI PyTorch ./mlruns ONNX self.linear_relu_stack = nn.Sequential( nn.Linear(n_input, n_hidden), nn.ReLU(), nn.Linear(n_hidden, n_output), )

学習の様子 • n_hidden = 10、n_hidden = 128 など、値を変えて実行 $ make
train_gpu : 2021-12-22 08:13:44,860 - INFO - model = MNISTModel( (linear_relu_stack): Sequential( (0): Linear(in_features=784, out_features=10, bias=True) (1): ReLU() (2): Linear(in_features=10, out_features=10, bias=True) ) ) 100%|████████████████████████████████████████████████| 938/938 [00:07<00:00, 119.43it/s] 2021-12-22 08:13:52,718 - INFO - Epoch [1/5] train loss: 0.64784, acc: 0.80790 2021-12-22 08:13:53,915 - INFO - Epoch [1/5] valid loss: 0.38300, acc: 0.89070 100%|████████████████████████████████████████████████| 938/938 [00:07<00:00, 118.71it/s] 2021-12-22 08:14:01,819 - INFO - Epoch [2/5] train loss: 0.37280, acc: 0.89393 2021-12-22 08:14:03,024 - INFO - Epoch [2/5] valid loss: 0.35724, acc: 0.89690 100%|████████████████████████████████████████████████| 938/938 [00:07<00:00, 119.12it/s] 2021-12-22 08:14:10,901 - INFO - Epoch [3/5] train loss: 0.34369, acc: 0.90180 2021-12-22 08:14:12,099 - INFO - Epoch [3/5] valid loss: 0.33862, acc: 0.90290 100%|████████████████████████████████████████████████| 938/938 [00:07<00:00, 118.21it/s] 2021-12-22 08:14:20,037 - INFO - Epoch [4/5] train loss: 0.32955, acc: 0.90513 2021-12-22 08:14:21,240 - INFO - Epoch [4/5] valid loss: 0.33413, acc: 0.90330 100%|████████████████████████████████████████████████| 938/938 [00:07<00:00, 119.53it/s] 2021-12-22 08:14:29,090 - INFO - Epoch [5/5] train loss: 0.31951, acc: 0.90883 2021-12-22 08:14:30,267 - INFO - Epoch [5/5] valid loss: 0.31779, acc: 0.91120 2021-12-22 08:14:30,268 - INFO - export onnx model :

実験管理の様子 • MLflow を使うことで、学習のパラメータやメトリクス、アーティファクトを簡単に管理できる • どんなパラメータだと精度が高かったかなどを、後から見直したり再現したりしやすい def main(): with mlflow.start_run():
mlflow.log_artifact('./src/') seed = 123 mlflow.log_param('seed', seed) : : torch.onnx.export(net, dummy_input, MODEL_OUTPUT_FILE, verbose=True, input_names=['input'], output_names=['output']) mlflow.log_artifact(MODEL_OUTPUT_FILE)

アプリケーションの構成 • Web サーバ + アプリケーションサーバ + DB という典型的な構成 •
Web サーバ ◦ HTML、JavaScript という静的（固定の）コンテンツをブラウザに返す • アプリケーションサーバ ◦ ブラウザ上で実行される JavaScript からのリクエストに応じて、 ◦ 推論の実行や履歴の DB への読み書きといった処理を実行するアプリケーション部分 Web サーバ (nginx) アプリケーションサーバ (Uvicorn + Gunicorn + FastAPI) DB (MySQL) HTML JavaScript ./images Web ブラウザ Python ONNX

HTML、JavaScript のソースコード（抜粋） • 推論のボタンが押されたら、通信して Python の Web API を呼び出している document.querySelector('#submit-button')
.addEventListener('click', async () => { : const headers = { 'content-type': 'multipart/form-data' } const data = new FormData() data.append('image', blob, 'number.png') const response = await axios.post('/api/predictions', data, headers) : <button id="submit-button">推論実行</button>

Python のソースコード（抜粋） • model.onnx というモデルのファイルを読み込み、推論を実行している @router.post('/api/predictions') async def post_predict(image: UploadFile
= File(...)): : # predict result = predictor.predict(resized) : def predict(resized_image): input = _preprocess(resized_image) # predict onnx_session = onnxruntime.InferenceSession(MODEL_FILE) input_name = onnx_session.get_inputs()[0].name output = onnx_session.run(None, {input_name: input}) # 確率に変換 return softmax(output[0]).tolist() MODEL_FILE = '/model.onnx'

状況の整理アプリケーション部分学習部分 Web ブラウザ Web サーバ (nginx) アプリケーションサーバ (Uvicorn
+ Gunicorn + FastAPI) DB (MySQL) HTML JavaScript MLflow UI PyTorch ./mlruns ONNX ./images Python ONNX PyTorch が出力したモデルのファイルをコピーして、FastAPI のアプリケーションで推論に使っている

モデルの改善 • 最初にアプリケーションに組み込んだモデルを使い続けたいとは限らない ◦ 後日より良いモデルを作ることができた場合、そちらに変更したくなる ◦ 現実では、入力データが変化することで、モデルの精度が下がっていくことがある（データドリフト） • モデルの更新の流れの自動化 ◦
新しくこのモデルを使うと決めたあと、手動で ONNX ファイルをコピーする運用では、操作ミスしやすく、システム障害などに繋がりやすい ◦ モデルをアプリケーションに反映する流れを自動化することで、操作ミスを防ぐことができ、アプリケーションの改善も高速化できる

新しいモデルをアプリケーションに反映する流れ • 今回の例では、アプリケーションや関連ファイルをまとめて持ち運ぶためによく利用される、「Docker」というツールを採用しているアプリケーションサーバ (Uvicorn + Gunicorn + FastAPI)
./mlruns ONNX FastAPI コンテナイメージ Python ONNX ONNX ビルド処理指定したモデルのファイルを含む Docker の「コンテナイメージ」という、持ち運びやすい形式のデータに変換デプロイ処理ビルド処理で作成した Docker の「コンテナイメージ」をもとに、新しいモデルを含むアプリケーションを起動

ビルド・デプロイの様子 • ビルド • デプロイ $ make deploy_api RUN_ID=99f9d77426de474aa112471e92d71d34 API_DOCKER_TAG="99f9d77426de474aa112471e92d71d34"
docker-compose up --no-deps -d api Recreating mnist-app_api_1 ... done $ make build_api RUN_ID=99f9d77426de474aa112471e92d71d34 : Building api Sending build context to Docker daemon 2.58MB Step 1/6 : FROM tiangolo/uvicorn-gunicorn-fastapi:python3.8-slim ---> 24a351926e6f : Successfully built 9c7ef746e31e Successfully tagged mnist-mlops-app_api:99f9d77426de474aa112471e92d71d34

推論の精度が改善された様子 • モデルを変更したことで、手書き文字に対する推論精度が向上した様子を見ることができる

構成の全体像（再掲）アプリケーション部分学習部分 Web ブラウザ Web サーバ (nginx) アプリケーションサーバ (Uvicorn
+ Gunicorn + FastAPI) DB (MySQL) HTML JavaScript MLflow UI PyTorch ./mlruns ONNX ./images FastAPI コンテナイメージ • 簡易的な構成にするため、これらを 1 台のマシン上でそれぞれ Docker コンテナとして実行するようにしています Python ONNX ONNX

より本格的な構成について

学習環境と稼働環境の分離 • 今回は 1 台のマシンで各要素を動かしてみたが、実際には実験環境とアプリケーションの実行環境を分けたりする • 本番環境以外にも、テスト環境・ステージング環境など、様々な環境を作ったりもする実験環境アプリケーション
本番環境実験環境アプリケーションテスト環境アプリケーション本番環境アプリケーションステージング環境

データの収集や、データ基盤の構築 • 独自のデータを使う場合は、データの収集やデータレイクなど構築も必要 • キーワード ◦ データレイク ◦ ETL ◦
DVC ◦ 特徴量ストア ◦ データパイプライン出典：https://aws.amazon.com/jp/big-data/datalakes-and-analytics/what-is-a-data-lake/

機械学習のコード以外にも、必要な要素はたくさんある出典「Hidden Technical Debt in Machine Learning Systems」 https://proceedings.neurips.cc/paper/2015/file/86df7dcfd896fcaf2674f757a2463eba-Paper.pdf

MLOps • 「MLOps 」の定義は色々ありますが、ここでは GCP のドキュメントでの解説を引用します • > MLOps は、ML
システム開発（Dev ）と ML システムオペレーション（Ops ）の統合を目的とする ML エンジニアリングの文化と手法です • > MLOps を実践すると、統合、テスト、リリース、デプロイ、インフラストラクチャ管理など、ML システム構築のすべてのステップで自動化とモニタリングを推進できます GCP のドキュメントより引用 https://cloud.google.com/architecture/mlops-continuous-deliver y-and-automation-pipelines-in-machine-learning?hl=ja 出典：https://ml-ops.org/content/mlops-principles

MLOps のプラクティスの例 • 実験管理 ◦ 実行したコードやパラメータ、モデル、評価などを保存して再現可能にする • 各種バージョン管理 ◦
DVC によるデータのバージョン管理や、作成したモデルのバージョン管理を行う • テスト ◦ モデルが性能を満たすかなどをテスト • サービング ◦ ONNX Runtime や Tensorflow Serving などにより、モデルを本番環境にシームレスにデプロイする • リリース ◦ カナリアリリースなどの手法で、本番トラフィックでもモデルをテストする • ワークフロー管理 ◦ データ取得・前処理・学習・評価・デプロイのワークフローを自動化する出典：https://martinfowler.com/articles/cd4ml.html

まとめ

まとめ • 機械学習をアプリケーションに組み込むイメージがつけられるよう、MNIST を使ったサンプルアプリケーションでデモンストレーションしてみた • より本格的な構成として紹介した要素は、必ずしも全てをしっかり実施する必要はないが、高品質なアプリケーションを改良し続けるには、そのような考慮が必要になってくるまずは実際にこのくらいのアプリケーションを作ってみるとアプリケーション開発に登場する要素の理解も進むので、とてもおすすめです

機械学習をアプリケーションに組み込む様子を見てみよう

機械学習をアプリケーションに組み込む様子を見てみよう / Let's see how mach...

機械学習をアプリケーションに組み込む様子を見てみよう / Let's see how machine learning is integrated into an application

os1ma

More Decks by os1ma

Featured

Transcript