RustとPyTorchで作る推論サーバー

by Yudai Hayashi

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

© 2024 Wantedly, Inc. INTERNAL ONLY PythonコミュニティーにとってのRust 色々なRustで書かれたライブラリやツールが広くPythonで使われるようになってきている https://github.com/pola-rs/polars https://docs.astral.sh/uv/ https://docs.astral.sh/ruff/ ● Polars ○ 構造化データを扱うためのライブラリ ● Ruﬀ ○ linter & code formatter ● uv ○ パッケージマネージャー Rustで書かれた高機能かつ高速なツールがどんどん登場している

Slide 5

Slide 5 text

© 2024 Wantedly, Inc. INTERNAL ONLY RustとPythonの親和性 RustとPythonは親和性が高い(と自分は思っている) PyO3を使ってpythonでも使えるようなバインディングを生成、 matrurinを使ってbuild→pypiにパブリッシュ… みたいなことが簡単にできる RustとPythonを使って機械学習モデルのサービングはどれくらい簡単にできるのだろう？

Slide 6

Slide 6 text

Slide 7

Slide 7 text

© 2024 Wantedly, Inc. INTERNAL ONLY 使うライブラリコードはREADMEから抜粋 ● tch-rsを使ってRust側からPyTorchのモデルを利用 ● PythonのPyTorchを似たような使用感 ● libtorchを入れてパスを通せば使えるようになる ○ 自分はDockerコンテナ内で “system-wide libtorch” を入れて動かしていたが、Python側で入れたPytorchを利用することもできるらしい

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

© 2024 Wantedly, Inc. INTERNAL ONLY 実験結果実行環境レスポンスタイム Rust (actix-web) 1.75 ms Python (FastAPI) 2.87 ms curl -w “${time_total} ...” で実行時間を計測 Rustのサーバーの方が40 %高速！ → 入力データの前処理の部分で差がついたと考えられるパフォーマンス感じた課題入力値の前処理では、ちゃんとした変換処理を書くにはPython側からパラメーターを伝搬させる方法を考える必要がありそう

Slide 11

Slide 11 text

© 2024 Wantedly, Inc. INTERNAL ONLY まとめ GitHub https://github.com/Hayashi-Yudai/rust-inference-server ● RustでPyTorchのモデルをロードして推論する方法を紹介 ● Rustで推論からレスポンスまで返すことで、Pythonで書いた時よりも40 %の性能改善を実現できる ● モデルに入力する前のデータの処理は、現状Rust側では実装コストが高い部分もありそう