RustとPyTorchで作る推論サーバー

© 2024 Wantedly, Inc. RustとPyTorchで作る推論サーバー UV Study: Rust LT会 Nov.
19 2024 - Yudai Hayashi

© 2024 Wantedly, Inc. INTERNAL ONLY 自己紹介林　悠大 • 経歴：
◦ 東京大学工学系研究科でPh.D取得 ◦ 2022年にウォンテッドリーにデータサイエンティストとして新卒入社。推薦システムの開発を行う • X: @python_walker • Rust初心者

© 2024 Wantedly, Inc. INTERNAL ONLY PythonコミュニティーにとってのRust 色々なRustで書かれたライブラリやツールが広くPythonで使われるようになってきている https://github.com/pola-rs/polars https://docs.astral.sh/uv/
https://docs.astral.sh/ruff/ • Polars ◦ 構造化データを扱うためのライブラリ • Ruﬀ ◦ linter & code formatter • uv ◦ パッケージマネージャー Rustで書かれた高機能かつ高速なツールがどんどん登場している

© 2024 Wantedly, Inc. INTERNAL ONLY RustとPythonの親和性 RustとPythonは親和性が高い(と自分は思っている) PyO3を使ってpythonでも使えるようなバインディングを生成、
matrurinを使ってbuild→pypiにパブリッシュ… みたいなことが簡単にできる RustとPythonを使って機械学習モデルのサービングはどれくらい簡単にできるのだろう？

© 2024 Wantedly, Inc. INTERNAL ONLY 作ったもの Request Response Data
Model file Train Model Serve Model モデルの学習はPython側で行い、モデルを使った推論をRustで行う構成

© 2024 Wantedly, Inc. INTERNAL ONLY 使うライブラリコードはREADMEから抜粋 • tch-rsを使ってRust側からPyTorchのモデルを利用
• PythonのPyTorchを似たような使用感 • libtorchを入れてパスを通せば使えるようになる ◦ 自分はDockerコンテナ内で “system-wide libtorch” を入れて動かしていたが、Python側で入れたPytorchを利用することもできるらしい

© 2024 Wantedly, Inc. INTERNAL ONLY 実験結果実行環境レスポンスタイム Rust
(actix-web) 1.75 ms Python (FastAPI) 2.87 ms curl -w “${time_total} ...” で実行時間を計測 Rustのサーバーの方が40 %高速！ → 入力データの前処理の部分で差がついたと考えられるパフォーマンス感じた課題入力値の前処理では、ちゃんとした変換処理を書くにはPython側からパラメーターを伝搬させる方法を考える必要がありそう

© 2024 Wantedly, Inc. INTERNAL ONLY まとめ GitHub https://github.com/Hayashi-Yudai/rust-inference-server •
RustでPyTorchのモデルをロードして推論する方法を紹介 • Rustで推論からレスポンスまで返すことで、Pythonで書いた時よりも40 %の性能改善を実現できる • モデルに入力する前のデータの処理は、現状Rust側では実装コストが高い部分もありそう

RustとPyTorchで作る推論サーバー

RustとPyTorchで作る推論サーバー

Yudai Hayashi

More Decks by Yudai Hayashi

Featured

Transcript

© 2024 Wantedly, Inc. RustとPyTorchで作る推論サーバー UV Study: Rust LT会 Nov.

© 2024 Wantedly, Inc. INTERNAL ONLY 自己紹介林　悠大 • 経歴：

© 2024 Wantedly, Inc. INTERNAL ONLY なぜデータサイエンティストがRustの話をする？

© 2024 Wantedly, Inc. INTERNAL ONLY PythonコミュニティーにとってのRust 色々なRustで書かれたライブラリやツールが広くPythonで使われるようになってきている https://github.com/pola-rs/polars https://docs.astral.sh/uv/

© 2024 Wantedly, Inc. INTERNAL ONLY RustとPythonの親和性 RustとPythonは親和性が高い(と自分は思っている) PyO3を使ってpythonでも使えるようなバインディングを生成、

© 2024 Wantedly, Inc. INTERNAL ONLY 作ったもの Request Response Data

© 2024 Wantedly, Inc. INTERNAL ONLY 使うライブラリコードはREADMEから抜粋 • tch-rsを使ってRust側からPyTorchのモデルを利用

© 2024 Wantedly, Inc. INTERNAL ONLY モデルの学習とtch-rsでの利用 Python側 Rust側学習したモデルはJITコ

© 2024 Wantedly, Inc. INTERNAL ONLY モデルの学習とtch-rsでの利用 Python側 Rust側学習したモデルはJIT

© 2024 Wantedly, Inc. INTERNAL ONLY 実験結果実行環境レスポンスタイム Rust

© 2024 Wantedly, Inc. INTERNAL ONLY まとめ GitHub https://github.com/Hayashi-Yudai/rust-inference-server •