Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
TorchServeからFastAPIにした話
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
xthixsl_ml
December 11, 2025
34
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
TorchServeからFastAPIにした話
xthixsl_ml
December 11, 2025
More Decks by xthixsl_ml
See All by xthixsl_ml
制限付きRAGを試してみた
xthixsl_ml
0
28
MLモデル実装にStrategy パターンを導入してみた
xthixsl_ml
0
120
Vibe ML Model Training, Tracking and Kaizen
xthixsl_ml
0
47
Strands Agents Evals SDK 試してみた ~ Experiment Generator編 ~
xthixsl_ml
0
42
全部をAIエージェントにしない設計: AWS Step Functions × Amazon Bedrock AgentCore × Strands Agents Multiagent Graphで不確実性を考慮するワークフロー
xthixsl_ml
0
220
BentoML使ってみた
xthixsl_ml
0
64
社内AIハッカソンでAmazon Bedrock AgentCore 使ってみた
xthixsl_ml
2
230
新卒エンジニアが挑む、AWS Knowledge MCP Serverを活用したキャッチアップ術
xthixsl_ml
0
70
受託開発で直面するPoCからMLOpsへの壁とその乗り越え方
xthixsl_ml
2
410
Featured
See All Featured
A Soul's Torment
seathinner
6
2.9k
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.2k
How to build a perfect <img>
jonoalderson
1
5.6k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.4k
Become a Pro
speakerdeck
PRO
31
6k
Paper Plane (Part 1)
katiecoart
PRO
0
8.7k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.6k
Scaling GitHub
holman
464
140k
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
280
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
220
AI: The stuff that nobody shows you
jnunemaker
PRO
8
690
Transcript
©Fusic Co., Ltd. 0 TorchServeからFastAPIにした話 2025.12.12 佐藤 礼央奈 X: @xthixsl_ml
福岡Tech LT大忘年会
©Fusic Co., Ltd. 1 自己紹介 はじめに 佐藤 礼央奈 R E
O N A S AT O 株式会社Fusic エンジニア 東京の大学を卒業。在学中にエンジニアとして3社で約2年半の長期イン ターンを経験。機械学習や生成AIの研究開発に携わる中で、MLモデルの 本番運用に興味を持ちMLOpsに関心を深める。生成AIも取り入れた開発 や、AWSパートナー企業での経験から、同領域に強みを持つFusicに魅力 を感じ、2025年に新卒入社。
©Fusic Co., Ltd. 2 1. 背景 2. 対策
©Fusic Co., Ltd. 3 背景 1
©Fusic Co., Ltd. 4 1. 背景 サブタイトル SageMaker Docker Image
+ Endpoint NVIDIA NGC イメージ (nvcr.io) TorchServe がメンテ終了 & バージョン問題 FastAPI で自前実装 amd端末で推論コンテナ立ち上げ、追加でarm端末での 対応が必要に arm端末の制約、DLモデルの変更が発生、Pythonの バージョンをアップグレード 3.8から3.12へ Serve系のライブラリの検討 ※Serveとはモデルを推論APIとしてを提供することを指します
©Fusic Co., Ltd. 5 対策 2
©Fusic Co., Ltd. 6 2. 対策 サブタイトル • SageMakerのエンドポイント仕様に合わせている実装でした。 •
GET /ping - ヘルスチェック(コンテナが正常かどうか) • POST /invocations - 推論リクエストを受け付ける • Triton Inference Server → 高性能だが導入・運用が複雑 • BentoML → 便利だが追加の依存が増える • FastAPI → シンプル、依存が少ない → /ping と /invocations だけなら十分 TorchServe が Limited Maintenance になったので移行するサービングライブラリを検討した https://buildersbox.corp-sansan.com/entry/2025/03/26/100000 参照:
©Fusic Co., Ltd. 7 2. 対策 サブタイトル • SageMakerのエンドポイント仕様に合わせている実装でした。 •
GET /ping - ヘルスチェック(コンテナが正常かどうか) • POST /invocations - 推論リクエストを受け付ける • Triton Inference Server → 高性能だが導入・運用が複雑 • BentoML → 便利だが追加の依存が増える • FastAPI → シンプル、依存が少ない → /ping と /invocations だけなら十分 TorchServe が Limited Maintenance になったので移行するサービングライブラリを検討した https://buildersbox.corp-sansan.com/entry/2025/03/26/100000 参照: FastAPI 採用
©Fusic Co., Ltd. 8 Thank You We are Hiring! https://recruit.fusic.co.jp/
ご清聴いただきありがとうございました