Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
TorchServeからFastAPIにした話
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
xthixsl_ml
December 11, 2025
34
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
TorchServeからFastAPIにした話
xthixsl_ml
December 11, 2025
More Decks by xthixsl_ml
See All by xthixsl_ml
制限付きRAGを試してみた
xthixsl_ml
0
28
MLモデル実装にStrategy パターンを導入してみた
xthixsl_ml
0
120
Vibe ML Model Training, Tracking and Kaizen
xthixsl_ml
0
47
Strands Agents Evals SDK 試してみた ~ Experiment Generator編 ~
xthixsl_ml
0
42
全部をAIエージェントにしない設計: AWS Step Functions × Amazon Bedrock AgentCore × Strands Agents Multiagent Graphで不確実性を考慮するワークフロー
xthixsl_ml
0
220
BentoML使ってみた
xthixsl_ml
0
64
社内AIハッカソンでAmazon Bedrock AgentCore 使ってみた
xthixsl_ml
2
230
新卒エンジニアが挑む、AWS Knowledge MCP Serverを活用したキャッチアップ術
xthixsl_ml
0
70
受託開発で直面するPoCからMLOpsへの壁とその乗り越え方
xthixsl_ml
2
410
Featured
See All Featured
Designing for humans not robots
tammielis
254
26k
We Have a Design System, Now What?
morganepeng
55
8.2k
Reality Check: Gamification 10 Years Later
codingconduct
0
2.2k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
200
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
400
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
550
Context Engineering - Making Every Token Count
addyosmani
9
950
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
360
First, design no harm
axbom
PRO
2
1.2k
Chasing Engaging Ingredients in Design
codingconduct
0
210
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
Designing Powerful Visuals for Engaging Learning
tmiket
1
400
Transcript
©Fusic Co., Ltd. 0 TorchServeからFastAPIにした話 2025.12.12 佐藤 礼央奈 X: @xthixsl_ml
福岡Tech LT大忘年会
©Fusic Co., Ltd. 1 自己紹介 はじめに 佐藤 礼央奈 R E
O N A S AT O 株式会社Fusic エンジニア 東京の大学を卒業。在学中にエンジニアとして3社で約2年半の長期イン ターンを経験。機械学習や生成AIの研究開発に携わる中で、MLモデルの 本番運用に興味を持ちMLOpsに関心を深める。生成AIも取り入れた開発 や、AWSパートナー企業での経験から、同領域に強みを持つFusicに魅力 を感じ、2025年に新卒入社。
©Fusic Co., Ltd. 2 1. 背景 2. 対策
©Fusic Co., Ltd. 3 背景 1
©Fusic Co., Ltd. 4 1. 背景 サブタイトル SageMaker Docker Image
+ Endpoint NVIDIA NGC イメージ (nvcr.io) TorchServe がメンテ終了 & バージョン問題 FastAPI で自前実装 amd端末で推論コンテナ立ち上げ、追加でarm端末での 対応が必要に arm端末の制約、DLモデルの変更が発生、Pythonの バージョンをアップグレード 3.8から3.12へ Serve系のライブラリの検討 ※Serveとはモデルを推論APIとしてを提供することを指します
©Fusic Co., Ltd. 5 対策 2
©Fusic Co., Ltd. 6 2. 対策 サブタイトル • SageMakerのエンドポイント仕様に合わせている実装でした。 •
GET /ping - ヘルスチェック(コンテナが正常かどうか) • POST /invocations - 推論リクエストを受け付ける • Triton Inference Server → 高性能だが導入・運用が複雑 • BentoML → 便利だが追加の依存が増える • FastAPI → シンプル、依存が少ない → /ping と /invocations だけなら十分 TorchServe が Limited Maintenance になったので移行するサービングライブラリを検討した https://buildersbox.corp-sansan.com/entry/2025/03/26/100000 参照:
©Fusic Co., Ltd. 7 2. 対策 サブタイトル • SageMakerのエンドポイント仕様に合わせている実装でした。 •
GET /ping - ヘルスチェック(コンテナが正常かどうか) • POST /invocations - 推論リクエストを受け付ける • Triton Inference Server → 高性能だが導入・運用が複雑 • BentoML → 便利だが追加の依存が増える • FastAPI → シンプル、依存が少ない → /ping と /invocations だけなら十分 TorchServe が Limited Maintenance になったので移行するサービングライブラリを検討した https://buildersbox.corp-sansan.com/entry/2025/03/26/100000 参照: FastAPI 採用
©Fusic Co., Ltd. 8 Thank You We are Hiring! https://recruit.fusic.co.jp/
ご清聴いただきありがとうございました