Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LiteLLMことはじめ01:
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Takamasa Tsukui
January 29, 2026
Technology
7
0
Share
LiteLLMことはじめ01:
Takamasa Tsukui
January 29, 2026
More Decks by Takamasa Tsukui
See All by Takamasa Tsukui
数億imp/日 の行動ログ基盤へ Firehose動的パーティショニングを導入したお話
kkkdev
0
1.3k
DMMトラッキングの品質改善に向けての取り組み
kkkdev
0
860
DMMトラッキングの未来に向けての取り組み
kkkdev
0
230
Other Decks in Technology
See All in Technology
CloudSec JP #005 後締め ~ソフトウェアサプライチェーン攻撃から開発者のシークレットを守る~
lhazy
0
180
DevOpsDays2026 Tokyo Cross-border practices to connect "safety" and "DX" in healthcare
hokkai7go
0
130
シン・リスコフの置換原則 〜現代風に考えるSOLIDの原則〜
jinwatanabe
0
190
試されDATA SAPPORO [LT]Claude Codeで「ゆっくりデータ分析」
ishikawa_satoru
0
380
Code Interpreter で、AIに安全に コードを書かせる。
yokomachi
0
3.4k
Introduction to Sansan Meishi Maker Development Engineer
sansan33
PRO
0
380
建設的な現実逃避のしかた / How to practice constructive escapism
pauli
4
320
DIPS2.0データに基づく森林管理における無人航空機の利用状況
naokimuroki
1
200
BigQuery × dbtでコスト削減した話
rightcode
0
110
ストライクウィッチーズ2期6話のエイラの行動が許せないのでPjMの観点から何をすべきだったのかを考える
ichimichi
1
360
新メンバーのために、シニアエンジニアが環境を作る時代
puku0x
0
760
Zero-Downtime Migration: Moving a Massive, Historic iOS App from CocoaPods to SPM and Tuist without Stopping Feature Delivery
kagemiku
0
230
Featured
See All Featured
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
68
38k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
810
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.5k
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
130
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
1
180
How to Talk to Developers About Accessibility
jct
2
170
Believing is Seeing
oripsolob
1
110
The Curse of the Amulet
leimatthew05
1
11k
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
220
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.1k
Faster Mobile Websites
deanohume
310
31k
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
440
Transcript
LiteLLMことはじめ01: SDKとProxyの違いを理解し、実装コストを削減する
導入: LLM APIの乱立問題 (SDK Hell) 1 現状の課題 → "SDK Hell"(SDK地獄)により開発速度が低下
▪ SDKの断片化: OpenAI, Anthropic, Vertex AIなど、プロバ イダーごとにインターフェースが異なる。 ▪ スイッチングコスト: モデルを切り替える度にコードの書 き換えが発生。 ▪ 管理の複雑化: 複数のAPIキー、エラーハンドリングの実 装が分散。
LiteLLMとは? (解決策) 2 ユニバーサルアダプター 一言で表すと: 「100以上のLLMをOpenAIフォーマットで統一して呼べるI/F」 ▪ 統一規格: 入出力はすべてOpenAI互換。 ▪
多対応: Azure, Bedrock, Vertex AI, HuggingFaceなど主要 プロバイダーを網羅。 ▪ 軽量: 依存関係が少なく、既存プロジェクトに導入しやす い。 https://www.litellm.ai/ より
主要機能 1: 統一インターフェース (SDK) 3 コードの標準化 completion()関数一つで完結。モデル名の変更だけでプロバイ ダーを切り替え可能。 ▪ OpenAI形式の引数
(messages, model) ▪ OpenAI形式のレスポンスオブジェクト ▪ 環境変数でAPIキーを管理
主要機能 2: 信頼性の向上 (Reliability) 本番運用に不可欠な「落ちない仕組み」をSDKレベルで提供。 4 Fallbacks メインモデル(例: GPT-4)がダ ウンまたはレート制限にかかった
際、自動的にバックアップ(例: GPT-3.5, Claude)へ切り替え。 Retries 一時的なネットワークエラーや APIタイムアウト時に、設定した 回数だけ自動再試行を実施。 Load Balancing 複数のAPIキーやデプロイメント 間でリクエストを分散させ、ス ループットを最大化。
主要機能 3: LiteLLM Proxy Server 5 SDKから「Gateway」へ コードへの埋め込みではなく、独立したサーバーとして立ち上 げ、全てのLLMリクエストを一元管理。 ▪
一元管理: チーム全体のLLMアクセス窓口を統一。 ▪ 認証機能: 独自のVirtual Keysを発行・管理。 ▪ 予算管理: プロジェクト/ユーザー毎の予算上限設定。
可観測性 (Observability) 6 ブラックボックス化を防ぐ LLMアプリの入出力を可視化し、コストと品質をモニタリン グ。 ▪ 簡単連携: config.yamlに追記するだけで、Langfuse, Datadog,
Slackなどへログ送信。 ▪ コスト分析: 誰が、どのモデルを、どれくらい使ったかを 追跡。 ▪ デバッグ: 失敗したリクエストの詳細ログを確認可能。
Q & A ご清聴ありがとうございました。