Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LiteLLMことはじめ01:
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Takamasa Tsukui
January 29, 2026
Technology
9
0
Share
LiteLLMことはじめ01:
Takamasa Tsukui
January 29, 2026
More Decks by Takamasa Tsukui
See All by Takamasa Tsukui
数億imp/日 の行動ログ基盤へ Firehose動的パーティショニングを導入したお話
kkkdev
0
1.3k
DMMトラッキングの品質改善に向けての取り組み
kkkdev
0
860
DMMトラッキングの未来に向けての取り組み
kkkdev
0
230
Other Decks in Technology
See All in Technology
コーポレートサイトのアクセシビリティ改善とJIS準拠への実践
lycorptech_jp
PRO
2
120
TypeScript の型で副作用の実行順序を制御する
yanaemon
2
160
TSKaigi 2026 - Auth.jsからBetter Authへの 移行に見る「型とランタイム」の 設計思想の変化
teamlab
PRO
1
150
Geek Woman の育ち方 〜コミュニティとAIと〜
chicaco
0
310
GCASアップデート(202603-202605)
techniczna
0
270
最新技術を"今は選ばない"という技術選定
leveragestech
PRO
0
380
TypeScriptで実現する既存APIを活用したリモートMCPサーバー構築 / TSKaigi 2026
soarteclab
1
210
【禁断】Obsidianの第二の脳に「知の巨人」と呼ばれた師匠の脳をロードしてみた
nagatsu
0
4.7k
「使われるデータ基盤」を目指してデータアナリストとワークショップをやった話
jackojacko_
2
650
Pythonでベイズモデリング
soogie
0
170
パーソルキャリア IT/テクノロジー職向け 会社紹介資料|Company Introduction Deck
techtekt
PRO
0
480
Oracle AI Database@Azure:サービス概要のご紹介
oracle4engineer
PRO
6
1.7k
Featured
See All Featured
Chasing Engaging Ingredients in Design
codingconduct
0
190
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
360
30k
Scaling GitHub
holman
464
140k
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
140
Designing for humans not robots
tammielis
254
26k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
450
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
120
For a Future-Friendly Web
brad_frost
183
10k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.2k
GitHub's CSS Performance
jonrohan
1033
470k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
1.1k
Transcript
LiteLLMことはじめ01: SDKとProxyの違いを理解し、実装コストを削減する
導入: LLM APIの乱立問題 (SDK Hell) 1 現状の課題 → "SDK Hell"(SDK地獄)により開発速度が低下
▪ SDKの断片化: OpenAI, Anthropic, Vertex AIなど、プロバ イダーごとにインターフェースが異なる。 ▪ スイッチングコスト: モデルを切り替える度にコードの書 き換えが発生。 ▪ 管理の複雑化: 複数のAPIキー、エラーハンドリングの実 装が分散。
LiteLLMとは? (解決策) 2 ユニバーサルアダプター 一言で表すと: 「100以上のLLMをOpenAIフォーマットで統一して呼べるI/F」 ▪ 統一規格: 入出力はすべてOpenAI互換。 ▪
多対応: Azure, Bedrock, Vertex AI, HuggingFaceなど主要 プロバイダーを網羅。 ▪ 軽量: 依存関係が少なく、既存プロジェクトに導入しやす い。 https://www.litellm.ai/ より
主要機能 1: 統一インターフェース (SDK) 3 コードの標準化 completion()関数一つで完結。モデル名の変更だけでプロバイ ダーを切り替え可能。 ▪ OpenAI形式の引数
(messages, model) ▪ OpenAI形式のレスポンスオブジェクト ▪ 環境変数でAPIキーを管理
主要機能 2: 信頼性の向上 (Reliability) 本番運用に不可欠な「落ちない仕組み」をSDKレベルで提供。 4 Fallbacks メインモデル(例: GPT-4)がダ ウンまたはレート制限にかかった
際、自動的にバックアップ(例: GPT-3.5, Claude)へ切り替え。 Retries 一時的なネットワークエラーや APIタイムアウト時に、設定した 回数だけ自動再試行を実施。 Load Balancing 複数のAPIキーやデプロイメント 間でリクエストを分散させ、ス ループットを最大化。
主要機能 3: LiteLLM Proxy Server 5 SDKから「Gateway」へ コードへの埋め込みではなく、独立したサーバーとして立ち上 げ、全てのLLMリクエストを一元管理。 ▪
一元管理: チーム全体のLLMアクセス窓口を統一。 ▪ 認証機能: 独自のVirtual Keysを発行・管理。 ▪ 予算管理: プロジェクト/ユーザー毎の予算上限設定。
可観測性 (Observability) 6 ブラックボックス化を防ぐ LLMアプリの入出力を可視化し、コストと品質をモニタリン グ。 ▪ 簡単連携: config.yamlに追記するだけで、Langfuse, Datadog,
Slackなどへログ送信。 ▪ コスト分析: 誰が、どのモデルを、どれくらい使ったかを 追跡。 ▪ デバッグ: 失敗したリクエストの詳細ログを確認可能。
Q & A ご清聴ありがとうございました。