Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AI Gateway入門 - マルチLLM時代の交通整理 -
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
nutslove
March 17, 2026
43
1
Share
AI Gateway入門 - マルチLLM時代の交通整理 -
DIO NIGHT VOL.2でAI GatewayについてLTさせていただきました。
その際に使用した資料になります。
よろしくお願いします。
nutslove
March 17, 2026
More Decks by nutslove
See All by nutslove
Kubernetes(EKS)ネットワーク入門
nutslove
1
550
Context Engineeringの取り組み
nutslove
0
600
LangGraphで作ったアラート原因分析エージェントについて
nutslove
0
500
アラートだけでここまで分析できるの!?AI Agentで切り開くアラート対応の新時代
nutslove
0
780
OpenTelemetry(ADOT)による自動計装
nutslove
1
290
MCP入門
nutslove
2
210
GitOpsで始めるクラウドリソース管理
nutslove
1
180
Thanos入門(Receiver構成)
nutslove
0
170
OpenTelemetryによるベンダーニュートラルな監視設定
nutslove
5
550
Featured
See All Featured
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
200
Reality Check: Gamification 10 Years Later
codingconduct
0
2.2k
Information Architects: The Missing Link in Design Systems
soysaucechin
0
950
Designing Experiences People Love
moore
143
24k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.4k
HDC tutorial
michielstock
2
680
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
How to Ace a Technical Interview
jacobian
281
24k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4.1k
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
260
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
Transcript
AI Gateway入門 - マルチLLM時代の交通整理 - 2026/3/17 李俊起 DIO NIGHT Vol.2
自己紹介 名前 李 俊起(イ ジュンギ) / Joonki Lee 所属 KINTOテクノロジーズ株式会社
Platform Group / Platform Engineer 関心分野 Observability Kubernetes 生成AI 2026/3/17 2
アジェンダ 2026/3/17 3 • 話すこと ➢ AI Gatewayがない場合の課題 ➢ AI
Gatewayで解決できること • 話さないこと ➢ ツールごとの違い ➢ 具体的な設定方法や使い方
2026/3/17 4 AI Gatewayがない場合の課題
用途・ワークロードに応じて複数のベンダーを併用 2026/3/17 5 • 用途・ワークロードに応じて複数のベンダーを組み合わせて使うの が一般的 • 例えば、データ分析系(e.g. Big Query)のAI
AgentはGoogle Cloud、Coding AgentはClaudeなど、ワークロードやモデルの得 意不得意を考慮して複数のプロバイダーを組み合わせる
複数のベンダーをAI Gatewayなしで使う場合 2026/3/17 6 • ベンダーそれぞれのエンドポイント・認証情報を直接設定 Vertex AIのエンドポイント / 認証情報
Azure OpenAIのエンドポイント / 認証情報 Bedrockのエンドポイント / 認証情報
直接エンドポイントを指定して使う場合の課題 (管理者視点) 2026/3/17 7 • コスト管理、セキュリティ、可視化などを個別に設定・確認する必要 がある コスト管理、セキュリティ設定、可視化 コスト管理、セキュリティ設定、可視化 コスト管理、セキュリティ設定、可視化
管理者
直接エンドポイントを指定して使う場合の課題 (開発者視点) 2026/3/17 8 • 特定のベンダーで障害が発生した場合に手動でエンドポイントを 切り替える必要がある • ベンダーごとのAPIのスキーマが異なるため、1つの処理の中で APIを変更する場合、ユーザ側でスキーマを変換する必要がある
開発者 手動で切り替え
2026/3/17 9 AI Gatewayでできること
ルーティング 2026/3/17 10 • 単一のエンドポイントから複数のプロバイダーにルーティング https://blog.realvarez.com/blog/envoy-ai-gateway/
自動フォールバック 2026/3/17 11 • 特定のベンダーで障害が発生した場合、自動で別のベンダーの APIにフォールバックされる 自動フォールバック AI Gateway
スキーマ変換 2026/3/17 12 • ベンダーごとのAPIスキーマの差分をAI Gatewayが吸収 AI Gateway AI Gatewayが各プロバイダー
のAPIフォーマットに変換して からリクエストを投げる AI Gatewayの 統一された フォーマット 各プロバイダーの フォーマット
Observability(監視・可視化) 2026/3/17 13 • 全てのベンダーへのAPIに関するデータを1箇所で収集・可視化し、 コスト管理や監査ができる AI Gateway
セキュリティ 2026/3/17 14 • セキュリティ関連設定を1箇所でまとめて管理できる ➢ 機密情報マスキングやプロンプトインジェクションなど、 input/outputに関するガードレールなど AI Gateway
ユーザからのinputに機密情報が 含まれていたらその部分を マスキングしてからAIに渡す raw input masked input
認証 2026/3/17 15 • Gatewayへの認証および複数のプロバイダーへのアクセスに関す る認証の設定を1箇所でまとめて管理できる ➢ クライアント → Gatewayへの認証
➢ Gateway → プロバイダーへの認証の代行 AI Gateway 各プロバイダーへの認証 情報をまとめて管理し、 ユーザはGatewayへの 認証だけ済ませばOK
その他の機能 2026/3/17 16 • Rate Limit ➢ Token数に基づいてRate Limitの設定ができる •
MCP Gateway ➢ 複数のMCP Serverに単一のエンドポイントからアクセス ➢ 認証・認可の一元管理、Toolのフィルタリングなど • Prompt Caching ➢ Agentなどマルチターンの処理で、 固定のプロンプト部分をキャッシングし、コスト削減
まとめ 2026/3/17 17 • AI Gatewayのツールとしては、LiteLLM、Envoy AI Gateway、 Kong AI
Gatewayなど、複数存在する ➢ 基本OSSで、Enterprise版を持っているものが多い • ツールによって使える機能が異なるので、先に要件を定めてから ツール選定をした方が良い
ご清聴ありがとうございました!