Slide 18
Slide 18 text
©2023 Databricks Inc. — All rights reserved
サーバーレス
モデルサービング
Endpoint 1
モデルサービング
18
コントロール
プレーン
アクセス制御
(認証, 認可, IP ACLs, PL)
カスタム
モデル
1
基盤
モデルAPI
カスタム
モデル
2
モデルサービングAPI
マネジメントルート
クエリルート
3 メタデータ &
APIキー
リモートモデル
18
2 ワークスペースのアクセス制御は認証 , 認可, IPアクセ
スリスト, Private Linkを強制
リクエストフロー
3 モデルサービング APIはリクエストを対象のエンドポイントに転
送し、リモートAPIエンドポイントのキーと URLを取得
マネジメントフロー
1 エンドポイント設定 , レート制限, リモートモデルの APIキー,
ACL, カスタム/プロビジョニングされたモデルを管理
5
6
5 基盤モデルAPIエンドポイントによってサポートされるクエリルー
トはDatabricks管理のモデルに転送される
6 リモートモデルによってサポートされるクエリルートは
それぞれの外部モデルプロバイダーに転送される
Llama 2
Endpoint
Endpoint 2
カスタム
モデル
カスタム
モデル
プロビジョンドスループット基盤
モデルAPI
モデル モデル
4
4 カスタムモデル/プロビジョニングされた基盤モデルのクエリ
ルートはサーバーレスコンピュートに転送される
MPT
Endpoint
BGE
Endpoint