Slide 18
Slide 18 text
#nikkei_tech_talk
18
推論インスタンス
n 複数タスクを実⾏
p 埋め込み計算
p リランキング
n GPUインスタンス(G2)を使⽤
p HuggingfaceのText Embeddings Inference
Ø GPUで⾼速に推論を可能にするツールキット
Ø 電⼦版データで学習したモデルを使⽤
Ø 複数モデルを同じインスタンスで運⽤
p アプリケーション内部LBで接続
Ø Cloud Run等からはVPCコネクタ, Direct VPC egressでアクセス huggingface/text-embedding-
inference - GitHub