Slide 8
Slide 8 text
©BLUEISH 2024. All rights reserved.
Llma 3.1 70Bを7分間利用した例
カスタムモデルユニットあたりの推論コスト/分: $0.0785
カスタムモデルユニットあたりのストレージコスト/月: $1.95
カスタムモデルユニット数: 8 (ドキュメント記載の値を参考)
利用時間: 7分
5 分単位でのウィンドウ数: 2
インスタンス数:1
推論コスト:0.0785 * 8 * 2 * 1 = $1.256
👉軽量なモデルで推論速度が速いほどコストは安くなりそう
ストレージコスト:1.95 * 8 = $15.6 / 月