Slide 11
Slide 11 text
PTUの試算方法
簡易計算式を利用
Azure OpenAI Service の[クオータ]→[Azure OpenAI Provisioned] →
[容量計算ツール] にて試算可能:もしくは Azure OpenAI 容量計算ツール から
• モデル:使う予定の OpenAI モデル
• バージョン:使う予定のモデルのバージョン
• Peak calls per min:1分間のCallされる回数
• Token in prompt call: 1分間の入力トーク数
• Image input tokens:1分間の画像入力トーク数
※利用しない際は 0 として入力すること
• Tokens in Model response: 1分間の出力トークン数
試算ツールを利用
gpt-4o, 2024-05-13 &
gpt-4o, 2024-08-06
gpt-4o-mini、2024-
07-18
デプロイ可能な増分 50 25
PTU あたりの入力
TPM
2,500 37,000
PTU あたりの出力
TPM
833 12,333
• デプロイにおけるTPMは、入力および出力トークン数の相関関係に基づきます。
出力トークンが多いほど、TPMは低くなるが、サービスが動的にコストバランスを
調整するため、特定の制限をユーザーが設定する必要はありません。
• GPT-4o/miniについて、PTUごとのTPMの概要を提示します。
Azure OpenAI Service のプロビジョニング スループット - Azure AI services | Microsoft Learn