Slide 18
Slide 18 text
(C)PharmaX Inc. 2024 All Rights Reserve 18
OpenAIのPrompt Cachingの特徴
● 長いプロンプトではレイテンシを最大
80%、コストを50%
○ 1,024トークンから、128トークンずつ適用
● OpenAIの主要モデルでは、自動的に適用
○ Anthropicは明示的に指示が必要かつ、キャッシュ書き込みがコストが
1.25倍のかわりに
キャッシュ読み込みではコストが
1/10
● 通常5~10 分間操作が行われないとクリアされ、閑散期には最後に使用されてから
1時間以内
に削除される
OpenAIのPrompt Cachingは値段の割引は少ないが、自動で適応されるなどの便利さはある