Slide 11
Slide 11 text
©MNTSQ, Ltd. 11
大量のデータに対するRAGの適用: コンテキスト長とモデル選択の壁
例)
契約書数
50k
平均条文数
10
平均条文文字数
200
=> 86,000k トークン
コンテキスト長 最大入力時費用
gpt-3.5-turbo
4k (日: 4,600字) $0.006 (¥0.9)
16k (日: 186,000字) $0.048 (¥7.2)
gpt-4k
8k (日: 9300字) $0.24 (¥36)
32k (日: 371,000字) $1.92 (¥288)
OpenAI APIのPricingより計算、出力トークンの費用を含まない、1ドル150円で換算
契約書データ平均のトークン数は日本語文字数の1.16倍前後として試算 (MNTSQ調べ)
コンテキスト長
4x → 費用
8x
GPT-3.5からGPT-4
→ 費用
10x or 20x
大量の条文データが存在 コンテキスト長やモデル選択で費用は大きく変わる
1回のAPI呼び出しで作れる付加価値との比較考量が必要