Slide 18
Slide 18 text
本番リリース前に、開発環境にて効果があるかどうかの実験を⾏った。
- ⼿法
- バッチ処理なし
- バッチ処理あり
- 利⽤する契約書データ
- ⼀般的な⻑さ(約4,000トークン)
- モデルの最⼤⼊⼒⻑に近いもの(約8,000トークン)
- シナリオ
- 通常時:1秒に1リクエスト
- キュー滞留時:100件を⼀括投⼊
- 計測指標
- スループット(req/sec):⾼いほど良い
- 平均レイテンシ(sec/件):低いほど良い
ステップ4-2:改善策が有効か検証する 実験設定