Slide 21
Slide 21 text
© LayerX Inc. 21
runn: 品質を維持する「結合テスト」
継続的な改善の仕組み
一般的なソフトウェア開発における「リグレッションテスト」の位置付け
AIの精度だけでなくシステム全体が正常に動作するか確認するもの
検証プロセス
1. アプローチ: 実際のAPIエンドポイントへリクエストを送信。
2. 検証内容: レスポンスのステータス、データ構造、を元にスコアリング
3. 目的: モデルの劣化やプロンプトの変更による精度の低下、またはシステム全体のデグレが発生していないことを担保
4. 役割: 開発が進んでも、「壊れていない」ことを担保するガードレールの役割