Slide 5
Slide 5 text
5
AIプロダクトのテストの目的
1. 精度向上(プロンプトのチューニング)
AIが実用レベルの回答を出せるよう、出力をコントロールするため
a. 目標値の設定:
精度80%以上を目標に、プロンプトを繰り返し改善
b. データ準備:
実際の契約書、Web上のテンプレート、LLMに生成してもらったデータなど計100件を用意
c. 専門家による判断(リースチェック機能):
単なる正誤判定だけでなく、公認会計士の視点を取り入れ、「判定の根拠」が妥当かどうかも精度の一部として検証
2. 不具合の抽出(品質の担保)
システムとして安定して動作し、予期せぬ挙動を防ぐため
a. LLMとアプリとの連携部分でバグがないか、ユーザーが実際に操作した際に期待通りの挙動をするかを確認
b. リスクの最小化: 事前にプロンプト側で「想定外の回答」を絞り込んでおくことで、アプリ実装後の致命的な不具合を未然に防止