Slide 15
Slide 15 text
有識者へのヒアリング
15
PMのヒアリングでわかったこと
● 社内の開発事例とロードマップ
○ AI−OCRやLLMが中⼼で、AI−OCRは専⾨チーム、LLMは各開発チームが主体になる
● AI開発プロセス
○ 確率論的なアウトプットを扱うため、⼤量のテストデータ作成と精度評価が不可⽋
○ テストデータとAI出⼒の⽐較、スコアリングを⾏い、ビジネス価値に繋がるメトリク
スを設定
○ OCRでは⽂字列の⼀致率、LLMではLLM as a Judgeによる採点などを⽤いて精度を評
価
○ 精度評価に基づき、リリース判断を⾏う
● QAEとの連携の⽅向性
○ 根幹の精度評価は今はPdE中⼼だが、プロダクトの品質担保のリードはQAEが協⼒す
る
● ドキュメント整備状況
○ LLM評価指標に関するドキュメントが整備されていてた
LLMが影響範囲が⼤きそ
う
精度保証のための仕組み構築やソフトウェア
品質担保に協⼒できる可能性ありそう
LLMが影響範囲が
⼤きいから??
何回も出てくる
精度評価⼤事かも
評価の指標ってタスクごとに
異なるのか