Upgrade to Pro — share decks privately, control downloads, hide ads and more …

通話/ 音声認識プロダクトのテストの取り組みと課題

Avatar for Seki Ryoma Seki Ryoma
May 19, 2025
2

通話/ 音声認識プロダクトのテストの取り組みと課題

Avatar for Seki Ryoma

Seki Ryoma

May 19, 2025
Tweet

Transcript

  1. 1. IVRyのプロダクト概要 
 2. LLMプロダクトのテストの実態と課題 
 a. 音声認識編 
 b.

    要約機能 
 3. 今後の取り組み 
 4. まとめ
 アジェンダ
  2. 品質評価について 
 評価基準(LLMを使った機能全般)
 - 機能やプロダクトの要件が満たされているか 
 - 出力してほしくない内容が出ていないか 
 -

    他クライアント様のデータを使って、結果を出力してないか 
 - 在庫連携機能では、誤った予約がされていないか 
 確率的な動作の評価(要約機能)
 - そこまで厳密な評価は行なっておらず、最低限のパターンを確認しながら、探 索的なアプローチを実施
 
 実際の評価に関しては、人 +自動テストの仕組みで行っています 

  3. AI対話システムのテストについて 
 目的/ゴール
 スムーズな対話と、音声認識による正確な応答を 確認し、想定シナリオが完了するか 
 評価観点
 - 対話可能かどうか
 -

    音声認識され、適切な回答が返ってくるか 
 - 想定しているシナリオが完了するかどうか 
 テスト方法
 - 実際に電話をかけて、対話を実施 
 - 発話内容に関しては、様々なパターンを検証し ている

  4. 音声対話の自動テストの誕生 
 詳しくは、 電話自動応答システムの QAのための自動応答システムを作った話 
 テストケースの一例 
 電話をかけて予約完了までのシナリオを 自動化


    大まかな仕組み
 無音検知 + TTS(Text-to-Speech)を活用 して、音声対話の自動テストを実現してい る
 実際の発話に近い環境下での検証も可能 ですが、現時点では、シナリオに組み込め ていません。

  5. 音声対話の自動テストの効果 
 手動テストの工数削減 
 - 対話完了までのテストケースは、ほぼ 100%自動化 され、1~1.5時間ほどのテスト工数の削減 
 リリース頻度の向上


    - 自動テストによって品質が担保されているため、 QA が関与せずともリリースが可能
 - CIにも組み込み、マージのタイミングでテストが実行 され、検証がスムーズに
 仮に人で実行してたとすると ....

  6. 自動テストの対話パターンの拡充 
 - 音声認識のテストで、より多様な対話パターンに対応。 
 - 実際の環境に近い状態を再現するため、 ノイズを含めた対話パターンの拡充 
 -

    将来的には、LLMが対話内容を考えたり、、
 consistency test の導入
 - LLMのモデルのアップデートで、意図しない出力の変化が生じていないかを確認し、 一貫性が保たれているかを検証するテストの実施 
 WebUIとの一貫した自動テストの構築 
 - 対話の自動テストだけでなく、WebUIとの連携も一気通貫で検証できる仕組みの整 備
 今後の取り組み❶ 

  7. まとめ - 通話 / 音声認識プロダクトのテストの取り組みと課題についてお話ししました。 
 - IVRyでは、アウトプットの出力がある程度制御されているため、主にインプットのパ ターンに重点をおいてテスト設計しています。 LLMをプロダクトに組み込むと、周辺

    機能への影響が生じたり、音声認識に組み込むことで環境要因の影響が出たりす るため、検証パターンが増加する傾向があると個人的に感じています。 
 - エンジニアチームや自動テストの導入によって、テスト範囲を最適化し、効率的な 検証で品質を担保しています。