Upgrade to Pro — share decks privately, control downloads, hide ads and more …

音声認識のモデルのテストのやり方 / How to Test a Voice Recognition Model

Matsu
January 15, 2024

音声認識のモデルのテストのやり方 / How to Test a Voice Recognition Model

この資料では、音声認識のモデルのテストのやり方を説明しています。
詳細なテストではなく、簡単に比較したい場合のテストについてです。
また、多くのソフトウェアテストで言えることにフォーカスして話をしています。
This document explains how to test a voice recognition model.
It explains testing for simple comparisons rather than detailed testing.
Additionally, it focuses on topics relevant to many software tests.

Matsu

January 15, 2024
Tweet

More Decks by Matsu

Other Decks in Technology

Transcript

  1. 22 ©MIXI 自己紹介なの 名前:  松谷峰生 (まつ / @mty_mno) 所属:  株式会社MIXI

    開発本部 CTO室 社外活動:  JaSST Kyushu(ソフトウェアテストシンポジウム九州 ) 実行委員  ASTER(ソフトウェアテスト技術振興協会 ) 教育  マンガ家 新人さんからわかるソフトウェアテスト解説マンガ 「テスターちゃん」
  2. 23 23 ©MIXI 音声 ファイル 読み上げたテキストとモデルから出力されたテキストの類似度を計算 どれだけ正確にテキストにできたかは、録音時に読み上げたテキストとモデルを通して出 力されたテキストを比較します。比較には文字列の類似度を用います。 類似度は同じテキストなら1.0、全部違えば0.0になります。 こんにちは

    Aモデル Bモデル こんにちは あああああ 類似度 = 1.0 類似度 = 0.0 ※類似度 = 1 - (レーベンシュタイン距離 / 最大文字数) ※レーベンシュタイン距離は、文字列 Aを文字列Bと同じにするために挿入 /置換/削除を何回行えばよいか、の回数。 テスト マテスト _テスト マテスト この場合は1。文字数は4。なので ¼ = 0.25。類似度 = 1 - 0.25 = 0.75 (正確にはレーベンシュタイン距離の標準化)
  3. 25 25 ©MIXI 類似度の中央値、平均値 類似度の中央値 距離50cm 距離100cm Aモデル 1.0 1.0

    Bモデル 1.0 1.0 類似度の平均値 距離50cm 距離100cm Aモデル 0.89 0.86 Bモデル 0.94 0.87 距離50cmで差がつく項目が ありそう? ※中央値:小さい順に並べたとき真ん中に来る値 ※相加平均。いわゆる普通の平均。
  4. 26 26 ©MIXI Aモデルは短い言葉に弱いぞ!? Aモデル 距離50cm 距離100cm Xさん 認識不能 認識不能

    Yさん 認識不能 認識不能 Zさん 認識 認識不能 Bモデル 距離50cm 距離100cm Xさん 認識 認識 Yさん 認識 認識不能 Zさん 認識 認識不能 「(短い言葉)」の項目 ※収録時は病欠により1人不参加 Romiの推奨距離は50cm程 度であるものの 100cmで全滅 50cmも2名で認識不能 100cmで懸念があるものの 推奨距離の 50cmでは全員OK
  5. 28 28 ©MIXI まとめ (音声認識というよりテスト全般側) • テストの温度感(要求)を把握しよう! ◦ ざっくり知りたい?ガッツリとテスト? •

    そのテストに必要な要素が何かを検討しよう! ◦ いったんは一通りあげて、テストの温度感で優先度を考えよう • そのテストは通しでやったほうがいいのか、わけたほうがいいのかを考えよう ◦ テストの効率に影響!