14 例︓画像分類 ML サービス 猫︕ • ⼊⼒に対して同値クラスを定義することができないため、同値クラスにおける 代表値を使ったテストや、境界値を使ったテストを実施できない p 境界を定義できたとしてもそれが正しいと判断することができない • ⼊⼒データの変化に対して推論結果が常に変化するとは限らない p ⼊⼒データのわずかな違いによって⼤きく推論結果が変わることがある 従来のソフトウェア開発で使うテスト⼿法を適⽤することができない
16 • メタモルフィックテスティング p ⼊⼒データの変化によって推論結果が変化するかという関係性に基づくテスト⽅法 • ニューロンカバレッジ p ニューラルネットを構成するすべての中間ニューロンが少なくとも⼀度は 活性化させるようテストを実⾏する⼿法 • 最⼤安全半径 p 「少なくともこの範囲であれば妥当な値が得られる」であろう範囲を定義して、 推論結果の妥当性を確認する⼿法
17 • メタモルフィックテスティング p ⼊⼒データの変化によって推論結果が変化するかという関係性に基づくテスト⽅法 • ニューロンカバレッジ p ニューラルネットを構成するすべての中間ニューロンが少なくとも⼀度は 活性化させるようテストを実⾏する⼿法 • 最⼤安全半径 p 「少なくともこの範囲であれば妥当な値が得られる」であろう範囲を定義して、 推論結果の妥当性を確認する⼿法
26 • 従来のソフトウェア開発で⽤いられてきたテストを機械学習ソフトウェアに適⽤する ことは難しい • 機械学習ソフトウェアの ML サービス箇所のテストにはメタモルフィックテスティングを 適⽤することができる p 正解データを定義せずにテストを実施することができる p メタモルフィックテスティングにより、機械学習ソフトウェアになにか問題が発⽣して いる可能性を⾒つけ出すことができる