機械学習分野におけるテストの自動化 #ques4

Slide 1

Slide 1 text

機械学習分野におけるテストの⾃自動化 2014.4.22 Ques #4 in DeNA @komiya_atsushi

Slide 2

Slide 2 text

※この資料料は http://bit.ly/ques4_ML_test で公開しています 2

Slide 3

Slide 3 text

Self-introduction 3

Slide 4

Slide 4 text

Slide 5

Slide 5 text

ALBERT Inc. Analytical technology 5

Slide 6

Slide 6 text

Background: Java / Web / AWS Machine learning 6

Slide 7

Slide 7 text

Jobs: Curation service, Marketing automation and Recommender systems developer 7

Slide 8

Slide 8 text

QA and me 8

Slide 9

Slide 9 text

知識識はあんまりありません (>_<) 9

Slide 10

Slide 10 text

QA in ALBERT 10

Slide 11

Slide 11 text

QA 専任のエンジニアはいません 11

Slide 12

Slide 12 text

QA = 開発エンジニアのお仕事 ※インフラ構築や運⽤用も開発エンジニアのお仕事です. つまりフルスタ（ry 12

Slide 13

Slide 13 text

Test automation in ALBERT 13

Slide 14

Slide 14 text

Test automation = Code-driven testing (xUnit / xSpec) + Continuous integration 14

Slide 15

Slide 15 text

Code-driven testing by JUnit / Spock ※レガシーなシステムを除く 15

Slide 16

Slide 16 text

Continuous integration by Jenkins 　. ※最近開発しているシステム 16

Slide 17

Slide 17 text

Test-driven development ※少しずつ導⼊入中 17

Slide 18

Slide 18 text

Today’s topic 18

Slide 19

Slide 19 text

機械学習 × テスト⾃自動化 19

Slide 20

Slide 20 text

Code-driven testing に関わる話題を中⼼心にお話しします 20

Slide 21

Slide 21 text

Machine Learning 21

Slide 22

Slide 22 text

What ? 22

Slide 23

Slide 23 text

“⼈人間が⾃自然に⾏行行っている学習能⼒力力と同様の機能をコンピュータで実現しようとする技術・⼿手法” from Wikipedia (機械学習) 23

Slide 24

Slide 24 text

“第⼀一にそのデータが⽣生成した潜在的機構の特徴を捉え、複雑な関係を識識別（すなわち定量量化）する。そして第⼆二にその識識別したパターンを⽤用いて新たなデータについて予測を⾏行行う” from Wikipedia (機械学習) 24

Slide 25

Slide 25 text

“コンピューターでアルゴリズムを構築し、学習データを読み込ませることで、⾃自動的に今あるデータを分類＆まだ⾒見見ぬデータを予測できるようにするもの” “ヒトの情報処理理能⼒力力を超えて、複雑なデータを分類＆予測できるようにするもの” from 銀座で働くデータサイエンティストのブログ http://tjo.hatenablog.com/entry/2013/04/30/191947 25

Slide 26

Slide 26 text

2. 分類・推定フェーズ 1. 学習フェーズ正解が未知のデータ（特徴量量のみ）特徴量量と正解情報の組み合わせから法則性を導き出す（モデル化）学習データ（特徴量量＆正解情報）機械学習アルゴリズム分類・推定結果モデルモデルを元に正解を推測する Photo by littlelostrobot https://www.flickr.com/photos/littlelostrobot/215559356/ 26

Slide 27

Slide 27 text

Use case 27

Slide 28

Slide 28 text

Recommendations 28

Slide 29

Slide 29 text

Email filtering 29

Slide 30

Slide 30 text

Accuracy 30

Slide 31

Slide 31 text

機械学習の精度度は 100 % ではない⼈人間と同じように、分類・推定に失敗することがある例例）メールのスパム誤判定 31

Slide 32

Slide 32 text

Software testing of Machine learning 32

Slide 33

Slide 33 text

機械学習への Code-driven testing 適⽤用の基本 33

Slide 34

Slide 34 text

⼊入⼒力力データと出⼒力力結果を意識識する 34

Slide 35

Slide 35 text

Slide 36

Slide 36 text

Slide 37

Slide 37 text

Slide 38

Slide 38 text

つまりはブラックボックステスト 38

Slide 39

Slide 39 text

悩みどころ 39

Slide 40

Slide 40 text

「期待する結果」の定義が難しい 40

Slide 41

Slide 41 text

精度度は 100% ではない 41

Slide 42

Slide 42 text

ランダムな振る舞いをするアルゴリズム 42

Slide 43

Slide 43 text

テストデータを作るのが⾟辛い 43

Slide 44

Slide 44 text

どのような⼊入⼒力力データを与えればよいか？ 44

Slide 45

Slide 45 text

どのような出⼒力力結果が得られるのか？ 45

Slide 46

Slide 46 text

テストケースが NG となったときに何がダメなのかが分かりづらい 46

Slide 47

Slide 47 text

実装上の不不具合によって NGとなったのか？ 47

Slide 48

Slide 48 text

はたまた⼊入⼒力力データに不不⼿手際があったのか？ 48

Slide 49

Slide 49 text

Patterns & Practices 49

Slide 50

Slide 50 text

テスト対象の分離離を意識識する 50

Slide 51

Slide 51 text

アプリケーションビジネスロジック機械学習アルゴリズム 51

Slide 52

Slide 52 text

アプリケーションビジネスロジック機械学習アルゴリズム特にビジネスロジックと機械学習アルゴリズムを切切り離離して考える 52

Slide 53

Slide 53 text

アプリケーションビジネスロジック機械学習アルゴリズム実装の正しさを検証する使い⽅方の正しさを検証する得られる精度度を検証する 53

Slide 54

Slide 54 text

どの粒粒度度のテストを実施すべきなのかを明らかにしておく 54

Slide 55

Slide 55 text

機械学習アルゴリズムに対するテスト既存のライブラリを利利⽤用するならテストは不不要フルスクラッチ・独⾃自実装する場合は必要 55

Slide 56

Slide 56 text

ビジネスロジックに対するテスト機械学習に与える⼊入⼒力力データや出⼒力力結果の取り扱いが複雑な場合に実施すべき 56

Slide 57

Slide 57 text

アプリケーションに対するテスト機械学習の結果の精度度を定量量評価できる仕組みが整っている場合に実現可能 57

Slide 58

Slide 58 text

機械学習に対する理理解を深める 58

Slide 59

Slide 59 text

ケーステストデータを作成したいテスト結果が NG となった場合に何が悪いのかを明らかにしたい 59

Slide 60

Slide 60 text

擬似コードや数式を理理解するのがベスト 60

Slide 61

Slide 61 text

Slide 62

Slide 62 text

数式が理理解できればテストデータは⼿手計算（Excel）で作れる 62

Slide 63

Slide 63 text

数式に弱くとも⼊入⼒力力データタスク出⼒力力結果は把握できるように 63

Slide 64

Slide 64 text

Slide 65

Slide 65 text

Slide 66

Slide 66 text

Slide 67

Slide 67 text

Slide 68

Slide 68 text

別⾔言語の実装を利利⽤用してテストデータを作成する 68

Slide 69

Slide 69 text

アプリケーションビジネスロジック機械学習アルゴリズム実装の正しさを検証する使い⽅方の正しさを検証する得られる精度度を検証するテストデータの作成、もぅﾏﾁﾞ無理理… 69

Slide 70

Slide 70 text

ケース (やんごとなき理理由により) フルスクラッチ実装した機械学習アルゴリズムをテストしたい 70

Slide 71

Slide 71 text

別⾔言語の実装が存在することが前提 71

Slide 72

Slide 72 text

かつ、その別⾔言語の実装が⼗十分に枯れていること 72

Slide 73

Slide 73 text

ライブラリ: libsvm, liblinear, SciPy, OpenCV 73

Slide 74

Slide 74 text

フレームワーク・ソフトウェア: Mahout, Jubatus, R 74

Slide 75

Slide 75 text

モックやフィクスチャを活⽤用する 75

Slide 76

Slide 76 text

アプリケーションビジネスロジック機械学習アルゴリズム実装の正しさを検証する使い⽅方の正しさを検証する得られる精度度を検証する 76

Slide 77

Slide 77 text

ケースビジネスロジックをテストしたいランダムに振る舞う機械学習アルゴリズムをテストしたい 77

Slide 78

Slide 78 text

アプリケーションビジネスロジック機械学習アルゴリズム実装の正しさを検証する使い⽅方の正しさを検証する得られる精度度を検証する機械学習アルゴリズムの振る舞いにあまり左右されたくない… 78

Slide 79

Slide 79 text

モックを利利⽤用する 79

Slide 80

Slide 80 text

モックライブラリ Mockito https://code.google.com/p/mockito/ JMockit https://code.google.com/p/jmockit/ 80

Slide 81

Slide 81 text

アプリケーションビジネスロジックモックアルゴリズムモックに差し替えるダミーの結果を返す 81

Slide 82

Slide 82 text

フィクスチャで状態を固定する 82

Slide 83

Slide 83 text

アプリケーションビジネスロジック機械学習アルゴリズムモデルモデルを固定する (setup / teardown) 83

Slide 84

Slide 84 text

アプリケーションビジネスロジック機械学習アルゴリズム乱数発⽣生器乱数のシードを固定する 84

Slide 85

Slide 85 text

※ご参考 85 http://bit.ly/random_junit

Slide 86

Slide 86 text

ベースラインの精度度と⽐比較する 86

Slide 87

Slide 87 text

アプリケーションビジネスロジック機械学習アルゴリズム実装の正しさを検証する使い⽅方の正しさを検証する得られる精度度を検証する 87

Slide 88

Slide 88 text

ケースサービスレベルの精度度を検証したい 88

Slide 89

Slide 89 text

やりたいこと 89

Slide 90

Slide 90 text

「期待される精度度」の設定に別のアルゴリズムの精度度を利利⽤用する 90

Slide 91

Slide 91 text

例例）オンライン学習のアルゴリズムならパーセプトロンの精度度をベースラインに SCW の精度度を検証する 91

Slide 92

Slide 92 text

数値計算の特性を把握する 92

Slide 93

Slide 93 text

アプリケーションビジネスロジック機械学習アルゴリズム実装の正しさを検証する使い⽅方の正しさを検証する得られる精度度を検証する 93

Slide 94

Slide 94 text

ケース独⾃自の機械学習アルゴリズムを実装したのでより緻密にテストしたい 94

Slide 95

Slide 95 text

ホワイトボックステスト 95

Slide 96

Slide 96 text

分岐だけではなく数値計算にも注意を払う 96

Slide 97

Slide 97 text

Slide 98

Slide 98 text

Slide 99

Slide 99 text

Conclusion 99

Slide 100

Slide 100 text

業務システムのテストとは異異なる知識識を求められるのは事実 100

Slide 101

Slide 101 text

ただ QA の知識識を⼗十分に活⽤用することはできる！ 101

Slide 102

Slide 102 text

•  テスト対象の分離離を意識識する •  機械学習に対する理理解を深める •  別⾔言語の実装を利利⽤用してテストデータを作成する •  モックやフィクスチャを活⽤用する •  ベースラインの精度度と⽐比較する •  数値計算の特性を理理解する 102

Slide 103

Slide 103 text

ありがとうございました！ 103