機械学習のテスト自動化コトハジメ #MLCT Machine Learning Casual Talks #1

機械学習のテスト⾃自動化コトハジメ 2014.6.6 Machine Learning Casual Talks #1 at
COOKPAD @komiya_atsushi

「お前誰よ？」 3

略略して 4

「おまだれ」 5

ALBERT Inc. Analytical technology 7

Job: Engineer 8

Machine Learning and me 9

10 ワタシハキカイガクシュウチョットデキル I can develop machine
learning a little.

Today’s topic 11

Test Automation 12

Code-driven testing (xUnit / xSpec) + Continuous integration 13

Code-driven testing (xUnit / xSpec) + Continuous integration 14 こちらに注⽬目

Machine Learning 15

2. 分類・推定フェーズ 1. 学習フェーズ正解が未知のデータ（特徴量量のみ）特徴量量と正解情報の組み合わせから法則性を導き出す（モデル化）
学習データ（特徴量量＆正解情報）機械学習アルゴリズム分類・推定結果モデルモデルを元に正解を推測する Photo by littlelostrobot https://www.flickr.com/photos/littlelostrobot/215559356/ 16

時間もあまりないし説明はカジュアルに割愛します 17

18 http://www.slideshare.net/shoheihido/cross-30115506/19 詳しくは PFI ⽐比⼾戸さんの資料料がオススメ！

Why automated testing for machine learning ? 19

こんな経験ありませんか？ 20

機械学習アルゴリズムが遅くて遅くて⽣生きるのが⾟辛い… 21 チューニングしてやったぜ！何となく動作かくにん！よかった♡ 計算結果が全くおかしいことに N ヶ⽉月後になってから発覚＼(^o^)／
※この話はフィクションです

機械学習アルゴリズムの精度度を上げるすんごいアイデア思いついた！ 22 実装してみたら精度度が向上した！何となく動作かくにん！よかった♡ 実はコーナーケースなデータの存在をまったく考慮できてなくて本番環境で不不慮の事故死… ※この話はフィクションです

23 本番環境で事故を起
こす奴は

だからといって Excel ⽅方眼紙に書かれたテスト項⽬目を毎回消化するのもバカらしい 24

機械学習の実装・利利⽤用に集中したい！ 25

テストを⾃自動化しましょ！ 26

悩みどころ 27

「期待する結果」の定義が難しい 28

機械学習の精度度は 100% ではない 29

ランダムな振る舞いをするアルゴリズム 30

テストデータを作るのが⾟辛い 31

どのような⼊入⼒力力データを与えればよいか？ 32

どのような出⼒力力結果が得られるのか？ 33

テストケースが NG となったときに何がダメなのかが分かりづらい 34

実装上の不不具合によって NGとなったのか？ 35

はたまた⼊入⼒力力データに不不⼿手際があったのか？ 36

Software testing of Machine learning 37

機械学習への Code-driven testing 適⽤用の基本 38

⼊入⼒力力データと出⼒力力結果を意識識する 39

学習データ（特徴量量＆正解情報）機械学習アルゴリズム分類・推定結果モデルモデルを元に正解を推測する Photo by littlelostrobot https://www.flickr.com/photos/littlelostrobot/215559356/ 40

学習データ（特徴量量＆正解情報）機械学習アルゴリズム分類・推定結果モデルモデルを元に正解を推測する Photo by littlelostrobot https://www.flickr.com/photos/littlelostrobot/215559356/ 41 Input Output

学習データ（特徴量量＆正解情報）機械学習アルゴリズム分類・推定結果モデルモデルを元に正解を推測する Photo by littlelostrobot https://www.flickr.com/photos/littlelostrobot/215559356/ 42 Input Output ⼊入⼒力力データに対して、期待していた出⼒力力結果が得られているのか？

Black-box testing ! ☺ 43

Patterns & Practices 44

※ おことわり個⼈人の経験より得られた知⾒見見をもとにお話をします（これが正解、というわけではありません） 45

テスト対象の分離離・明確化 46

アプリケーションビジネスロジック機械学習アルゴリズム 47

アプリケーションビジネスロジック機械学習アルゴリズム 48 実装の正しさを検証する使い⽅方の正しさを検証する得られる精度度
を検証する

機械学習アルゴリズムに対するテスト既存のライブラリを利利⽤用するならテストは不不要フルスクラッチ・独⾃自実装する場合は必要 49

ビジネスロジックに対するテスト機械学習に与える⼊入⼒力力データや出⼒力力結果の取り扱いが複雑な場合に実施すべき 50

アプリケーションに対するテスト機械学習の結果の精度度を定量量評価できる仕組みが整っている場合に実現可能 51

テストデータの準備・作成 52

出⼒力力を⼈人⼒力力計算できる⼩小規模データを⼿手で作る 53

54 Spark/MLlib: K-Means での例例

55 Spark/MLlib: K-Means での例例このテストデータに対してクラスタの中⼼心はこの値になる

擬似データを⾃自動⽣生成する 56

57 MLlib: Logistic regression での例例

58 MLlib: Logistic regression での例例正規分布に従った乱数を⽣生成し条件に従ってラベル付け

これらを実践するためには、各機械学習アルゴリズムに対する本質的な理理解が求められる 59

既存の枯れた実装を利利⽤用して⽣生成する 60

⼊入⼒力力として与えるデータだけを準備すればよい 61

ライブラリ: libsvm, liblinear, SciPy, OpenCV 62

フレームワーク・ソフトウェア: Mahout, Jubatus, R 63

テスト技法 64

モック 65

アプリケーションビジネスロジック機械学習アルゴリズム 66 ビジネスロジックのテストに集中したいが、

アプリケーションビジネスロジック機械学習アルゴリズム 67 機械学習アルゴリズムの予測しづらい挙動が悩ましい・・・

アプリケーションビジネスロジックモック化 68 意図的な挙動をさせる予測可能な返却値

フィクスチャ 69

アプリケーションビジネスロジック機械学習アルゴリズムモデルファイルテストケースごとにモデルファイルを⽤用意・差し替える 70

アプリケーションビジネスロジック機械学習アルゴリズム乱数シードを固定する 71 乱数発⽣生器 seed =
127

ホワイトボックス的観点 72

数値計算の結果が例例外値になりうるケースを予測する 73

NaN (negative) infinity 情報落落ち 76

・・・とそろそろいいお時間ですのでこの辺で。 77

Conclusion 78

79 本番環境で事故を起
こす奴は

そうならないようにするための⾃自動テスト 80

ありがとうございました！ 81

機械学習のテスト自動化コトハジメ #MLCT Machine Learning Casual ...

機械学習のテスト自動化コトハジメ #MLCT Machine Learning Casual Talks #1

More Decks by KOMIYA Atsushi

Other Decks in Technology

Featured

Transcript