ランダムに振る舞う機能を JUnit する #渋谷Java 第３回

ランダムに振る舞う機能を JUnit する渋⾕谷Java #3 2013.9.28 at BizReach
KOMIYA Atsushi ( @komiya_atsushi )

by batigolix http://www.flickr.com/photos/batigolix/925301391/ イントロダクション 2

KOMIYA Atsushi @komiya_atsushi 3

分析⼒力力をコアとするマーケティングソリューションカンパニーレコメンデーション＆機械学習系 Java エンジニア 4

分析⼒力力をコアとするマーケティングソリューションカンパニーレコメンデーション＆機械学習系 Java エンジニア代々⽊木の緑⾊色の会社 5

#TokyoWebmining 事務局分析／機械学習／アドテク等のネタでお話していただける講師を募集中デス！ 6

by Sebastian Bergmann http://www.flickr.com/photos/sebastian_bergmann/8127016855/ 　みなさん、 JUnit してますか？ 7

今⽇日のお話 • 動機 • Random#nextInt() などで得られる乱数に従って振る舞い、出⼒力力が決まる機能を JUnit でテストしたい • でも、普通に JUnit
を使っただけでは結果が不不定なテストとなってしまう… 8

今⽇日のお話 • 動機 • Random#nextInt() などで得られる乱数に従って振る舞い、出⼒力力が決まる機能を JUnit でテストしたい • でも、普通に JUnit
を使っただけでは結果が不不定なテストとなってしまう… データサイエンスを⽣生業としている企業らしく… 統計的な⼿手法を使って解決しよう！ 9

今回対象とするランダムに振る舞う機能 • 前提条件 1.  １回の試⾏行行につき発⽣生する事象が１つであること •  試⾏行行：機能を実⾏行行して何らかの結果を得ようとする⾏行行為 •  事象：出⼒力力される・得られる値
2.  事象は離離散値でかつ種類数が有限個数であること 3.  事象の⽣生起確率率率が事前に明らかである・推定できること 10

今回対象とするランダムに振る舞う機能 • 前提条件 • １回の試⾏行行につき発⽣生する事象が１つであること •  試⾏行行：機能を実⾏行行して何らかの結果を得ようとする⾏行行為 •  事象：出⼒力力される・得られる値 • 事象は離離散値でかつ種類数が有限個数で
あること • 事象の⽣生起確率率率が事前に明らかである・推定できること早い話が、「コイントスする」「サイコロを振る」に相当する機能と思えばOK 11

by Bartmani http://www.flickr.com/photos/8349201@N04/503039124/ いかにしてランダムな振る舞いをする機能をユニットテストするか？ 12

ユニットテストへの統計学的アプローチ • 推計統計学における「仮説検定」の考え⽅方を利利⽤用する • コイントスによる仮説検定の例例 (⼆二項検定) • 「コイントスを 20 回試してみたんだけど、表が
15 回も出たんだよね。このコインって、歪んでる（1/2の確率率率じゃない）のかな？」 • 「歪んでないコインと仮定した場合、20 回コイントスしてたまたま表が 15 回出る確率率率は 5% 以下（4.139%）だよ〜～？だから、5% の確率率率で間違いかもしれないけど歪んでいると⾔言えそうだねっ！」 13

15 回も出たんだよね。このコインって、歪んでる（1/2の確率率率じゃない）のかな？」 • 「歪んでないコインと仮定した場合、20 回コイントスしてたまたま表が 15 回出る確率率率は 5% 以下（4.139%）だよ〜～？だから、5% の確率率率で間違いかもしれないけど歪んでいると⾔言えそうだねっ！」 100% の精度度ではない 14

15 回も出たんだよね。このコインって、歪んでる（1/2の確率率率じゃない）のかな？」 • 「歪んでないコインと仮定した場合、20 回コイントスしてたまたま表が 15 回出る確率率率は 5% 以下（4.139%）だよ〜～？だから、5% の確率率率で間違いかもしれないけど歪んでいると⾔言えそうだねっ！」試⾏行行回数 p 値有意⽔水準 15

ユニットテストに応⽤用する • テスト対象の機能によって得られる事象（出⼒力力結果）の⽣生起確率率率が、想定している確率率率に近しいことを検証する • 例例 • 60% の確率率率で “晴れ” を、 25%
の確率率率で “曇り” を、 15% の確率率率で “⾬雨” を返すメソッド String weather() をテストしたい！ 16

ユニットテストに応⽤用する • 例例 • 60% の確率率率で “晴れ” を、 25% の確率率率で “曇り” を、
15% の確率率率で “⾬雨” を返すメソッド String weather() をテストしたい！ • 100 回呼び出したときの各事象の頻度度事象推定値 [回] 観測値 [回] 晴れ 100 * 0.60 = 60 55 曇り 100 * 0.25 = 25 27 ⾬雨 100 * 0.15 = 15 18 17

ユニットテストに応⽤用する • 例例 • 60% の確率率率で “晴れ” を、 25% の確率率率で “曇り” を、
15% の確率率率で “⾬雨” を返すメソッド String weather() をテストしたい！ • 100 回呼び出したときの各事象の頻度度事象推定値 [回] 観測値 [回] 晴れ 100 * 0.60 = 60 55 曇り 100 * 0.25 = 25 27 ⾬雨 100 * 0.15 = 15 18 この「ずれ」は果たして妥当なのだろうか？ 18

具体的な仮説検定の⼿手法：カイ⼆二乗検定 • カイ⼆二乗検定による適合度度検定 • 試⾏行行した・観測した結果得られた、各事象の頻度度の分布が想定・推定される頻度度の分布とどれだけ近しいか？を確認する 19

具体的な仮説検定の⼿手法：カイ⼆二乗検定 • カイ⼆二乗検定による適合度度検定 • 試⾏行行した・観測した結果得られた、各事象の頻度度の分布が想定・推定される頻度度の分布とどれだけ近しいか？を確認するずれっぷりが妥当なのかを判断できる！ 20

ユニットテストの観点で仮説検定を⾒見見ていきます 21

仮説検定の注意点 • 「想定される状況からずれていること」を積極的に⽰示したい動機が背景にある • 医療療などの⽅方⾯面で特に顕著 • ユニットテストの場合は「想定からずれていないこと」、すなわち OK であることを⽰示したい • 「有意⽔水準」など、⾔言葉葉の意味が「逆」に
思えるケースがあるので要注意 22

仮説検定を利利⽤用したユニットテストの検出精度度　偽陽性と偽陰性 • 先に述べた通り、仮説検定の精度度は 100% ではない • ユニットテストにおける偽陽性・偽陰性を考えてみよう • 偽陽性（第⼀一種過誤、False positive） • OK
と判定されるテストケースが、実⾏行行の結果、誤って NG として検出されてしまう状況（誤検知） • 偽陰性（第⼆二種過誤、False negative） • 偽陽性とは逆に、NG として検出されるべきテストケースが OK 判定になる状況（バグ検出漏漏れ） • 両⽅方ともに少ない状況が望ましい • 状況によっては、偽陰性がより重視されることも 23

有意⽔水準 • NG を検出する精度度を左右する重要な要素 • ⼀一般的な仮説検定では 5% or 1% とする • ユニットテストにおいて、有意⽔水準を • ⼤大きくする
•  J NG 結果の検知漏漏れは減る •  L OK → NG の誤検知が増える • ⼩小さくする •  J OK → NG の誤検知は減る •  L NG 結果の検知漏漏れが増える 24

試⾏行行回数 • 「サイコロを振る回数」「コイントスする回数」に相当する • 回数が多ければ多いほど、得られた判定結果の信ぴょう性が増してくる • 事象の数（≒⾃自由度度）が⼤大きい場合は、試⾏行行回数も多めに設定する必要がある • L スローテスト問題が起きやすくなる 25

by marissa http://www.flickr.com/photos/44124363951@N01/4369776892/ 実装 26

実装に関する疑問 • 理理屈はなんとなくわかったよ、だからコードを⾒見見せろ！ • カイ⼆二乗検定なんてどう実装すりゃいいねん… • これ本当に JUnit で扱えるの…？ 27

実装に関する疑問 • カイ⼆二乗検定関係 • JUnit での利利⽤用 • BaseMatcher を継承したクラスを⽤用意 28

実装に関する疑問 • カイ⼆二乗検定関係 • JUnit での利利⽤用 • BaseMatcher を継承したクラスを⽤用意 gist.github.com/komiya-‐atsushi/6736271 29

使い⽅方 // 試⾏行行により観測された各事象の回数 long[] counts = {55, 27, 18};
// 期待される各事象の⽣生起確率率率 double[] probs = {0.60, 0.25, 0.15}; // 有意⽔水準 double significanceLevel = 0.05; // assertion は次のように書く assertThat( observedCounts(counts), // 観測された各事象の回数 wellFit(probs) // 期待される確率率率 .at(significanceLevel)); // 有意⽔水準 30

ちょっとしたデモ 31

まとめ • ランダムな振る舞いを持って出⼒力力をする機能もユニットテストできるんだよ • そう、カイ⼆二乗検定ならね • BaseMatcher 継承して実装すれば、 JUnit からも使えるよ！ • ただ利利⽤用するにはちょっと統計の知識識が
必要ネ • 有意⽔水準、⾃自由度度、試⾏行行回数… 32

ありがとうございました！ 33

ランダムに振る舞う機能を JUnit する #渋谷Java 第３回

ランダムに振る舞う機能を JUnit する #渋谷Java 第３回

KOMIYA Atsushi

More Decks by KOMIYA Atsushi

Other Decks in Technology

Featured

Transcript

ランダムに振る舞う機能を JUnit する渋⾕谷Java #3 2013.9.28 at BizReach

by batigolix http://www.flickr.com/photos/batigolix/925301391/ イントロダクション 2

KOMIYA Atsushi @komiya_atsushi 3

分析⼒力力をコアとするマーケティングソリューションカンパニーレコメンデーション＆機械学習系 Java エンジニア 4

分析⼒力力をコアとするマーケティングソリューションカンパニーレコメンデーション＆機械学習系 Java エンジニア代々⽊木の緑⾊色の会社 5

#TokyoWebmining 事務局分析／機械学習／アドテク等のネタでお話していただける講師を募集中デス！ 6

by Sebastian Bergmann http://www.flickr.com/photos/sebastian_bergmann/8127016855/ 　みなさん、 JUnit してますか？ 7

今⽇日のお話 • 動機 • Random#nextInt() などで得られる乱数に従って振る舞い、出⼒力力が決まる機能を JUnit でテストしたい • でも、普通に JUnit

今⽇日のお話 • 動機 • Random#nextInt() などで得られる乱数に従って振る舞い、出⼒力力が決まる機能を JUnit でテストしたい • でも、普通に JUnit

by Bartmani http://www.flickr.com/photos/8349201@N04/503039124/ いかにしてランダムな振る舞いをする機能をユニットテストするか？ 12

ユニットテストへの統計学的アプローチ • 推計統計学における「仮説検定」の考え⽅方を利利⽤用する • コイントスによる仮説検定の例例 (⼆二項検定) • 「コイントスを 20 回試してみたんだけど、表が

ユニットテストへの統計学的アプローチ • 推計統計学における「仮説検定」の考え⽅方を利利⽤用する • コイントスによる仮説検定の例例 (⼆二項検定) • 「コイントスを 20 回試してみたんだけど、表が

ユニットテストへの統計学的アプローチ • 推計統計学における「仮説検定」の考え⽅方を利利⽤用する • コイントスによる仮説検定の例例 (⼆二項検定) • 「コイントスを 20 回試してみたんだけど、表が

ユニットテストに応⽤用する • テスト対象の機能によって得られる事象（出⼒力力結果）の⽣生起確率率率が、想定している確率率率に近しいことを検証する • 例例 • 60% の確率率率で “晴れ” を、 25%

ユニットテストに応⽤用する • 例例 • 60% の確率率率で “晴れ” を、 25% の確率率率で “曇り” を、

ユニットテストに応⽤用する • 例例 • 60% の確率率率で “晴れ” を、 25% の確率率率で “曇り” を、

具体的な仮説検定の⼿手法：カイ⼆二乗検定 • カイ⼆二乗検定による適合度度検定 • 試⾏行行した・観測した結果得られた、各事象の頻度度の分布が想定・推定される頻度度の分布とどれだけ近しいか？を確認する 19

ユニットテストの観点で仮説検定を⾒見見ていきます 21

有意⽔水準 • NG を検出する精度度を左右する重要な要素 • ⼀一般的な仮説検定では 5% or 1% とする • ユニットテストにおいて、有意⽔水準を • ⼤大きくする

by marissa http://www.flickr.com/photos/44124363951@N01/4369776892/ 実装 26

実装に関する疑問 • 理理屈はなんとなくわかったよ、だからコードを⾒見見せろ！ • カイ⼆二乗検定なんてどう実装すりゃいいねん… • これ本当に JUnit で扱えるの…？ 27

実装に関する疑問 • カイ⼆二乗検定関係 • JUnit での利利⽤用 • BaseMatcher を継承したクラスを⽤用意 28

実装に関する疑問 • カイ⼆二乗検定関係 • JUnit での利利⽤用 • BaseMatcher を継承したクラスを⽤用意 gist.github.com/komiya-‐atsushi/6736271 29

使い⽅方 // 試⾏行行により観測された各事象の回数 long[] counts = {55, 27, 18};

ちょっとしたデモ 31

ありがとうございました！ 33