スキップしていいテスト、スキップしてはいけないテスト〜速さと信頼を兼ねたテストコードを構築する術〜 / Need for speed of testing in Perl5 Web Application.

スキップしていいテスト、スキップしてはいけないテスト速さと信頼を兼ねたテストコードを構築する術 YAPC::Fukuoka 2017 2017-07-01 macopy a.k.a @mackee_w 1
/ 58

誰 macopy/ マコピー github: @mackee twitter: @mackee_w PAUSE: MACOPY App::Prove::Plugin::MySQLPool
language: 日本語, Perl5, Go kuiperbelt - WebSocket と普通のHTTP/1.1 を変換してくれる君興味: リアルタイム通信, ワークフロー, ORM, MySQL Yokohama.pm Co-Organizer 最近: 3D プリンタ, altcoin 掘削 2 / 58

誰 macopy/ マコピー所属: 面白法人カヤックソーシャルゲーム事業部ぼくらの甲子園ポケットサーバサイド 3 /
58

これは何の話さてみなさんテストを書いていますか？そして継続的にテストを実行していますか？テストを書かない、またはCI を回さない理由としては以下のような物が考えられます。 - めんどくさい（わかる - テストの実行時間が長い（わかる -
テストがコケたりコケなかったりする（わかる - テスト回してコケたらデプロイが出来ないルールとかだとデプロイがいつまで経ってもできない（わかる - そもそも人力テスト(QA など) やってるし、要らんやろ（わかる - コード書いた人間が想定する壊れそうな部分しかテスト書かれないんだから意味ないやろ（わかるというなどなど挙げられます。このトークでは、未来へ継続していくWeb サービスアプリケーションを開発・運用する上で __ あえて__ テストをスキップする話や、テスト 4 / 58

要約すると甲子園ポケットっていうソシャゲータイトルのテストの話 3 年もやっているとテストがクソ長くなってつらまるリリース当初からカバレッジC0 90% これだけテスト書かれまくっているとちょっとコード追加するだけでもテストコード書きたくなる結果肥大化するフルスペックのソーシャルゲームのサーバ、そもそも複雑/ 機能多すぎ
思考停止して便利関数によるintegration test を書きがち -> 遅くなる参考: 行数 $ find lib -name \*.pm | xargs cat | wc -l 244691 $ find t -name \*.t | xargs cat | wc -l 269530 5 / 58

話すこと現状あるテストを書き直したり仕組みを変えることで速くする、改善する話「俺たちはこうしているよ」というドメインに特化したストーリーそのままは適用できないと思うのでヒントにしてもらえれば Perl5 のサーバサイドのWeb アプリケーションのテスト話さないこと一般的なテストの理論的な話 TDD
とかフロントのテスト既存のテストを消す話( 聞きたい) 影響範囲を頭いい感じで割り出して頭いい感じで必要なテストしかしない( すごい 6 / 58

昨日前夜祭の二次会で得た気付き既に「テストを書こう」と言っていく時代は過ぎている昔はテストがないからとにかく書こう、書きやすい環境を用意しよう、習慣をつけようという話になっていた「良いテストとか、悪いテストがどうこうの前に、書かないとうまくならない」 perl な web application のためのテスト情報 -
YAPC::Asia 2013 7 / 58

昨日前夜祭の二次会で得た気付き今は「テストをいかにうまくやっていくか」テストはみんな書いているさてみなさんテストを書いていますか？ <- 愚問であったとにかく書いていたテストというのをうまく動かせるように、良いように変えていく必要がある 8 / 58

とはいえテストしやすい環境の話です！サーバサイドのAPI 吐くサーバはテストしやすい 9 / 58

前提 10 / 58

だいたい1 日1 回ぐらいサーバのアプリケーションはリリースするガチャイベント機能追加バグフィックス調査でログ埋め込み etc... 11
/ 58

「更新しやすいのはサーバの方」クライアントアプリの更新は難しいので変更されやすい部分や重要な部分はサーバの挙動やマスタデータに依存するように作られているクライアント側開発者曰く「このアプリは独自API のブラウザ」緊急でバグフィックスとなるとサーバの更新に頼ることになる最近の実績サーバ -> 1
日1 回の更新クライアント -> 1 ヶ月から半月に1 度の更新 12 / 58

それでもリリース前にフルテストはかけたいフルテストに助けられた場面は何度もある新機能を入れた -> デグレーションマスタデータのテストサービスがちょっととまるだけでかなりの損失ソーシャルゲームは普通のWeb アプリケーションと比べて1API リクエストあたりの価値が高い
あとユーザは「安定している/ 安定していない」の観点があって、落ちまくってると信用を失ってユーザが離れる実際にでかいトラブルを起こしてそのまま終了したサービスもある 13 / 58

現状 is リリース頻度 xor フルテスト実行による安全性担保 14 / 58

両立させるためにはどちらかもしくは両方に改善/ 妥協が必要 15 / 58

現状リリース頻度 1 日1 回～2 回ただしデプロイを避けたい時間帯がある GvG の時間帯 1
日4 回合計10 時間イベントの定期実行バッチ時間主に昼間の4 時間が狙い目フルテスト実行にかかる時間 30 分リリース初期は7 分ぐらいだったんだ…… 機能追加やらバグってたケースの追加とかで膨らむデプロイフェーズ直前のテスト失敗は修正も含めて3 度ぐらいしか出来ない 16 / 58

現状ほとんどの機能やマスタデータはtopic ブランチを経由して、master ブランチにマージされ、更にrelease ブランチに入れているつまりtopic とmaster とrelease で3
回フルテストが必要 master とrelease に入れるときのPullRequest には2 人以上のレビューが必要なルールにしているレビューも時間がかかるんや…… 17 / 58

まずフルテスト30 分とかキレるやろはいはいはい... 18 / 58

甲子園ポケットのテスト側の仕組み DB が絡むテストはTest::mysqld による本物のDB でやるしかしDB が絡まないテストなんてありますか？？？うまいこと抽象化してたら下を分離できるんだけれどそうもいかないんやテストファイルごととかにポコポコDB が立つと寿命が足りない
App::Prove::Plugin::MySQLPool によるワーカーごとのプール化さらにgo-prove による並列化 image by Concurrency is not Parallelism 19 / 58

甲子園ポケットのテスト側の仕組みマスタデータはコード側のテストでは使わない俺はここではマスタデータのテストをしたいのではなくコードのテストをしたいんや、テストの時に使うマスタデータはテストに埋め込んでそれをINSERT するぜ例えば1 人のユーザをデータの整合性を本番同様に保った状態で作成するのに必要なテーブル数は36 個それを都度！テストケース内で！作る！遅い！ 20
/ 58

甲子園ポケットのテスト側の仕組み DB のスキーマはワーカーごとにDDL を生成して食わせるサブテスト内のDB への変更はサブテスト終了時にクリーンアップするよく見るトランザクション使ってロールバックではなく全テーブルをTRUNCATE している外側でトランザクションを貼るのはロールバックする場合のテストとかが出来なくて本番と同様の挙動を再現できないため
# apptest は内部でsubtest を実行しつつ前後でDB をクリーンアップしたりlogger のモック化やら時間の固定化などをしている apptest " なんとかのテスト" => sub { # create_user_model はユーザ登録に必要なマスタデータがなければ作ってその上で実際のユーザ登録メソッドを叩いてモデルを作る my $user_model = create_user_model; }; 21 / 58

Q: だいたいDB のことしか言ってないやん A: だってDB 使う部分が結局重いんだもん 22 / 58

さてどうするか 23 / 58

よっしゃキャッシュや！ 24 / 58

思い出されますね…… Web アプリケーションのキャッシュ戦略とそのパターン YAPC::Kansai 2017 25 / 58

何をどうキャッシュするかおさらいテストでのマスタデータの扱いマスタデータはコード側のテストでは使わない俺はここではマスタデータのテストをしたいのではなくコードのテストをしたいんや、テストの時に使うマスタデータはテストに埋め込んでそれをINSERT するぜ例えば1 人のユーザをデータの整合性を本番同様に保った状態で作成するのに必要なテーブル数は36 個
26 / 58

テストコード内ではよくcreate_user_model が使われているこういうのが $ find t/ -name \*.t |
xargs cat | grep 'create_user_model' | wc -l 3647 こんな感じ 36 個のテーブルのINSERT をしていると思うとゾッとしますね、はい # apptest は内部でsubtest を実行しつつ前後でDB をクリーンアップしたりlogger のモック化やら時間の固定化などをしている apptest " なんとかのテスト" => sub { # create_user_model はユーザ登録に必要なマスタデータがなければ作ってその上で実際のユーザ登録メソッドを叩いてモデルを作る my $user_model = create_user_model; }; 27 / 58

Q: どうキャッシュする？しかし実際の登録メソッドを使ってほとんど本番と同じユーザが使えるがメリットであって、軽くするために似て非なる物を作っても、ちゃんとしたテストにならないのではないかもちろんちゃんと抽象化して副作用を抑えればええやんという件はわかります、わかりますがつまり「ユーザ登録メソッドを使い」つつ「何らかの方法で作成を軽くする」 28 / 58

A: 一気にINSERT するスクリプトでTest::mysqld を立ててそこにつなげてcreate_user_model を100 回繰り返しそれをmysqldump でsql ファイルに落とすテスト時のapptest
時に一気にくわせる 29 / 58

A: 一気にINSERT する my $mysqld = Test::mysqld->new( my_cnf => my_cnf(),
); my $sql_file = test_ddl_file(); $sql_file->remove; mysql_prepare($mysqld); mysql_override_config(); create_user_model for 1..$self->user_num; my $opts = mysqld_opts($mysqld); my $output_path = $sql_file->stringify; system(qq{mysqldump --no-create-info $opts test > $output_path}); 30 / 58

キャッシュというかスナップショットでは？はい 31 / 58

A: 一気にINSERT する既存のテストでPK 指定でINSERT するやつとduplicate して死ぬそもそもPK 指定でINSERT するな！(ID
に依存したテスト書かない。。。) # apptest が呼ばれた時点でSQL ファイルが全部食われる apptest " ほげテスト" => sub { # このテーブルのid=1 のやつはすでに作ったSQL で作られているのでduplicate する create_dummy("FugaTable", id => 1); }; truncate_all という便利関数がせっかく作ったダミーデータを全て洗い流してくれるのでduplicate しない。 apptest " ほげテスト" => sub { truncate_all; # 全部消されるから便利…便利？ create_dummy("FugaTable", id => 1); }; とりあえずコケたやつでこのケースであればこれで対処した 32 / 58

結果 30 分 -> 19 分ほどに他にも過程でテストファイルの分割などもおこなったりしています 33 /
58

人はテストが早すぎると不安になる人の手には負えない力を手に入れてしまったのか……俺は（意訳: 意味的に導入前と変わらないか怖い 34 / 58

同僚が件数を数えてくれました 35 / 58

発展 Test::mysqld のcopy_data_from というオプションがありそれを使えばもっと早くなる参考: Test::mysqld のcopy_data_from でテストが更に捗る話ただし利用しているApp::Prove::Plugin::MySQLPool とgo-prove
は両方ともcopy_data_from 未対応です前者は僕がメンテナなんだからさぼっているだけですm(_ _)m 36 / 58

更に現在は10 分弱でフルテストが回っている 37 / 58

どうやったか？ 38 / 58

インスタンスサイズの拡大と並列度を増やす過去: r3.8xlarge or cc2.8xlarge 32 CPU prove -j 16
現在: i3.16xlarge やm4.16xlarge など64 CPU のものから安いやつを選ぶ prove -j 80 39 / 58

結局は金じゃ photo by 26 歳になりました - 職質アンチパターン 40 / 58

次の改善 -> 同じテストを何度もやる問題 topic -> master -> release... topic までは分かる、master
とrelease はhotfix がない限りはだいたい一緒都度10 分かかるのはどうか 41 / 58

疑問: 同じコードで同じテストを何度もやるのは意味があるのか？時々コケるテストを検知する確率など最近あったのはコールド勝ちで早期終了することが想定されずに9 回まで試合が回るかみたいなテストが確率でコケていました時々コケるテストがある場合は時々コケないように直すテストコードではなく本体を直さなければ行けないケースも稀にある
別に時々コケるテストは同じコードで回す意味は厳密にはあるけれど、ほとんどのケースでは他のブランチでも時々コケる( 経験上) ほとんどの場合、同一内容のブランチで何度も走らせる必要はないのでは？ 42 / 58

何度も回しても意味が無いのでスキップします 43 / 58

何度も回しても意味が無いのでスキップします解説マージされるとgit のコミットハッシュが変わるので同一内容かどうかはわからないなのでmaster やmaster^ と比較してgit diff して差分がないようだったら、github のコミットステータスを見てテ
ストをスキップさせるその他の解法 prove のstate を使うとか prove についてのおさらい 44 / 58

その他テストを書くときのTIPS 45 / 58

Table Driven Test TableDrivenTests - github.com/golang/go Go で知った話だけれどPerl でも出来る Example:
note " 現在の連続ヒット数を計算する関数のテスト"; my @cases = ( { scores => [hit_single(), hit_double()], expect => 2, note => "2 連続ヒット" }, { scores => [hit_single(), bounder_out()], expect => 0, note => " ヒット後にゴロアウト" }, { scores => [bounder_out(), hit_single()], expect => 1, note => " ゴロアウト語にヒット" }, ); for my $case (@cases) { subtest $case->{note} => sub { my $inning = MyApp::Inning->new(scores => $case->{scores}); is $inning->hitting_streak, $note->{expect}; }; } 46 / 58

Table Driven Test 境界値チェックや一つのメソッドが複数のケースで様々な値を出す時に使える野球のコードを書いていると違う場面の同じ判定の可否みたいなのがいっぱいでてくるテスト中の重複コードが減るコードではなくデータが主体となるテストで見たいのはテストコードの良し悪しではなく何をテストしたいのか、やり方などが見たいデータ主体で良い
副作用が少なくなる傾向にある( と思っている) 47 / 58

マスタデータのテストの記述コード以外にもゲームを決めるマスタデータと呼ばれるものが大量にあるこれをレベルデザイナーと呼ばれる人たちがGoogle スプレッドシート経由で入力しているアプリケーションの挙動を決める -> コードと同じでは？コードと同じということはテストが必要ですね！ 48 /
58

かつては地道に書いていた MyApp::DBImporter->from_csv([qw/item item_effect shop_item/]); my $item_rs = MyApp::DB::Item->search; while (my
$item = $item_rs->next) { ok $item->item_effect, " リレーション先のitem_effect があるかどうか"; if ($item->is_buyable) { ok $item->shop_item, " 購入可能なアイテムの場合、有効なショップマスタにアイテムが有るか"; } } 49 / 58

色々問題がある遅いテーブルごとに読み込みとDB 問い合わせ自然にN+1 になるなぜ遅いと辛いかレベルデザインはイテレーションが必要入れてみないと合ってるかどうかわからない(GAS である程度やってるっぽいが)
50 / 58

よっしゃキャッシュや！ 51 / 58

しかし人類にはキャッシュは難しいので工夫が必要そもそも整合性保たれているかとか、値域におさまっているかとかそういうテストばっかり同じようなことをコピペでやっているということはリファクタリングチャンス同じようなことをやっているということは、オレオレDSL にできるのでは？ DSL に逃したら内部的にキャッシュしてあげれば誰でも安全かつ速いマスタデータのテストが書けるのでは？ 52 / 58

というわけでこんな感じになりました subtest "dungeon" => sub { # dungeon.event_id と同じdungeon_floor.event_id があるかどうか
has_relation "dungeon", "dungeon_floor", id => "dungeon_id"; # dungeon_floor.battle_times が1 から10 回以内か expect_row "dungeon_floor" => "battle_times", sub { my $battle_times = shift; return 1 <= $battle_times && $battle_times <= 10; }; # dungeon_floor.dungeon_floor_monster_odds に対応する # dungeon_floor_monster.odds があるかどうか has_relation "dungeon_floor" => "dungeon_floor_monster", dungeon_floor_monster_odds => "odds"; }; 53 / 58

DSL にするといいこと宣言的に書けるようになったプログラマ以外でもどういう制約があるか、ルールを知れば分かるようになったマスタデータのテストを書く負荷が減った DB を使わなくなった DB を使うと素で書くときは便利だが重くなる宣言的にすることでオンメモリで全部処理するようにした
54 / 58

Mock/Stub の話 Test::Mock::Guard 使っている速さの面で言うとstub すると重い部分をスキップできる可能性がある my $g = mock_guard("HeavyModel"
=> { heavy_method => sub { return 1; }, }); ok CallerModel->new(heavy_model => HeavyModel->new)->call_heavy_method; しかし果たしてそれはテストになっているのか？ stub はテストされるコードとテストコードを曖昧にする本来テストしたい挙動が歪められる可能性があるテストを書く側はstub するメソッドなどがコード側で呼ばれていることを知っていないとstub 出来ないブラックボックステストが出来ない 55 / 58

Mock/Stub の話速さは正義であるが速さにかまけて正確性を歪めてはならないモック用オブジェクトをDI 出来る構造にしとけばメソッドの単体テストとしては機能するかもテストの意味的には外部から食ったオブジェクトを使って何かをやるやつ Test::Mock::Guard する場合は内部の実装を変えてしまうことになるので意味が違う切り分ける、刻むというのはテストでもデプロイでも大事で、切り分けてテストすれば関係者が少なくなってテストは速くなる
昔はそうなっていなかったが最近は意識して関係者を少なくするようにしている 56 / 58

N+1 を防ぐためにテストのときだけメソッドモディファイア的なことをしてprefetch されてなければ死ぬ my $orig = MyApp::Model::Player->can("player_info_with_more_info"); my $guard
= mock_guard "MyApp::Model::Player" => { player_info_with_more_info => sub { my ($self) = @_; if ( !exists $self->player->{_relationship_data}{player_more_info} && $self->player->in_storage ) { confess "method called without prefetching player_more_info"; } $orig->(@_); }, }; 57 / 58

まとめ CI を導入してテストを書く習慣がついたらテストを早くしよう 30 分テストにかかっていたら一日に48 回しかテストできずデプロイ回数はそれ以下であるテストは本番ではないので無茶が出来る本番に突っ込むとヤバゲなテクをテストでは思う存分使うことが出来る技術的好奇心が満たされるテストを早くすることはフローの改善につながる
面白法人カヤックでは面白おかしく真面目にテストを早くしてくれる仲間を募集しております 58 / 58

スキップしていいテスト、スキップしてはいけないテスト 〜速さと信頼を兼ねたテストコードを構築す...

スキップしていいテスト、スキップしてはいけないテスト 〜速さと信頼を兼ねたテストコードを構築する術〜 / Need for speed of testing in Perl5 Web Application.

More Decks by mackee

Other Decks in Programming

Featured

Transcript

スキップしていいテスト、スキップしてはいけないテスト〜速さと信頼を兼ねたテストコードを構築す...

スキップしていいテスト、スキップしてはいけないテスト〜速さと信頼を兼ねたテストコードを構築する術〜 / Need for speed of testing in Perl5 Web Application.