Slide 1

Slide 1 text

Docker時代の 分散RSpec環境の作り方 @joker1007

Slide 2

Slide 2 text

self.inspect @joker1007 Repro inc. CTO (要は色々やる人) Ruby/Rails uentd/embulk Docker/ECS ← 今日はこの辺 Bigquery/EMR/Hive/Presto

Slide 3

Slide 3 text

Reproのサービス モバイルアプリケーションの行動トラッキング 分析結果の提供と、それと連動したマーケティン グの提供 大体Ruby・RailsでほぼAWS上で稼動している Dockerやterraform等も活用している 会社規模の割にデータ量が多い。

Slide 4

Slide 4 text

フレンズ(エンジニア)を募集中です Railsがとくいなフレンズ Hadoopがとくいなフレンズ JavaScriptがとくいなフレンズ 等々、様々なフレンズを募集しております

Slide 5

Slide 5 text

なんちゃらRuby会議歴 東京Ruby会議スピーカー 関西Ruby会議スピーカー x2 (+CFP応募) TokyuRuby会議 LT王 RubyKaigi日本酒スーパーバイザー 東京Ruby会議日本酒仕入れ RubyKaigi LT x3 名古屋Ruby会議スピーカー 大江戸Ruby会議Ninja (NEW!!)

Slide 6

Slide 6 text

本題へ

Slide 7

Slide 7 text

皆さんCI回してますか?

Slide 8

Slide 8 text

Docker使ってますか?

Slide 9

Slide 9 text

この2つに該当する人なら、 明日からでもRSpecを分散実行し 高速化できます (いや、もうちょいかかるかも)

Slide 10

Slide 10 text

RailsアプリケーションのCIに おける障壁 独立したDBの準備 テスト毎にクリーンな環境 関連ミドルウェアの準備 マルチコアを使えない parallel_test ? 中々辛いですね……。 Docker(コンテナ)と相性が良い

Slide 11

Slide 11 text

コンテナ化のメリット アプリケーション起動環境の再現性 一時利用のミドルウェアを簡単に用意できる mysql, postgresql redis elasticsearch uentd 複数プロセスでテスト範囲を分割しても、環境の 独立性が確保できる

Slide 12

Slide 12 text

コンテナでテストを実行でき ると、起動した時点で全ての ミドルウェアが揃っている しかもそれぞれが独立している

Slide 13

Slide 13 text

つまり spec_helper で子プロセスを起動 とかやらなくていい!

Slide 14

Slide 14 text

Railsコンテナ化Tips productiontとテストの共用は止めた方がいい 起動時に実行するprehookを用意する 環境変数を元にcon gを切り替える 本番環境での秘匿情報の取得・複合化等を行う シグナルハンドルに気を付けること 子プロセスまでシグナルが届かないと操作でき ない shellを噛ます場合はexecすること ビルドサーバーはあった方が良い

Slide 15

Slide 15 text

RSpec分散実行に必要なもの 実行のキューイング ポーリングするワーカー テストレポートの収集と統合 レポートの表示

Slide 16

Slide 16 text

これらはほとんど 作る必要は無い

Slide 17

Slide 17 text

Amazon ECSの活用 ECSはEC2インスタンスをバックエンドにしたコンテ ナ管理サービス 複数のコンテナをセットにして1ノードで起動でき る。 各コンテナが利用するリソースの量を定義でき、空 いているインスタンスを自動的に検索してそこでコ ンテナを起動できる。 つまりAPIを叩くだけで、必要なノードで勝手にタス クを実行して終わったら空けるということが簡単に 実現できる。 GKEやkubernetes、docker-swarm等でも可

Slide 18

Slide 18 text

CIサービスの部分的活用 PullReqのフック受信 JUnitフォーマットの結果表示

Slide 19

Slide 19 text

テストレポートの格納先 俺達にはS3(GCS)がある

Slide 20

Slide 20 text

作る必要があったもの RSpecのレポートをS3にストアするもの rspecの実行コマンドを渡すとECSのAPIに変換し て実行してくれるもの 作った rspec-storage wrapbox

Slide 21

Slide 21 text

rspec-storage -o オプションを拡張して任意のストレージに出力で きる用にした。 $ rspec -r rspec/storage spec/example_spec.rb \ -f doc \ -f json -o s3://your-bucket/spec_result.json URIのスキーマと表現により、アダプターを書けば何 にでも出力できる。 (rspec-coreの実装が行儀悪いので一部モンキーパッ チが……)

Slide 22

Slide 22 text

wrapbox コマンドを渡すとECSのAPIリクエストを構築して、 よしなにコンテナを起動してくれるヘルパー。 default: cluster: ecsr-test runner: ecs region: ap-northeast-1 container_definition: image: joker1007/wrapbox cpu: 512 memory: 1024 essential: true $ wrapbox ecs run_cmd -f config.yml -e RAILS_ENV=test \ "bundle exec rspec spec/models"

Slide 23

Slide 23 text

二つの簡単なgemを組み合わせる 1. specファイルを適当に分割してwrapboxに投げれ ば、勝手にECSがコンテナをEC2上で分散実行し てくれる。 2. wrapboxで実行したRSpecの出力はrspec-storage によってS3に収集される。 3. 終了した後でjsonを収集してjunit format形式に変 換すれば良い。 簡単!しかもメンテフリー!

Slide 24

Slide 24 text

コンテナでテストを行うメリ ット リソースが抽象化される ノード毎のマシンスペックを気にしなくてよい テスト実行に必要なリソースを1ユニットとし て、一つのノード内に共存できる スポットインスタンスと相性が良い 特にスポットフリート

Slide 25

Slide 25 text

スポットフリート 複数のインスタンスタイプに対して、まとめてスポ ットインスタンスのリクエストを出せる。 リソースの割合を決めておけば、複数のインスタン スタイプの中で必要なリソースに対して最も安いイ ンスタンスを利用できる。 m4.large (weight 1): $0.03/1 = 0.03 c4.large (weight 1): $0.025/1 = 0.025 c4.xlarge (weight: 2): $0.04/2 = 0.02 ←Use もし必要なユニット数が8ならc4.xlargeが4台起動 c4.xlargeが高騰したら自動で変動する

Slide 26

Slide 26 text

スポットフリート (続き) 価格が高騰しても、別のインスタンスタイプからノ ードを起動して自動的に補充されるので計算リソー スを確保できる。 AutoScaleと大きく異なるのは複数のインスタンスタ イプを組み合わせて自動的に調節してくれる点。

Slide 27

Slide 27 text

スポットフリートでECSのクラスタ を構成する 常にスポットインスタンスの低価格を利用して、 一定の並列度でテスト実行できるクラスタが手に入 る。 複数のインスタンスタイプを組み合わせて、性能は 余り変わらないし並列度の調節もコンテナのリソー ス定義で自動的に行われる。 APIでリソース数を調節できるので、夜間だけ減ら す、とかも割と簡単。

Slide 28

Slide 28 text

コスト削減とテスト時間の短縮に成功 元々はCircleCIだったが、 並列度を3倍ぐらいまで上げて、 テスト実行時間を短縮 しかも、コストは月100$以上も安くなった

Slide 29

Slide 29 text

コンテナ化のメリットは環境再現性 だけではない 独立したミドルウェア環境 ミドルウェアや言語処理系のバージョン管理 計算リソースの抽象化 コンテナ化するにはある程度の手間と苦労が必 要だが、やる価値はある。

Slide 30

Slide 30 text

Let's containerize your app!! まずはテストから