Cloud Runマネージドに適したアプリケーションを考える

52f95e52a6d71b67361ac179fb8405f4?s=47 chimame
October 18, 2020

Cloud Runマネージドに適したアプリケーションを考える

GDG DevFest 2020

52f95e52a6d71b67361ac179fb8405f4?s=128

chimame

October 18, 2020
Tweet

Transcript

  1. Cloud Runマネージドに適 したアプリケーションを考え る 2020/10/18 GDG DevFest 2020

  2. Cloud Run利点・注意点 Agenda 自己紹介 まとめ

  3. Whoa! 名前: rito 職業: Webエンジニア (アプリケーションエンジニア) 分野: Ruby on Rails,

    Nodejs, React, Docker, AWS, GCP 所属: Ateam Finergy Inc. コミュニティ: GDG Osaka Rails follow-up Osaka Osaka Web Developers Meetup twitter: @chimame_rt GitHub: chimame
  4. Cloud Run Develop and deploy highly scalable containerized applications on

    a fully managed serverless platform.
  5. ざっくりCloud Runのお さらい

  6. “Cloud Run はマネージド型のコンピューティング プラット フォームで、ウェブ リクエストまたは Pub/Sub イベント経由で 呼び出し可能なステートレス コンテナを実行できます。

    https://cloud.google.com/run/docs?hl=ja Cloud Runとは? 6
  7. • コンテナイメージで起動 • コンテナ実行はサーバレスな実行も可能 • 処理はhttpリクエストもしくはPub/Subからのみ実行可 能 平たく言うと 7

  8. Cloud Runマネージドはサーバレスでかつ、 コンテナによるランタイム環境を生成可能 8

  9. Cloud Runの利点 Benefits of using Cloud Run

  10. 10 コンテナ実行を前提としてるので

  11. freedom of language freedom of framework 言語やフレームワークはもちろんバージョンなどのコンテナで動作するなら どんなものでも選択可能

  12. 12 マネージドであるがゆえに

  13. トラフィックによりスケーリングを 自動で行ってくれる。

  14. 14 様々なサービスとの連携も

  15. Cloud Run Cloud SQL Cloud Memorystore Cloud VPC Cloud Scheduler

    Cloud Tasks Cloud Load Balancing Cloud Storage ※beta
  16. 弊社サービスで実際に運用してみた注意点 16 https://www.navinavi-hoken.com/ https://navinavi-shoken.com/

  17. Cloud Runの注意点 Cavert of using Cloud Run

  18. オートスケーリング問題

  19. Cloud Runのオートスケールは以下の条件に基づく(※) • リクエストの処理に必要な CPU の量 • 同時実行の設定 • コンテナ

    インスタンスの最大数の設定 1つ目のCPUの量というのが意外と厄介ではある。残り2つに ついては設定次第なのでもう少し説明する ※ https://cloud.google.com/run/docs/about-instance-autoscaling?hl=ja Cloud Runのオートスケールの条件 19
  20. 1コンテナに投げることが できる同時リクエスト数 同時実行の設定とは 同時リクエスト数を超える とスケールする

  21. コンテナインスタンスの最大数の設定とは コンテナのスケールの最 大数を設定できる ・・・

  22. • 最小コンテナ数は指定できない なのでアクセスが0の状態が一定時間続くとコンテナ数は最 小の0まで落ちる 更にマネージドならではの条件として 22

  23. 23 Q: 以上の条件から以下1日単位の リクエスト数の場合はどうなるか?

  24. 24

  25. 25 最大時と最小時にかなりの差がある

  26. 26 A: リクエストの最小から最大に向けて コンテナがスケールする

  27. Q: Cloud Runって自動でスケーリングして くれるから問題ないのでは? 27

  28. A: 半分は正解。半分は間違い。 28

  29. • スケールはスケールが必要となった リクエストが派生 した段階 で行われる • スケールが必要となった リクエストはスケールするコ ンテナで処理 される

    言うなればコンテナがリクエストを受け入れる(起動)状態に なる前からリクエストは待たされる Cloud Runのオートスケール時の動作 29
  30. スケールが必要な リクエストが発生 スケールするのにコンテナの 起動時間も含めてリクエストを 待機させる コンテナの起動時間までリクエストを待たせるのでRuby on Railsはイン タプリタ言語かつ重量系フレームワークであるため起動するのに早くても 10秒程度かかるためなかなか厳しい

  31. Q: コンテナ同時リクエストを多く受け入れたらス ケールが抑えられるので大丈夫なのでは? 31

  32. A: リクエスト数だけがスケール条件じゃない 32

  33. Cloud Runのオートスケールは以下の条件に基づく(※) • リクエストの処理に必要な CPU の量 • 同時実行の設定 • コンテナ

    インスタンスの最大数の設定 1つ目のCPUの量というのが意外と厄介ではある。残り2つに ついては設定次第なのでもう少し説明する ※ https://cloud.google.com/run/docs/about-instance-autoscaling?hl=ja Cloud Runのオートスケールの条件(再掲載 33
  34. Cloud Runのオートスケールは以下の条件に基づく(※) • リクエストの処理に必要な CPU の量 • 同時実行の設定 • コンテナ

    インスタンスの最大数の設定 1つ目のCPUの量というのが意外と厄介ではある。残り2つに ついては設定次第なのでもう少し説明する ※ https://cloud.google.com/run/docs/about-instance-autoscaling?hl=ja Cloud Runのオートスケールの条件(再掲載 34
  35. 要約:リクエストを受けれるコンテナでもCPUが忙し そうにしてたらスケールする 35

  36. 36 同じ条件で負荷をかけてもCPU効率がい い方がスケールする コンテナのCPUコア2にして同条件で負荷実験を実施

  37. スケーリング問題の 対処

  38. 対策1: そもそもリアルタイム処理には使わず 非同期処理にのみ組み込む

  39. コンテナさえ用意すれば実行できるサーバレスアーキテクチャの 利点だけ使うと割り切って、リアルタイムは別アーキテクチャで 組む 【メリット】 • スケールの問題はほぼ関係なくなる 【デメリット】 • サービス全体を見るとアーキテクチャが多岐に渡る可能が 出てくる

    スケールが問題になるならリアルタイムには使わない と割り切る案
  40. 対策2: 起動速度が爆速アプリケーションにす る

  41. なんといってもこれがスケールする場合のクリティカルパスな のでそれを解決する案 【メリット】 • これさえ解決すればこの問題はすべて解決する 【デメリット】 • 使用言語およびフレームワークでは解決できない • 解決というのはどこまでのレイテンシーを許容するか定

    義が必要 一番の根本原因となっているスケール速度  ≒アプリケーション起動速度を改善する案
  42. 対策3: Cloud Runに仕事をさせない

  43. 例えば動的な処理以外に静的なものもレスポンスさせないこ とや、動的なものでもCDNでキャッシュさせる等 【メリット】 • スケール数は抑えられる 【デメリット】 • スケール数は抑えられるがスケール自体は抑えれない • インフラ構成も含めてしっかりとした設計が必要

    そもそもCloud Runに仕事をさせずに極力仕事を減 らす案
  44. 対策4: Cloud Run for Anthosを使用する

  45. 最大アクセス数を捌くためのコンテナ数を事前に用意する。それ をするためにCloud Run for Anthosを使用する 【メリット】 • スケール数をほぼ抑えることが可能 • GKEを使用することになるので常時起動のJobなども定義が

    可能 【デメリット】 • GKEが必要となりKubernetesの知識が若干必要となる • マネージドに比べるとサービス初期などは費用が割高にな る スケールさせる必要がある場合を非常時とし、 通常時はスケールさせない案
  46. 対策5: マネージド版でも最小コンテナ数を指 定する(β機能)

  47. None
  48. Cloud Run for Anthosと同様にマネージド版でも最小インスタン ス数を指定してオートスケールを抑える案 【メリット】 • スケール数をほぼ抑えることが可能 【デメリット】 •

    常時インスタンスを立ち上げている状態となるので起動中 はずっと費用がかかることになる(Cloud Runマネージド版 のリクエスト時間分の課金ではなくなる) マネージドでも最小インスタンス数を指定することがで きるようになる
  49. 対策6: DNSラウンドロビンを使い複数の Cloud Runサービスを1つのアプリケー ションとして使う

  50. 稼働時間チェックなどで定期的にリクエストを送り コールドスタンバイにしない Monitoring1 (Uptime check) service1 Monitoring2 (Uptime check) service2

    Monitoring3 (Uptime check) service3 example.com DNSラウンドロビンをさせて最小コンテナ数≒ サービスとして定義する
  51. 1サービスで最小コンテナ数を指定できないなら最小コンテナ数 分のサービスで1エンドポイントのアクセスを捌いて擬似的に最 小コンテナを設定する案 【メリット】 • マネージドのいいとこは生かしたまま解決が可能 【デメリット】 • DNSラウンドロビンで実現が可能か不明 DNSラウンドロビンで不可能な場合はEdgeコンピューティン

    グにて処理をうまいこと実装する必要がある コンテナ最小数≒サービス数としてスケールを抑える 方法案(ただし試してない)
  52. まとめ STAY 適したアプリケーションや 構成をしっかり考えること インフラ管理は すごい楽 GOOD! 今回は触れてないけど非同期処 理も色々あるので注意が必要 STAY

    マネージドな分アンコントローラブル な部分もある BAD
  53. Thanks! Does anyone have any questions? rito@chimame