Slide 1

Slide 1 text

Cloud Runマネージドに適 したアプリケーションを考え る 2020/10/18 GDG DevFest 2020

Slide 2

Slide 2 text

Cloud Run利点・注意点 Agenda 自己紹介 まとめ

Slide 3

Slide 3 text

Whoa! 名前: rito 職業: Webエンジニア (アプリケーションエンジニア) 分野: Ruby on Rails, Nodejs, React, Docker, AWS, GCP 所属: Ateam Finergy Inc. コミュニティ: GDG Osaka Rails follow-up Osaka Osaka Web Developers Meetup twitter: @chimame_rt GitHub: chimame

Slide 4

Slide 4 text

Cloud Run Develop and deploy highly scalable containerized applications on a fully managed serverless platform.

Slide 5

Slide 5 text

ざっくりCloud Runのお さらい

Slide 6

Slide 6 text

“Cloud Run はマネージド型のコンピューティング プラット フォームで、ウェブ リクエストまたは Pub/Sub イベント経由で 呼び出し可能なステートレス コンテナを実行できます。 https://cloud.google.com/run/docs?hl=ja Cloud Runとは? 6

Slide 7

Slide 7 text

● コンテナイメージで起動 ● コンテナ実行はサーバレスな実行も可能 ● 処理はhttpリクエストもしくはPub/Subからのみ実行可 能 平たく言うと 7

Slide 8

Slide 8 text

Cloud Runマネージドはサーバレスでかつ、 コンテナによるランタイム環境を生成可能 8

Slide 9

Slide 9 text

Cloud Runの利点 Benefits of using Cloud Run

Slide 10

Slide 10 text

10 コンテナ実行を前提としてるので

Slide 11

Slide 11 text

freedom of language freedom of framework 言語やフレームワークはもちろんバージョンなどのコンテナで動作するなら どんなものでも選択可能

Slide 12

Slide 12 text

12 マネージドであるがゆえに

Slide 13

Slide 13 text

トラフィックによりスケーリングを 自動で行ってくれる。

Slide 14

Slide 14 text

14 様々なサービスとの連携も

Slide 15

Slide 15 text

Cloud Run Cloud SQL Cloud Memorystore Cloud VPC Cloud Scheduler Cloud Tasks Cloud Load Balancing Cloud Storage ※beta

Slide 16

Slide 16 text

弊社サービスで実際に運用してみた注意点 16 https://www.navinavi-hoken.com/ https://navinavi-shoken.com/

Slide 17

Slide 17 text

Cloud Runの注意点 Cavert of using Cloud Run

Slide 18

Slide 18 text

オートスケーリング問題

Slide 19

Slide 19 text

Cloud Runのオートスケールは以下の条件に基づく(※) ● リクエストの処理に必要な CPU の量 ● 同時実行の設定 ● コンテナ インスタンスの最大数の設定 1つ目のCPUの量というのが意外と厄介ではある。残り2つに ついては設定次第なのでもう少し説明する ※ https://cloud.google.com/run/docs/about-instance-autoscaling?hl=ja Cloud Runのオートスケールの条件 19

Slide 20

Slide 20 text

1コンテナに投げることが できる同時リクエスト数 同時実行の設定とは 同時リクエスト数を超える とスケールする

Slide 21

Slide 21 text

コンテナインスタンスの最大数の設定とは コンテナのスケールの最 大数を設定できる ・・・

Slide 22

Slide 22 text

● 最小コンテナ数は指定できない なのでアクセスが0の状態が一定時間続くとコンテナ数は最 小の0まで落ちる 更にマネージドならではの条件として 22

Slide 23

Slide 23 text

23 Q: 以上の条件から以下1日単位の リクエスト数の場合はどうなるか?

Slide 24

Slide 24 text

24

Slide 25

Slide 25 text

25 最大時と最小時にかなりの差がある

Slide 26

Slide 26 text

26 A: リクエストの最小から最大に向けて コンテナがスケールする

Slide 27

Slide 27 text

Q: Cloud Runって自動でスケーリングして くれるから問題ないのでは? 27

Slide 28

Slide 28 text

A: 半分は正解。半分は間違い。 28

Slide 29

Slide 29 text

● スケールはスケールが必要となった リクエストが派生 した段階 で行われる ● スケールが必要となった リクエストはスケールするコ ンテナで処理 される 言うなればコンテナがリクエストを受け入れる(起動)状態に なる前からリクエストは待たされる Cloud Runのオートスケール時の動作 29

Slide 30

Slide 30 text

スケールが必要な リクエストが発生 スケールするのにコンテナの 起動時間も含めてリクエストを 待機させる コンテナの起動時間までリクエストを待たせるのでRuby on Railsはイン タプリタ言語かつ重量系フレームワークであるため起動するのに早くても 10秒程度かかるためなかなか厳しい

Slide 31

Slide 31 text

Q: コンテナ同時リクエストを多く受け入れたらス ケールが抑えられるので大丈夫なのでは? 31

Slide 32

Slide 32 text

A: リクエスト数だけがスケール条件じゃない 32

Slide 33

Slide 33 text

Cloud Runのオートスケールは以下の条件に基づく(※) ● リクエストの処理に必要な CPU の量 ● 同時実行の設定 ● コンテナ インスタンスの最大数の設定 1つ目のCPUの量というのが意外と厄介ではある。残り2つに ついては設定次第なのでもう少し説明する ※ https://cloud.google.com/run/docs/about-instance-autoscaling?hl=ja Cloud Runのオートスケールの条件(再掲載 33

Slide 34

Slide 34 text

Cloud Runのオートスケールは以下の条件に基づく(※) ● リクエストの処理に必要な CPU の量 ● 同時実行の設定 ● コンテナ インスタンスの最大数の設定 1つ目のCPUの量というのが意外と厄介ではある。残り2つに ついては設定次第なのでもう少し説明する ※ https://cloud.google.com/run/docs/about-instance-autoscaling?hl=ja Cloud Runのオートスケールの条件(再掲載 34

Slide 35

Slide 35 text

要約:リクエストを受けれるコンテナでもCPUが忙し そうにしてたらスケールする 35

Slide 36

Slide 36 text

36 同じ条件で負荷をかけてもCPU効率がい い方がスケールする コンテナのCPUコア2にして同条件で負荷実験を実施

Slide 37

Slide 37 text

スケーリング問題の 対処

Slide 38

Slide 38 text

対策1: そもそもリアルタイム処理には使わず 非同期処理にのみ組み込む

Slide 39

Slide 39 text

コンテナさえ用意すれば実行できるサーバレスアーキテクチャの 利点だけ使うと割り切って、リアルタイムは別アーキテクチャで 組む 【メリット】 ● スケールの問題はほぼ関係なくなる 【デメリット】 ● サービス全体を見るとアーキテクチャが多岐に渡る可能が 出てくる スケールが問題になるならリアルタイムには使わない と割り切る案

Slide 40

Slide 40 text

対策2: 起動速度が爆速アプリケーションにす る

Slide 41

Slide 41 text

なんといってもこれがスケールする場合のクリティカルパスな のでそれを解決する案 【メリット】 ● これさえ解決すればこの問題はすべて解決する 【デメリット】 ● 使用言語およびフレームワークでは解決できない ● 解決というのはどこまでのレイテンシーを許容するか定 義が必要 一番の根本原因となっているスケール速度  ≒アプリケーション起動速度を改善する案

Slide 42

Slide 42 text

対策3: Cloud Runに仕事をさせない

Slide 43

Slide 43 text

例えば動的な処理以外に静的なものもレスポンスさせないこ とや、動的なものでもCDNでキャッシュさせる等 【メリット】 ● スケール数は抑えられる 【デメリット】 ● スケール数は抑えられるがスケール自体は抑えれない ● インフラ構成も含めてしっかりとした設計が必要 そもそもCloud Runに仕事をさせずに極力仕事を減 らす案

Slide 44

Slide 44 text

対策4: Cloud Run for Anthosを使用する

Slide 45

Slide 45 text

最大アクセス数を捌くためのコンテナ数を事前に用意する。それ をするためにCloud Run for Anthosを使用する 【メリット】 ● スケール数をほぼ抑えることが可能 ● GKEを使用することになるので常時起動のJobなども定義が 可能 【デメリット】 ● GKEが必要となりKubernetesの知識が若干必要となる ● マネージドに比べるとサービス初期などは費用が割高にな る スケールさせる必要がある場合を非常時とし、 通常時はスケールさせない案

Slide 46

Slide 46 text

対策5: マネージド版でも最小コンテナ数を指 定する(β機能)

Slide 47

Slide 47 text

No content

Slide 48

Slide 48 text

Cloud Run for Anthosと同様にマネージド版でも最小インスタン ス数を指定してオートスケールを抑える案 【メリット】 ● スケール数をほぼ抑えることが可能 【デメリット】 ● 常時インスタンスを立ち上げている状態となるので起動中 はずっと費用がかかることになる(Cloud Runマネージド版 のリクエスト時間分の課金ではなくなる) マネージドでも最小インスタンス数を指定することがで きるようになる

Slide 49

Slide 49 text

対策6: DNSラウンドロビンを使い複数の Cloud Runサービスを1つのアプリケー ションとして使う

Slide 50

Slide 50 text

稼働時間チェックなどで定期的にリクエストを送り コールドスタンバイにしない Monitoring1 (Uptime check) service1 Monitoring2 (Uptime check) service2 Monitoring3 (Uptime check) service3 example.com DNSラウンドロビンをさせて最小コンテナ数≒ サービスとして定義する

Slide 51

Slide 51 text

1サービスで最小コンテナ数を指定できないなら最小コンテナ数 分のサービスで1エンドポイントのアクセスを捌いて擬似的に最 小コンテナを設定する案 【メリット】 ● マネージドのいいとこは生かしたまま解決が可能 【デメリット】 ● DNSラウンドロビンで実現が可能か不明 DNSラウンドロビンで不可能な場合はEdgeコンピューティン グにて処理をうまいこと実装する必要がある コンテナ最小数≒サービス数としてスケールを抑える 方法案(ただし試してない)

Slide 52

Slide 52 text

まとめ STAY 適したアプリケーションや 構成をしっかり考えること インフラ管理は すごい楽 GOOD! 今回は触れてないけど非同期処 理も色々あるので注意が必要 STAY マネージドな分アンコントローラブル な部分もある BAD

Slide 53

Slide 53 text

Thanks! Does anyone have any questions? rito@chimame