Cloud Runマネージドに適したアプリケーションを考える

Slide 1

Slide 1 text

Cloud Runマネージドに適したアプリケーションを考える 2020/10/18 GDG DevFest 2020

Slide 2

Slide 2 text

Cloud Run利点・注意点 Agenda 自己紹介まとめ

Slide 3

Slide 3 text

Whoa! 名前： rito 職業： Webエンジニア（アプリケーションエンジニア）分野： Ruby on Rails, Nodejs, React, Docker, AWS, GCP 所属： Ateam Finergy Inc. コミュニティ： GDG Osaka Rails follow-up Osaka Osaka Web Developers Meetup twitter: @chimame_rt GitHub: chimame

Slide 4

Slide 4 text

Cloud Run Develop and deploy highly scalable containerized applications on a fully managed serverless platform.

Slide 5

Slide 5 text

ざっくりCloud Runのおさらい

Slide 6

Slide 6 text

“Cloud Run はマネージド型のコンピューティングプラットフォームで、ウェブリクエストまたは Pub/Sub イベント経由で呼び出し可能なステートレスコンテナを実行できます。 https://cloud.google.com/run/docs?hl=ja Cloud Runとは？ 6

Slide 7

Slide 7 text

● コンテナイメージで起動 ● コンテナ実行はサーバレスな実行も可能 ● 処理はhttpリクエストもしくはPub/Subからのみ実行可能平たく言うと 7

Slide 8

Slide 8 text

Cloud Runマネージドはサーバレスでかつ、コンテナによるランタイム環境を生成可能 8

Slide 9

Slide 9 text

Cloud Runの利点 Beneﬁts of using Cloud Run

Slide 10

Slide 10 text

10 コンテナ実行を前提としてるので

Slide 11

Slide 11 text

freedom of language freedom of framework 言語やフレームワークはもちろんバージョンなどのコンテナで動作するならどんなものでも選択可能

Slide 12

Slide 12 text

12 マネージドであるがゆえに

Slide 13

Slide 13 text

トラフィックによりスケーリングを自動で行ってくれる。

Slide 14

Slide 14 text

14 様々なサービスとの連携も

Slide 15

Slide 15 text

Cloud Run Cloud SQL Cloud Memorystore Cloud VPC Cloud Scheduler Cloud Tasks Cloud Load Balancing Cloud Storage ※beta

Slide 16

Slide 16 text

弊社サービスで実際に運用してみた注意点 16 https://www.navinavi-hoken.com/ https://navinavi-shoken.com/

Slide 17

Slide 17 text

Cloud Runの注意点 Cavert of using Cloud Run

Slide 18

Slide 18 text

オートスケーリング問題

Slide 19

Slide 19 text

Cloud Runのオートスケールは以下の条件に基づく(※) ● リクエストの処理に必要な CPU の量 ● 同時実行の設定 ● コンテナインスタンスの最大数の設定 1つ目のCPUの量というのが意外と厄介ではある。残り2つについては設定次第なのでもう少し説明する ※ https://cloud.google.com/run/docs/about-instance-autoscaling?hl=ja Cloud Runのオートスケールの条件 19

Slide 20

Slide 20 text

1コンテナに投げることができる同時リクエスト数同時実行の設定とは同時リクエスト数を超えるとスケールする

Slide 21

Slide 21 text

コンテナインスタンスの最大数の設定とはコンテナのスケールの最大数を設定できる・・・

Slide 22

Slide 22 text

● 最小コンテナ数は指定できないなのでアクセスが0の状態が一定時間続くとコンテナ数は最小の0まで落ちる更にマネージドならではの条件として 22

Slide 23

Slide 23 text

23 Q: 以上の条件から以下1日単位のリクエスト数の場合はどうなるか？

Slide 24

Slide 24 text

Slide 25

Slide 25 text

25 最大時と最小時にかなりの差がある

Slide 26

Slide 26 text

26 A: リクエストの最小から最大に向けてコンテナがスケールする

Slide 27

Slide 27 text

Q: Cloud Runって自動でスケーリングしてくれるから問題ないのでは？ 27

Slide 28

Slide 28 text

A: 半分は正解。半分は間違い。 28

Slide 29

Slide 29 text

● スケールはスケールが必要となったリクエストが派生した段階で行われる ● スケールが必要となったリクエストはスケールするコンテナで処理される言うなればコンテナがリクエストを受け入れる（起動）状態になる前からリクエストは待たされる Cloud Runのオートスケール時の動作 29

Slide 30

Slide 30 text

スケールが必要なリクエストが発生スケールするのにコンテナの起動時間も含めてリクエストを待機させるコンテナの起動時間までリクエストを待たせるのでRuby on Railsはインタプリタ言語かつ重量系フレームワークであるため起動するのに早くても 10秒程度かかるためなかなか厳しい

Slide 31

Slide 31 text

Q: コンテナ同時リクエストを多く受け入れたらスケールが抑えられるので大丈夫なのでは？ 31

Slide 32

Slide 32 text

A: リクエスト数だけがスケール条件じゃない 32

Slide 33

Slide 33 text

Slide 34

Slide 34 text

Slide 35

Slide 35 text

要約：リクエストを受けれるコンテナでもCPUが忙しそうにしてたらスケールする 35

Slide 36

Slide 36 text

36 同じ条件で負荷をかけてもCPU効率がいい方がスケールするコンテナのCPUコア2にして同条件で負荷実験を実施

Slide 37

Slide 37 text

スケーリング問題の対処

Slide 38

Slide 38 text

対策1: そもそもリアルタイム処理には使わず非同期処理にのみ組み込む

Slide 39

Slide 39 text

コンテナさえ用意すれば実行できるサーバレスアーキテクチャの利点だけ使うと割り切って、リアルタイムは別アーキテクチャで組む【メリット】 ● スケールの問題はほぼ関係なくなる【デメリット】 ● サービス全体を見るとアーキテクチャが多岐に渡る可能が出てくるスケールが問題になるならリアルタイムには使わないと割り切る案

Slide 40

Slide 40 text

対策2: 起動速度が爆速アプリケーションにする

Slide 41

Slide 41 text

なんといってもこれがスケールする場合のクリティカルパスなのでそれを解決する案【メリット】 ● これさえ解決すればこの問題はすべて解決する【デメリット】 ● 使用言語およびフレームワークでは解決できない ● 解決というのはどこまでのレイテンシーを許容するか定義が必要一番の根本原因となっているスケール速度　≒アプリケーション起動速度を改善する案

Slide 42

Slide 42 text

対策3: Cloud Runに仕事をさせない

Slide 43

Slide 43 text

例えば動的な処理以外に静的なものもレスポンスさせないことや、動的なものでもCDNでキャッシュさせる等【メリット】 ● スケール数は抑えられる【デメリット】 ● スケール数は抑えられるがスケール自体は抑えれない ● インフラ構成も含めてしっかりとした設計が必要そもそもCloud Runに仕事をさせずに極力仕事を減らす案

Slide 44

Slide 44 text

対策4: Cloud Run for Anthosを使用する

Slide 45

Slide 45 text

最大アクセス数を捌くためのコンテナ数を事前に用意する。それをするためにCloud Run for Anthosを使用する【メリット】 ● スケール数をほぼ抑えることが可能 ● GKEを使用することになるので常時起動のJobなども定義が可能【デメリット】 ● GKEが必要となりKubernetesの知識が若干必要となる ● マネージドに比べるとサービス初期などは費用が割高になるスケールさせる必要がある場合を非常時とし、通常時はスケールさせない案

Slide 46

Slide 46 text

対策5: マネージド版でも最小コンテナ数を指定する（β機能）

Slide 47

Slide 47 text

No content

Slide 48

Slide 48 text

Cloud Run for Anthosと同様にマネージド版でも最小インスタンス数を指定してオートスケールを抑える案【メリット】 ● スケール数をほぼ抑えることが可能【デメリット】 ● 常時インスタンスを立ち上げている状態となるので起動中はずっと費用がかかることになる（Cloud Runマネージド版のリクエスト時間分の課金ではなくなる）マネージドでも最小インスタンス数を指定することができるようになる

Slide 49

Slide 49 text

対策6: DNSラウンドロビンを使い複数の Cloud Runサービスを1つのアプリケーションとして使う

Slide 50

Slide 50 text

稼働時間チェックなどで定期的にリクエストを送りコールドスタンバイにしない Monitoring1 (Uptime check) service1 Monitoring2 (Uptime check) service2 Monitoring3 (Uptime check) service3 example.com DNSラウンドロビンをさせて最小コンテナ数≒ サービスとして定義する

Slide 51

Slide 51 text

1サービスで最小コンテナ数を指定できないなら最小コンテナ数分のサービスで1エンドポイントのアクセスを捌いて擬似的に最小コンテナを設定する案【メリット】 ● マネージドのいいとこは生かしたまま解決が可能【デメリット】 ● DNSラウンドロビンで実現が可能か不明 DNSラウンドロビンで不可能な場合はEdgeコンピューティングにて処理をうまいこと実装する必要があるコンテナ最小数≒サービス数としてスケールを抑える方法案（ただし試してない）

Slide 52

Slide 52 text

まとめ STAY 適したアプリケーションや構成をしっかり考えることインフラ管理はすごい楽 GOOD! 今回は触れてないけど非同期処理も色々あるので注意が必要 STAY マネージドな分アンコントローラブルな部分もある BAD

Slide 53

Slide 53 text

Thanks! Does anyone have any questions? rito@chimame