Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
Cloud Runマネージドに適 したアプリケーションを考え る 2020/10/18 GDG DevFest 2020
Slide 2
Slide 2 text
Cloud Run利点・注意点 Agenda 自己紹介 まとめ
Slide 3
Slide 3 text
Whoa! 名前: rito 職業: Webエンジニア (アプリケーションエンジニア) 分野: Ruby on Rails, Nodejs, React, Docker, AWS, GCP 所属: Ateam Finergy Inc. コミュニティ: GDG Osaka Rails follow-up Osaka Osaka Web Developers Meetup twitter: @chimame_rt GitHub: chimame
Slide 4
Slide 4 text
Cloud Run Develop and deploy highly scalable containerized applications on a fully managed serverless platform.
Slide 5
Slide 5 text
ざっくりCloud Runのお さらい
Slide 6
Slide 6 text
“Cloud Run はマネージド型のコンピューティング プラット フォームで、ウェブ リクエストまたは Pub/Sub イベント経由で 呼び出し可能なステートレス コンテナを実行できます。 https://cloud.google.com/run/docs?hl=ja Cloud Runとは? 6
Slide 7
Slide 7 text
● コンテナイメージで起動 ● コンテナ実行はサーバレスな実行も可能 ● 処理はhttpリクエストもしくはPub/Subからのみ実行可 能 平たく言うと 7
Slide 8
Slide 8 text
Cloud Runマネージドはサーバレスでかつ、 コンテナによるランタイム環境を生成可能 8
Slide 9
Slide 9 text
Cloud Runの利点 Benefits of using Cloud Run
Slide 10
Slide 10 text
10 コンテナ実行を前提としてるので
Slide 11
Slide 11 text
freedom of language freedom of framework 言語やフレームワークはもちろんバージョンなどのコンテナで動作するなら どんなものでも選択可能
Slide 12
Slide 12 text
12 マネージドであるがゆえに
Slide 13
Slide 13 text
トラフィックによりスケーリングを 自動で行ってくれる。
Slide 14
Slide 14 text
14 様々なサービスとの連携も
Slide 15
Slide 15 text
Cloud Run Cloud SQL Cloud Memorystore Cloud VPC Cloud Scheduler Cloud Tasks Cloud Load Balancing Cloud Storage ※beta
Slide 16
Slide 16 text
弊社サービスで実際に運用してみた注意点 16 https://www.navinavi-hoken.com/ https://navinavi-shoken.com/
Slide 17
Slide 17 text
Cloud Runの注意点 Cavert of using Cloud Run
Slide 18
Slide 18 text
オートスケーリング問題
Slide 19
Slide 19 text
Cloud Runのオートスケールは以下の条件に基づく(※) ● リクエストの処理に必要な CPU の量 ● 同時実行の設定 ● コンテナ インスタンスの最大数の設定 1つ目のCPUの量というのが意外と厄介ではある。残り2つに ついては設定次第なのでもう少し説明する ※ https://cloud.google.com/run/docs/about-instance-autoscaling?hl=ja Cloud Runのオートスケールの条件 19
Slide 20
Slide 20 text
1コンテナに投げることが できる同時リクエスト数 同時実行の設定とは 同時リクエスト数を超える とスケールする
Slide 21
Slide 21 text
コンテナインスタンスの最大数の設定とは コンテナのスケールの最 大数を設定できる ・・・
Slide 22
Slide 22 text
● 最小コンテナ数は指定できない なのでアクセスが0の状態が一定時間続くとコンテナ数は最 小の0まで落ちる 更にマネージドならではの条件として 22
Slide 23
Slide 23 text
23 Q: 以上の条件から以下1日単位の リクエスト数の場合はどうなるか?
Slide 24
Slide 24 text
24
Slide 25
Slide 25 text
25 最大時と最小時にかなりの差がある
Slide 26
Slide 26 text
26 A: リクエストの最小から最大に向けて コンテナがスケールする
Slide 27
Slide 27 text
Q: Cloud Runって自動でスケーリングして くれるから問題ないのでは? 27
Slide 28
Slide 28 text
A: 半分は正解。半分は間違い。 28
Slide 29
Slide 29 text
● スケールはスケールが必要となった リクエストが派生 した段階 で行われる ● スケールが必要となった リクエストはスケールするコ ンテナで処理 される 言うなればコンテナがリクエストを受け入れる(起動)状態に なる前からリクエストは待たされる Cloud Runのオートスケール時の動作 29
Slide 30
Slide 30 text
スケールが必要な リクエストが発生 スケールするのにコンテナの 起動時間も含めてリクエストを 待機させる コンテナの起動時間までリクエストを待たせるのでRuby on Railsはイン タプリタ言語かつ重量系フレームワークであるため起動するのに早くても 10秒程度かかるためなかなか厳しい
Slide 31
Slide 31 text
Q: コンテナ同時リクエストを多く受け入れたらス ケールが抑えられるので大丈夫なのでは? 31
Slide 32
Slide 32 text
A: リクエスト数だけがスケール条件じゃない 32
Slide 33
Slide 33 text
Cloud Runのオートスケールは以下の条件に基づく(※) ● リクエストの処理に必要な CPU の量 ● 同時実行の設定 ● コンテナ インスタンスの最大数の設定 1つ目のCPUの量というのが意外と厄介ではある。残り2つに ついては設定次第なのでもう少し説明する ※ https://cloud.google.com/run/docs/about-instance-autoscaling?hl=ja Cloud Runのオートスケールの条件(再掲載 33
Slide 34
Slide 34 text
Cloud Runのオートスケールは以下の条件に基づく(※) ● リクエストの処理に必要な CPU の量 ● 同時実行の設定 ● コンテナ インスタンスの最大数の設定 1つ目のCPUの量というのが意外と厄介ではある。残り2つに ついては設定次第なのでもう少し説明する ※ https://cloud.google.com/run/docs/about-instance-autoscaling?hl=ja Cloud Runのオートスケールの条件(再掲載 34
Slide 35
Slide 35 text
要約:リクエストを受けれるコンテナでもCPUが忙し そうにしてたらスケールする 35
Slide 36
Slide 36 text
36 同じ条件で負荷をかけてもCPU効率がい い方がスケールする コンテナのCPUコア2にして同条件で負荷実験を実施
Slide 37
Slide 37 text
スケーリング問題の 対処
Slide 38
Slide 38 text
対策1: そもそもリアルタイム処理には使わず 非同期処理にのみ組み込む
Slide 39
Slide 39 text
コンテナさえ用意すれば実行できるサーバレスアーキテクチャの 利点だけ使うと割り切って、リアルタイムは別アーキテクチャで 組む 【メリット】 ● スケールの問題はほぼ関係なくなる 【デメリット】 ● サービス全体を見るとアーキテクチャが多岐に渡る可能が 出てくる スケールが問題になるならリアルタイムには使わない と割り切る案
Slide 40
Slide 40 text
対策2: 起動速度が爆速アプリケーションにす る
Slide 41
Slide 41 text
なんといってもこれがスケールする場合のクリティカルパスな のでそれを解決する案 【メリット】 ● これさえ解決すればこの問題はすべて解決する 【デメリット】 ● 使用言語およびフレームワークでは解決できない ● 解決というのはどこまでのレイテンシーを許容するか定 義が必要 一番の根本原因となっているスケール速度 ≒アプリケーション起動速度を改善する案
Slide 42
Slide 42 text
対策3: Cloud Runに仕事をさせない
Slide 43
Slide 43 text
例えば動的な処理以外に静的なものもレスポンスさせないこ とや、動的なものでもCDNでキャッシュさせる等 【メリット】 ● スケール数は抑えられる 【デメリット】 ● スケール数は抑えられるがスケール自体は抑えれない ● インフラ構成も含めてしっかりとした設計が必要 そもそもCloud Runに仕事をさせずに極力仕事を減 らす案
Slide 44
Slide 44 text
対策4: Cloud Run for Anthosを使用する
Slide 45
Slide 45 text
最大アクセス数を捌くためのコンテナ数を事前に用意する。それ をするためにCloud Run for Anthosを使用する 【メリット】 ● スケール数をほぼ抑えることが可能 ● GKEを使用することになるので常時起動のJobなども定義が 可能 【デメリット】 ● GKEが必要となりKubernetesの知識が若干必要となる ● マネージドに比べるとサービス初期などは費用が割高にな る スケールさせる必要がある場合を非常時とし、 通常時はスケールさせない案
Slide 46
Slide 46 text
対策5: マネージド版でも最小コンテナ数を指 定する(β機能)
Slide 47
Slide 47 text
No content
Slide 48
Slide 48 text
Cloud Run for Anthosと同様にマネージド版でも最小インスタン ス数を指定してオートスケールを抑える案 【メリット】 ● スケール数をほぼ抑えることが可能 【デメリット】 ● 常時インスタンスを立ち上げている状態となるので起動中 はずっと費用がかかることになる(Cloud Runマネージド版 のリクエスト時間分の課金ではなくなる) マネージドでも最小インスタンス数を指定することがで きるようになる
Slide 49
Slide 49 text
対策6: DNSラウンドロビンを使い複数の Cloud Runサービスを1つのアプリケー ションとして使う
Slide 50
Slide 50 text
稼働時間チェックなどで定期的にリクエストを送り コールドスタンバイにしない Monitoring1 (Uptime check) service1 Monitoring2 (Uptime check) service2 Monitoring3 (Uptime check) service3 example.com DNSラウンドロビンをさせて最小コンテナ数≒ サービスとして定義する
Slide 51
Slide 51 text
1サービスで最小コンテナ数を指定できないなら最小コンテナ数 分のサービスで1エンドポイントのアクセスを捌いて擬似的に最 小コンテナを設定する案 【メリット】 ● マネージドのいいとこは生かしたまま解決が可能 【デメリット】 ● DNSラウンドロビンで実現が可能か不明 DNSラウンドロビンで不可能な場合はEdgeコンピューティン グにて処理をうまいこと実装する必要がある コンテナ最小数≒サービス数としてスケールを抑える 方法案(ただし試してない)
Slide 52
Slide 52 text
まとめ STAY 適したアプリケーションや 構成をしっかり考えること インフラ管理は すごい楽 GOOD! 今回は触れてないけど非同期処 理も色々あるので注意が必要 STAY マネージドな分アンコントローラブル な部分もある BAD
Slide 53
Slide 53 text
Thanks! Does anyone have any questions? rito@chimame