【CNDT2020】Amebaアフィリエイト基盤の GKEアーキテクチャとマイクロサービス

Amebaアフィリエイト基盤の GKEアーキテクチャとマイクロサービス

小沢周平 CyberAgent, Inc. 技術本部サービスリライアビリティグループインフラエンジニア現在はAmebaの新認証基盤のEKS周りの運用を主にしています。今後はコスト可視化/負債可視化業をやっていき。

1. アーキテクチャの紹介 2. GKEのオートプロビジョニングとスケールアップ 3. gRPCのバランシングのEnvoyの設定 4. リクエストを取りこぼさないためにやったこと 5. DatadogAPMとOpenCensusでのモニタリング
後半:アプリやマイクロサービスについて

1. アーキテクチャの紹介 2. GKEのオートプロビジョニングとスケールアップ 3. gRPCのバランシングのEnvoyの設定 4. リクエストを取りこぼさないためにやったこと 5. DatadogAPMとOpencensusでのモニタリング

Backend Services:簡易版 Overview Services(Pods):gRPC GKE Ingress:HTTP MySQL Storage 外部ASP ユーザ
Kubernetes

Kubernatesを選んだ理由即応性: マイクロサービス毎に応答時間に信頼性のあるサービス提供弾力性:負荷に応じたマイクロサービス毎のスケーリング耐障害性: マイクロサービス毎にデータストアを持ちサービス提供メッセージ駆動:Pub/Subでの非同期メッセージングパターン通信即応性 Responcive メッセージ駆動
Message Driven 弾力性 Elastic 耐障害性 Responcive 社内にk8sを運用している人も多く知見もありました

GKEを選んだ理由 Kubernatesの運用が初めてだったので、一番運用がしやすいGKEを選択 KubernatesクラスターはGoogleが管理 node groupもマネージド管理クラスタアップグレードが容易 Podをdrainしてサージアップグレードをしてくれるノードの自動プロビジョニングノードプールのスペックを最適なものにしてくれるノードの自動修復
修復対象のノードが検出されるとdrainして、再作成をしてくれるその他にもKubernatesの運用を楽にする機能の有効化が簡単 EKSを構築した時にGKE がいい感じにしてくれていた事に気が付きました

Ⅰ GKEのオートプロビジョニングとスケールアップ負荷に応じてノードとPodのオートスケールをさせていますノードの自動プロビジョニング必要なリソースに合わせてノードプール単位でスケーリングしてくれます HPA 人気ブログなどでアクセスのスパイクが予想されるときは予めスケールさせます spec:
scaleTargetRef: apiVersion: apps/v1 kind: Deployment name: grpcserver minReplicas: 3 maxReplicas: 40 metrics: - type: Resource resource: name: cpu targetAverageUtilization: 80 ここではCPU使用率が閾値を超えたらPodがスケールするように設定しています。

Ⅰ HPAでスケールしたPodにリクエストが送られない負荷試験時にIngress→NodePort→Podだと負荷が偏ってしまった NEGsを有効にしてIngressから直接Podを見れるようにすることでHPAでスケールしたPodに対しても偏りなく負荷分散させることができた。 annotations: cloud.google.com/neg: '{ "ingress": true
}' 有効化もannotationを追加するだけ

gRPCのバランシングのEnvoyの設定 gRPCのバランシングのためにEnvoyをSidecarで導入しました。サービスディスカバリはHeadless Services 名前解決のレイテンシを改善する為にNodeLocalDNSCacheを有効化 control planeを導入してCanary Releaseなど出来るようにしたいお気持
ちはあります Envoy 　アプリA Envoy アプリB Inbound Inbound Outbound Outbound

可用性を高めるEnvoyの機能 Circuit Breaking 過剰なリクエストが来た時に応答不可を防ぐ Outlier Detection Podへの500系や200系の回数をみてクラスタから取り除くか制御 Health Check アプリ側でHTTPのエンドポイントをはやしてLiveness/Readiness
Prove gRPCのHealthCheckはSidecarのEnvoyからのみ叩くようにした

アクセスログの設定 access_log: - name: envoy.access_loggers.file typed_config: "@type": type.googleapis.com/envoy.extensions.access_loggers.file.v3.FileAccessLog path: "/dev/stdout"
typed_json_format: start_time: "%START_TIME%" method: "%REQ(:METHOD)%" path: "%REQ(X-ENVOY-ORIGINAL-PATH?:PATH)%" protocol: "%PROTOCOL%" response_code: "%RESPONSE_CODE%" response_flags: "%RESPONSE_FLAGS%" bytes_rcvd: "%BYTES_RECEIVED%" bytes_snt: "%BYTES_SENT%" duration: "%DURATION%" x-envoy-upstream-svc-time: "%RESP(X-ENVOY-UPSTREAM-SERVICE-TIME)%" x-forwarded-for: "%REQ(X-FORWARDED-FOR)%" useragent: "%REQ(USER-AGENT)%" x-request-id: "%REQ(X-REQUEST-ID)%" backend_address: "%UPSTREAM_HOST%" client: "%DOWNSTREAM_REMOTE_ADDRESS%" referer: "%REQ(REFERER)%" response_duration: "%RESPONSE_DURATION%" upstream_transport_failure_reason: "%UPSTREAM_TRANSPORT_FAILURE_REASON%" アプリのログの他にも、 Envoyでアクセスログを取得しています％RESPONSE_FRAGS%で RESPONSEの情報をみるぐらいに使っています

Envoyのメトリクス EnvoyのメトリクスでgRPC等のstatusなどもとれます。実際はDatadogAPMで取得したメトリクスを主に使用していますが、Envoyでのメトリクスで監視設定している部分もあるので、取得しています。 template:
metadata: annotations: ad.datadoghq.com/envoy.check_names: '["envoy"]' ad.datadoghq.com/envoy.init_configs: '[{}]' ad.datadoghq.com/envoy.instances: | [ { "stats_url": "http://%%host%%:8001/stats" } ]

共通のEnvoyイメージの用意共通で使える設定ファイルを内包したEnvoyイメージを使用 YAMLのアンカーとエイリアスで記述量を減らすようにしています。ゆくゆくはサービスの規模感や体制に合わせたcontrol planeを導入したいです type: STRICT_DNS
lb_policy: ROUND_ROBIN connect_timeout: 0.25s ignore_health_on_host_removal: true http2_protocol_options: {} health_checks: *egress_health_checks outlier_detection: *outlier_detection circuit_breakers: *circuit_breakers マイクロサービスが増えた際はclustersに書き足していく運用です。 Envoyをv1.15.0にアップグレードして、data plane apiの設定をv3に対応してあります。

実際に運用して困ったこと Pod数が増えるとヘルスチェックのgRPCアクセスが劇的に増えて、 API監視でUNKNOWNのアラートを発報してしまった。 http_filters: - name: envoy.filters.http.health_check typed_config: "@type": type.googleapis.com/envoy.extensions.filters.http.health_che
ck.v3.HealthCheck pass_through_mode: false cluster_min_healthy_percentages: self-grpc: value: 100 headers: - name: ":path" exact_match: /healthz pass_through_mode: falseにしてヘルスチェックの状態を保持し返すようにしました。 no_traﬃc_intervalを60sにし大量のヘルスチェックを飛ばさないようにしています。

1. アーキテクチャの紹介 2. GKEクラスタを本番運用にするためにやった工夫 3. GKEのオートプロビジョニングとスケールアップ 4. gRPCのバランシングのEnvoyの設定 5. リクエストを取りこぼさないためにやったこと
後半:DatadogAPMとOpencensusでのモニタリング

Ⅰ リクエストを取りこぼさないためにやったこと① アプリのGraceful Shutdown // Stop datadog exporter cleanly defer
a.datadog.Stop() go func() { _ = a.server.Serve(listenPort) }() // Wait for signal sigCh := make(chan os.Signal, 1) signal.Notify( sigCh, syscall.SIGHUP, syscall.SIGINT, syscall.SIGTERM, syscall.SIGQUIT) log.Printf("SIGNAL %d received, then shutting down...\n", <-sigCh) a.server.GracefulStop() gRPCのGraceful Shutdownを実装しました。 GracefulStop()を使っています。またDatadog Exporterにメトリクスを投げているためdeferで止めています。 terminationGracePeriodSecon dsも指定しています。

リクエストを取りこぼさないためにやったこと② SidecarのEnvoyの起動順番 1. ignore_health_on_host_removalをtrueにして、 HealthCheckの失敗を待たずにサービスディスカバリから除外 2. アプリの起動前にEnvoyを起動 3. Envoyが終了する前にアプリを終了 #!/bin/sh
wget -qO- --post-data='' http://127.0.0.1:8001/healthcheck/fail sleep 30 curl -s -o /dev/null -w '%{http_code}' http://localhost:8001/ready シェル芸でいい感じにしています

定期的なクラスタアップグレードや機能追加定期的・継続的にアップグレードや機能追加をすることでシステムの価値を維持・向上し続けることができます。そのためのリクエストを取りこぼさない工夫でした。 GKEは3つのマイナーバージョンをサポート EnvoyのDataplane APIのLifecycleは最大3つのメジャーバージョン開発スピードが早い

アーキテクチャの紹介 GKEのオートプロビジョニングとスケールアップ gRPCのバランシングのEnvoyの設定リクエストを取りこぼさないためにやったこと DatadogAPMとOpencensusでのモニタリング後半:アプリやマイクロサービスについて

Kubernatesの監視体制外形監視: Datadog Synthetic 内形監視: Datadog DeploymentのDesired/Available, PodのRestart回数 GSLBと各APIのレイテンシやStatusの監視, NodeのStatus,ノードのDisk使用量etc
ログ監視: Stackdriver Logging トレース/APM: DatadogAPM/OpenCensus 通知先: Slack/メーリングリストドキュメント管理: esa Datadogでの監視の知見が多いので使用していますDashboardをなるべく統一したいのもあります

DatadogAPMとOpenCensusでのモニタリング APM(Application Performance Monitoring)でアプリの稼働状況を監視 - DatadogのDashboardに出力したいので設定はAPMの有効化ぐらい - エンドポイント毎にLATENCYとERROR RATEが表示できる #
Enable APM and Distributed Tracing apmEnabled: true ◆Datadogはhelmﬁleで管理していますエンドポイント名

DatadogAPMとOpenCensusでのモニタリング OpenCensusでTrace,Stats情報を取得 Datadog Exporterへ送信 - StatsはPrometheus Exporterへ変更を対応中 - Agentのリソース負担を減らすため -
DogStatsD経由でメトリクスを送らないため - OpenTelemetryに移行させたい当初DatadogAPMを有効化するか、自前でJaegerをたてるか悩み、DatadogAPM のライブラリを使わずにOpencensusで取得している背景があります

OpenCensusでのStats/Tracingでとっているもの gRPC Server/Client - StatsHandlerにocgrpcのhandlerを設定するだけ HTTP Server MySQLドライバー - driverNameの設定時にocsqlでwrapするだけ
他にどんなものをとっているか教えて下さい # Server grpc.StatsHandler(&ocgrpc.ServerHandler{}) # Client grpc.WithStatsHandler(&ocgrpc.ClientHandler{}) return &http.Server{ Addr: host + port, Handler: &ochttp.Handler{ Handler: mux, }, }, listenPort ochttp.Handlerでhttp.Handlerを wrapするだけ ochttpにはHTTPヘッダやStatusを取得してくれる機能があるので、 stats/viewなどがなくても表示可能 // OpenCensus driverName, err := ocsql.Register("mysql")

次はアプリ側のおはなし

荻野陽太 CyberAgent, Inc. Ameba事業本部 AmebaPickDiv サーバサイドエンジニア新卒2年目 Ameba Pickの開発をしています

1. マイクロサービスを採用した理由 2. マイクロサービスの設計 3. システム構成について 4. マイクロサービス間でのエラーハンドリング 5. マイクロサービスのデプロイ

Ⅰ 開発初期のチーム状況サーバーチームのメンバー: 8人クラウドネイティブを使った開発経験があった人：2人ほとんどのメンバーがクラウドネイティブを使った開発経験がなかった! 手探りで開発を進めていきました

Ⅰ マイクロサービス採用した理由システム要件を洗い出したらモノリスだと辛そうだったから必要なシステム要件 • アフィリエイト広告の計測 • 成果報酬の支払い • 成果通知の受け取り
• アフィリエイト案件の管理 • 報酬レポート作成 • アフェリエイターの管理社内に採用事例があり知見もあったので採用しやすかったです外部のシステムとの連携が必要

マイクロサービスの設計 ① コンテナオーケストレーションにはKubernatesを採用 • デファクトスタンダードなので採用しない理由がなかったマイクロサービス間の通信にはgRPCを採用 • HTTP/2を使うので低レイテンシでマイクロサービス間の通信が行える •
Protoocol Buﬀersを使ったIDLでクライアント・サーバー間でスキーマを共有できる • IDLからクライアント・サーバーコードの自動生成ができる • エコシステムが充実している

マイクロサービスの設計 ② アーキテクチャにはレイヤードアーキテクチャを採用開発手法にはDDDを採用（しようとした） • 人員追加や要件追加があり途中からおざなりになった DDDの境界付けられたコンテキストによってマイクロサービスを分割開発言語にはGolangを採用 • Kotlinという案もあったが、社内での導入事例や人員採用のしやすさを踏まえ
て採用 • Golangを採用したことで結果的にかなりインフラコストを削減できた

Ⅰ バックエンドアーキテクチャユーザ Private Cloud ブログシステム Services(Pods):gRPC GKE Ingress:HTTP MySQL
Storage 外部 ASP NAT Rest API gRPC喋れない

Ⅰ システム構成ブロガー Private Cloud ブログシステム API Gateway Micro Service
A Micro Service B Micro Service C Routing SSL終端・API認証 Micro Service内でREST to gRPCの変換をしてます REST(JSON) REST(JSON)

REST to RPCの仕組み grpc-gatewayを利用している • .protoからREST to gRPCのリバースプロキシをするコードを自動生成してくれるもの •
https://github.com/grpc-ecosystem/grpc-gateway • 自動生成されたコードが各マイクロサービスに取り込まれている rpc SearchItems (SearchItemsRequest) returns (SearchItemsResponse) { option (google.api.http) = { post: "/api/affiliate_item/search_items" body: "*" }; } RESTとgRPCのマッピングをちゃんと考えると面倒なので以下のルールで統一 • POSTのみ • パス名は/api/マイクロサービス名/mathod名のスネークケース

Ⅰ 再掲: システム構成ブロガー Private Cloud ブログシステム REST(JSON) API Gateway
Micro Service A Micro Service B Micro Service C Routing SSL終端・API認証当初はここにREST to gRPCの変換を持たせようとしていました REST(JSON)

REST to RPCの仕組み当初はAPI-GatewayにREST to gRPCの変換機能を持たせようとしていたこの方法だとマイクロサービスのデプロイの度にAPI-Gatewayのデプロイが必要になり辛いのでやめた

Ⅰ マイクロサービス間でのエラーハンドリング共通のエラーコードを定義して、エラーコードを使ってエラーハンドリングをしている type ApplicationError struct { code string
message string gRPCStatusCode codes.Code } var ( UnknownError = newApplicationError("CM500003", "unknown error", codes.Internal) UnavailableError = newApplicationError("CM503001", "unavailable", codes.Unavailable) ) 共通のエラーコードの定義

Ⅰ マイクロサービス間でのエラーの伝播① 1. カスタムエラーを定義 2. カスタムエラーをProtocol Buﬀersで定義 3. エラー時アプリでカスタムエラーを返す message
ApplicationError { string code = 1; string message = 2; } type ApplicationError struct { code string message string gRPCStatusCode codes.Code } var ( UnknownError = newApplicationError("CM500003", "unknown error", codes.Internal) UnavailableError = newApplicationError("CM503001", "unavailable", codes.Unavailable) ) - エラーメッセージ - 共通のエラーコード - エラーに対応するgRPC のステータスコードを定義

Ⅰ マイクロサービス間でのエラーの伝播② 4. Server InterceptorでError Detailsにカスタムエラーを突っ込む 5. func ApplicationErrorUnaryServerInterceptor() grpc.UnaryServerInterceptor
{ return func(ctx context.Context, req interface{}, info *grpc.UnaryServerInfo, handler grpc.UnaryHandler) (interface{}, error) { res, err := handler(ctx, req) if err == nil { return res, nil } ae, ok := err.(*ApplicationError) if !ok { ae = UnknownError.Wrap(err).(*ApplicationError) } st := status.New(ae.gRPCStatusCode, ae.Message()) if st, _ := st.WithDetails(&commonpb.ApplicationError{ Message: ae.message, Code: ae.code, }); st != nil { return nil, st.Err() } return nil, st.Err() } } エラーが起きたらエラーをProtoでシリアライズして詰めているエラーに対応するgRPCステータスコードを設定している

Ⅰ マイクロサービス間でのエラーの伝播③ 5. Client InterceptorでError Detailsからカスタムエラーを取り出す func ApplicationErrorUnaryClientInterceptor() grpc.UnaryClientInterceptor {
return func(ctx context.Context, method string, req, reply interface{}, cc *grpc.ClientConn, invoker grpc.UnaryInvoker, opts ...grpc.CallOption) error { err := invoker(ctx, method, req, reply, cc, opts...) if err == nil { return nil } st := status.Convert(err) for _, d := range st.Details() { switch t := d.(type) { case *commonpb.ApplicationError: return newApplicationError(t.GetCode(), t.GetMessage(), st.Code()) } } //不明なエラー return UnknownError.Wrap(err) } } Error DetailからProtoでシリアライズされたエラーを取り出してデシリアライズしている

マイクロサービスのデプロイブランチモデルにはGithub-Flowを採用 CIOpsを採用 • CI/CDに時間をかけたくなかった • Manifestとアプリケーションコードを同一リポジトリで管理している • CIにK8sの強い権限を渡たす必要があったり、Manifestの軽微な変更でもイメージのビルドが走るなどの課題もある...
将来的にはGitOps に移行していきたいと考えています

CI/CDパイプライン GCR 本番クラスタステージングクラスタステージング本番 PRマージ反映反映
イメージ作成タグ追加 gitタグ作成パラメータに作成したイメージのタグ名が渡される

Manifestの管理最初はKustomizeを使っていた... • yaml差分を書くのが面倒臭い • 使い回しがしづらい • Command Lineからパラメータを渡せないのが辛い結局Helmを採用した
• Kustomizeに比べて学習コストが高いが一度Chartを作れば使いまわせる！ • Command Lineからパラメータを渡せる！

Secretsの管理最初はkubesecを利用 • Secret の構造を保ったまま値だけ暗号化してくれるもの • https://github.com/shyiko/kubesec 現在はhelm-secretsを採用 • HelmのPlugin
• HelmのValuesファイルを暗号化してくれるもの • デプロイも簡単! helm install が helm secrets installになるだけ • https://github.com/zendesk/helm-secrets External Secretsを採用するのもアリだったかも...

ご清聴ありがとうございました

CAではSRE・バックエンドエンジニアを募集しています https://www.cyberagent.co.jp/careers/

【CNDT2020】Amebaアフィリエイト基盤の GKEアーキテクチャと マイクロサービス

【CNDT2020】Amebaアフィリエイト基盤の GKEアーキテクチャと マイクロサービス

More Decks by youta ogino

Other Decks in Technology

Featured

Transcript

【CNDT2020】Amebaアフィリエイト基盤の GKEアーキテクチャとマイクロサービス

【CNDT2020】Amebaアフィリエイト基盤の GKEアーキテクチャとマイクロサービス