複数環境でマイクロサービスを共用するためのプロトコル非依存なコンテクスト伝播 / PiCoP ja

複数環境でマイクロサービスを共用するためのプロトコル非依存なコンテクスト伝播尾上寛弥　小谷大祐　岡部寿男京都大学 https://speakerdeck.com/hiroyaonoe/picop-ja 1

背景：本番環境を模倣した環境継続的インテグレーション/継続的デリバリーにおいてテスト/ステージング/デバッグ/プレビュー環境が必要 →本番環境よりアクセスが少なくリソースが無駄になりやすいマイクロサービスアーキテクチャ１つのアプリケーションが複数のマイクロサービスで構成される →サービス数が多い分　さらにリソースの無駄が大きい
2

背景：コンテクスト伝播を用いたマイクロサービス共用本番環境から変更されたサービス・状態を持つサービス以外は共用可能 →複数環境で同じマイクロサービスを共用することでリソース削減　(Wantedly, Mercari, Lyft, Ambassador Labsがそれぞれ提案) 1. 環境を識別するコンテクストをリ
クエストに付与して伝播 2. プロキシがリクエストを適切な環境に振り分け 3

背景：コンテクスト伝播を用いたマイクロサービス共用 HTTPヘッダやgRPCメタデータにコンテクスト付与 1. OpenTelemetryを用いてコンテクスト伝播 2. EnvoyやIstioを用いてリクエスト振り分け課題伝播・振り分けが特定のプロトコルに依存 -
他プロトコルでは利用不可 - プロトコルごとに計装が必要 4

関連研究：コンテクスト伝播分散システムのトレーシングコンテクストを実際のリクエストに付与して伝播することでトレース (Dapper, Pinpoint, X-Trace, Pip, Canopy) コンテクスト伝播の共通化様々なトレーシング手法におけるコンテクスト伝播の仕組みを
共通化することでシステムへの計装を軽減する提案 (Tracing Plane, Canopy, Pivot Tracing, Pythia) →いずれも特定の通信プロトコルやプラットフォームに依存 5

提案手法：PiCoP アプリケーション層プロトコルに非依存でコンテクスト伝播・リクエスト振り分けをするフレームワークプロトコルアプリケーション層プロトコルを解釈せずコンテクストを伝播プロキシプロトコルを利用しリクエストを適切な環境へ振り分け 6

提案手法：PiCoPプロトコル TCPペイロードの先頭にコンテクストを付与 →アプリケーション層プロトコルの種類に関係なく利用可能 PROXY Protocol V2のシグネチャを利用 →アプリケーション層プロトコルと競合しない PROXY Protocol リバースプロキシサーバーを介した際の送信元クライアント情報を
プロトコル非依存で伝播可能にする →本提案の目的と似ている　伝播すべき情報の内容・形式が異なることから　そのままは利用せず、参考にしている 7

提案手法：PiCoPプロトコル OpenTelemetryが定めた規格に準拠 →アプリケーションへの計装が容易 →他の目的でのコンテクスト伝播に利用しやすい OpenTelemetry 分散トレーシングに関連する規格・ライブラリを整備しているコンテクスト伝播の仕組みを標準化する規格・ライブラリを提供 PiCoPプロトコルを用いて環境を識別するID(環境ID)をリクエストに付与して伝播
8

提案手法：PiCoP プロキシ任意のアプリケーション層プロトコルのリクエストを環境IDに基づいて適切な環境へと振り分け環境IDと振り分け先の対応関係(経路情報)を事前に受け取るデフォルトの経路を共用のサービスに設定環境固有のサービスがあるなら固有のサービスに設定 9

実装プロキシコントローラープロキシと経路情報をDBで管理管理者から情報を受け取る各プロキシに情報を送信プロキシのスケールアウトに対応 →大規模なクラスタでの使用 10

評価・考察：プロキシの通信遅延 11 nginxサーバーに対してペイロード1kBのHTTPリクエストを送信 10秒間で合計10000リクエストの応答時間を計測同時コネクション接続数を1~64まで変化させる HTTPヘッダ or PiCoPプロトコルに”Env-Id:Main”のコンテクストを付与 4つの条件　PiCoPプロキシがある
vs. ない　　　PiCoPプロキシ vs. Istioプロキシ

PiCoPプロキシがない場合との比較 (base vs. base+picop) 評価・考察：プロキシの通信遅延 12 3.2ms~12.3ms 遅い 6.7ms~13.3ms 遅い

Istioプロキシとの比較 (base+gw+istio vs. base+gw+picop) 既存手法で広く利用されるIstioとほぼ同等 →PiCoPプロキシによる遅延は実用的な範囲内評価・考察：プロキシの通信遅延 13 ほぼ同等 0.3~2.7ms遅い

nginxサーバーに継続的にHTTPリクエストを送信して負荷をかける全てのコンテナのCPU使用率が80%以下になるようにスケールアウトプロキシとnginxサーバーの合計コンテナ数を比較各コンテナのリソース制限量は vCPU数0.1、メモリ128MiB 環境数は1~100で変化させる環境数と同じ数のクライアントからリクエスト送信全環境合計の秒間リクエスト数 100と1000で計測
14 評価・考察：共用によるリソース削減

一定以上の環境数だと共用した場合の方が削減　環境数が大きいほど削減量も大きい 15 評価・考察：共用によるリソース削減

評価・考察：プロトコル非依存の程度・制約サービス間伝播オプションデータを付与できないものを含む任意のアプリケーション層プロトコルで、共通の仕組みを用いたコンテクスト伝播が可能コネクションの再利用に制約あり(例：HTTPの持続的接続) 　TCPコネクションを毎回確立するオーバーヘッドトランスポート層プロトコルごとにプロキシを実装する必要あり　TCP以外にもUDPやQUICなどで利用可能 16 オプションデータを付与できないプロトコル
オプションデータを付与できるプロトコル MySQL, PostgreSQL, Memcached, Redis, MongoDB Wire Protocol, MQTT, Kafka Wire Protocol, TDS(Microsoft SQL Server) HTTP, gRPC, AMQP, Cassandra Native Protocol

サービス内伝播アプリのリクエスト処理の途中にあるサービス(例：Webサーバー)には既存手法と同様に計装が必要評価・考察：プロトコル非依存の程度・制約 17 プロトコルごとに計装用ライブラリが必要共通のOpenTelemetryライブラリを用いて計装可能

評価・考察：プロトコル非依存の程度・制約サービス内伝播アプリのリクエスト処理の末端にあるサービス(例：データベース)には計装の必要なし 18 非同期処理(例：メッセージキュー) では処理の特性に合わせて環境を分離するためにPiCoPプロキシを拡張する必要ありプロキシを
拡張

まとめ・今後の課題まとめ - プロトコル非依存でのマイクロサービス共用を実現するPiCoPを提案 - アプリケーション層プロトコルを解釈せずコンテクストを伝播するプロトコル - プロトコルを利用してリクエストを適当な環境へ振り分けるプロキシ
- 通信遅延やリソース削減の点で実用性を示した - コネクション再利用や非同期処理における制約を示した - OSSとして公開( https://github.com/picop-rd ) 今後の課題 - 上記の制約の改善 - 大規模なクラウドスケールでの評価 - PiCoPプロトコルが他の目的にどの程度応用可能かの評価 https://speakerdeck.com/hiroyaonoe/picop-ja 19

複数環境でマイクロサービスを共用するためのプロトコル非依存なコンテクスト伝播 / PiCoP ja

複数環境でマイクロサービスを共用するためのプロトコル非依存なコンテクスト伝播 / PiCoP ja

Hiroya Onoe

More Decks by Hiroya Onoe

Other Decks in Research

Featured

Transcript

複数環境でマイクロサービスを共用するためのプロトコル非依存なコンテクスト伝播尾上寛弥　小谷大祐　岡部寿男京都大学 https://speakerdeck.com/hiroyaonoe/picop-ja 1

実装プロキシコントローラープロキシと経路情報をDBで管理管理者から情報を受け取る各プロキシに情報を送信プロキシのスケールアウトに対応 →大規模なクラスタでの使用 10

PiCoPプロキシがない場合との比較 (base vs. base+picop) 評価・考察：プロキシの通信遅延 12 3.2ms~12.3ms 遅い 6.7ms~13.3ms 遅い

Istioプロキシとの比較 (base+gw+istio vs. base+gw+picop) 既存手法で広く利用されるIstioとほぼ同等 →PiCoPプロキシによる遅延は実用的な範囲内評価・考察：プロキシの通信遅延 13 ほぼ同等 0.3~2.7ms遅い

一定以上の環境数だと共用した場合の方が削減　環境数が大きいほど削減量も大きい 15 評価・考察：共用によるリソース削減