Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20180830 Merpay Microservices Platform
Search
tjun
August 30, 2018
Technology
4
360
20180830 Merpay Microservices Platform
tjun
August 30, 2018
Tweet
Share
More Decks by tjun
See All by tjun
CloudNative環境におけるトラブルシューティングガイド / CloudNative Days Tokyo 2023
tjun
6
1.7k
2023-12-07 SRE Talk クラウドと長く付き合う
tjun
0
130
インシデント対応を改善しよう/2024 TechFeed Experts Night 17
tjun
1
310
メルペイにおけるマイクロサービス運用の苦労と改善 / CloudNative Days Tokyo2020
tjun
16
4.2k
Incident Response / infra study 3
tjun
3
3k
絶え間なく変化するメルカリ・メルペイにおけるSREの組織と成長 / SRE Next 2020
tjun
6
17k
メルペイのマイクロサービスとCloud Native / CloudNative Days Kansai2019
tjun
22
22k
メルペイを支えるGKEとCloud Spanner / 2019 Google Cloud Architect Night 1
tjun
1
2.2k
メルペイのマイクロサービスの構築と運用 / CloudNative Days Tokyo2019
tjun
26
15k
Other Decks in Technology
See All in Technology
ChatGPT for IT Service Management (IT Pro)
dahatake
7
1.5k
20240418_Google ColabにLLMが搭載されたようなのでPython x データ分析の勉強方法を考えてみる
doradora09
0
120
KubeConにproposalを送りたい人へのアドバイス
sat
PRO
3
240
長期運用プロジェクトでのMySQLからTiDB移行の検証
colopl
2
840
FrontDoorとWebAppsを組み合わせた際のリダイレクト処理の注意点
kenichirokimura
1
500
ExaDB-D dbaascli で出来ること
oracle4engineer
PRO
0
2.1k
コードを書く隙間を見つけて生きていく技術/Findy 思考の現在地
fujiwara3
27
5.9k
Google Cloud Next '24でブログを10本書いた方法と勉強会を沸かせた方法
yasumuusan
0
290
アクセシビリティを考慮したUI/CSSフレームワーク・ライブラリ選定
yajihum
2
1k
テストプロセスで大事にしていること #jasstnano
makky_tyuyan
0
160
反実仮想機械学習とは何か
usaito
PRO
11
4.2k
Compose Compiler Metricsを使った実践的なコードレビュー
tomorrowkey
1
220
Featured
See All Featured
Java REST API Framework Comparison - PWX 2021
mraible
PRO
18
6.9k
Embracing the Ebb and Flow
colly
80
4.1k
Navigating Team Friction
lara
178
13k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
227
16k
Music & Morning Musume
bryan
41
5.6k
The Invisible Customer
myddelton
114
12k
Debugging Ruby Performance
tmm1
70
11k
Building a Modern Day E-commerce SEO Strategy
aleyda
17
6.4k
Git: the NoSQL Database
bkeepers
PRO
422
63k
YesSQL, Process and Tooling at Scale
rocio
164
13k
What's new in Ruby 2.0
geeforr
337
31k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
659
120k
Transcript
Merpay SRE @tjun の Microservice基盤
2 自己紹介 Copyright © Merpay, Inc. All Rights Reserved. @tjun
SRE Team at Merpay
3 Merpayのアーキテクチャ 01 今日の目次 02 • Microservice アーキテクチャ Microservicesの構築 •
構成管理 • CI/CD Copyright © Merpay, Inc. All Rights Reserved. 03 Microservicesの運用 • 運用の仕組みづくり • 運用体制
MerpayのMicroserviceアーキテクチャ
メルペイのアーキテクチャ概要 Clients Merpay API Gateway API ServiceA ServiceA ServiceA API
メルペイのアーキテクチャのポイント Clients Merpay API Gateway API ServiceA ServiceA ServiceA API
1. Microservices 2. GKE(Google Kubernetes Engine) 3. API Gateway
Microservices • Scaleする組織&サービスに耐えられるアーキテクチャ • 機能やデータをサービスごとに分離できる ◦ コードが分かれている(当たり前) ◦ チームが分かれている ◦
データベースが分かれている ◦ Kubernetesのnamespaceが分かれている ◦ GCPのprojectが分かれている サービスの安定性・安全性を実現するために重要
MerpayのMicroservices • ほとんどはGoで書かれている ◦ Go microservice templateのようなコードがある • gRPCでやりとり ◦
protoファイルで定義を決めて共有できる ◦ 多言語対応が比較的カンタン • APIレイヤを分離することで、各サービスはサービスの機能に専念 できる ◦ クライアントを意識するのはAPIレイヤの仕事
GKE(Google Kubernetes Engine) • Microserviceのための機能 ◦ Namespace ◦ Secret ◦
RBAC ◦ Managed Istio(まだ使ってない) • 運用が楽になるための機能 ◦ Managed kubernetes ◦ Update/Rollback ◦ Load balance & Autoscale ◦ Auto repair
Merpay API Gateway Clients Merpay API Gateway API ServiceA ServiceA
ServiceA API
Merpay API Gateway (+GLB) • RequestのRouting + Protocol transform(後述) •
共通のEndpoint処理 ◦ DDoS Protection(GLB) ◦ SSL Termination(GLB) ◦ Authentication ◦ Buffering • Observability ◦ Logging & Tracing 参考: 「API GatewayによるMicroservices化」 by deeeet
API Gatewayの特徴 • メルカリのAPI Gatewayとcoreは同じ ◦ もともとcoreがGoのpkgとして実装されている ◦ coreの上にMerpayのロジックを載せている •
API Gateway自体もGKE上に動いている • ObservabilityはMicroserviceでは重要 ◦ ErrorRateやLatancyがサービスの信頼性の指標になる
API GatewayのProtocol Transform 3rd Party Merpay API Gateway API API
Browser App gRPC HTTP + Protobuf HTTP + JSON RESTful API
メルペイのアーキテクチャのポイント Clients Merpay API Gateway API ServiceA ServiceA ServiceA API
1. Microservices 2. GKE(Google Kubernetes Engine) 3. API Gateway
Microservices Platformの構築
Microservice Platform team @mercari • Microservices Platform = GCP, GKEとその周りの仕組み
◦ MerpayのサービスはMicroservicesPlatform上に構築 • Merpay SREはPlatform側の改善にも参加する
CI/CD • CI ◦ GitHubのPRベースの開発 ◦ CircleCIまたは CloudBuildでCI ◦ GoogleDockerRegistryにImageをPush
• CD ◦ SpinnakerでKubernetesのnamespaceに対してdeploy ◦ 開発者自身がdeployを行える ◦ Canary releaseなどの機能も今後利用していく
Bootstrap & Ops with Terraform • 新たなserviceを作るとき `./script/new` コマンドで ◦
GCP Project ◦ Kubernetes namespace ◦ Sentry/Pagerduty などを作成し、紐付けするPullRequestを自動生成するstarter-kitがあ る • Databaseの追加やIAMの追加などインフラに対する変更をTerraformの コードで管理・レビューできる
GCP project for GKE Centralized cluster Namespace: Service A Namespace:
Service B IAM: SRE IAM: Team A Service A Service B RBAC: Team A RBAC: Team B Bootstrap Bootstrap IAM: Team B
Platform Security • EndPointをAPI Gatewayに集約 • Serviceごとにコードやデータを分離 • 権限を持つチームメンバをコードで管理&Review •
GCP, Kubernetes, SpinnakerなどのAudit Loggingとその監視 • 各レイヤでのセキュリティ対策や監視 ◦ Deploy, Container Image ◦ Kubernetes Cluster, Pod ◦ GCP(Database, Network)
Microservicesの運用準備
運用体制イメージ サービスに関する問題 • Error • Latency • DB • 問い合わせ
Service Alert PlatformやInfraの問題 • kubernetes • Gateway • GCPまわり Platform Alert Service Team SRE (Sinmetal) Microservice Platform Team GCP
運用の仕組みの共通化 • Microserviceでは各サービスのチームがOwnerとなって運用を進め ていく。技術選定も自由。 • とはいえ、SREや他のチームのメンバーがサポートするためには共 通化が必要 • ルールの共通化: SLO(Service
Level Objective)を決めよう • ツールの共通化: StackDriver, Datadog, Sentry, Pagerduty
運用の仕組みの共通化 • SLO: サービスが信頼できる状態かどうか判断するための指標 ◦ 例: Gatewayで測定して、あるAPIのRequestの成功率が99.99% ◦ 指標がないと、何を直すのか、いつ緊急対応するのかの判断ができない •
ツールの共通化 ◦ ログ: StackDriver & BigQuery, メトリクス: Datadog, エラー通知: Sentry, 当番通 知: Pagerduty ◦ Microservice starter-kitで自動で各サービスのTeamやProjectなどが生成され る
まとめ
まとめ merpayのSREは • MicroservicePlatformを使ったサービス運用を行うチームです • MicroservicePlatform自体の改善にも参加しています GCPやりたい人、KubernetesやMicroserviceやりたい人、DB, Network, Securityなどが 得意な人、ぜひ一緒にやりましょう!!
merpay 採用ページの SiteReliability までお願いします We are hiring!!!