Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
20180830 Merpay Microservices Platform
tjun
August 30, 2018
Technology
4
290
20180830 Merpay Microservices Platform
tjun
August 30, 2018
Tweet
Share
More Decks by tjun
See All by tjun
メルペイにおけるマイクロサービス運用の苦労と改善 / CloudNative Days Tokyo2020
tjun
16
3.8k
Incident Response / infra study 3
tjun
3
2.5k
絶え間なく変化するメルカリ・メルペイにおけるSREの組織と成長 / SRE Next 2020
tjun
6
14k
メルペイのマイクロサービスとCloud Native / CloudNative Days Kansai2019
tjun
22
21k
メルペイを支えるGKEとCloud Spanner / 2019 Google Cloud Architect Night 1
tjun
1
2k
メルペイのマイクロサービスの構築と運用 / CloudNative Days Tokyo2019
tjun
26
13k
Merpay Microservices On Microservice Platform 20190522
tjun
3
6.5k
Fastly Meetup #2 LT
tjun
0
4.6k
Ingress-GCE and its problem
tjun
0
620
Other Decks in Technology
See All in Technology
A Conditional Point Diffusion-Refinement Paradigm for 3D Point Cloud Completion
takmin
0
190
OSINT/GEOINT ワークショップ 20220514 古橋資料
furuhashilab
2
250
Power BI Premiumでデータ準備!
hanaseleb
1
180
アルプの 認証/認可分離戦略と手法
ma2k8
PRO
1
110
THETA Xの登場はジオ業界を変えるか?
furuhashilab
0
160
エンジニアと気軽に繋がれるプラットフォーム「ハッカー飯」で行った セキュリティ・モニタリングに関する取り組みについて
nobuakikikuchi
0
350
tfcon-2022-cpp
cpp
5
4.7k
長年運用されてきたモノリシックアプリケーションをコンテナ化しようとするとどんな問題に遭遇するか? / SRE NEXT 2022
nulabinc
PRO
15
7.2k
Oracle Database Technology Night #55 Oracle Autonomous Database 再入門
oracle4engineer
PRO
1
110
モダンデータスタックとかの話(データエンジニアのお仕事とは)
foursue
0
240
SRENEXT2022 組織にSREを実装していくまでの道のり
marnie0301
1
220
目と耳を持った自然言語処理 - スタートアップにおける価値創出のために
yag_ays
PRO
0
520
Featured
See All Featured
Git: the NoSQL Database
bkeepers
PRO
415
59k
Navigating Team Friction
lara
175
11k
Building Flexible Design Systems
yeseniaperezcruz
310
33k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
212
20k
Debugging Ruby Performance
tmm1
65
10k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
19
1.4k
Keith and Marios Guide to Fast Websites
keithpitt
404
21k
Side Projects
sachag
449
37k
Documentation Writing (for coders)
carmenhchung
48
2.5k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
655
120k
Adopting Sorbet at Scale
ufuk
63
7.5k
VelocityConf: Rendering Performance Case Studies
addyosmani
316
22k
Transcript
Merpay SRE @tjun の Microservice基盤
2 自己紹介 Copyright © Merpay, Inc. All Rights Reserved. @tjun
SRE Team at Merpay
3 Merpayのアーキテクチャ 01 今日の目次 02 • Microservice アーキテクチャ Microservicesの構築 •
構成管理 • CI/CD Copyright © Merpay, Inc. All Rights Reserved. 03 Microservicesの運用 • 運用の仕組みづくり • 運用体制
MerpayのMicroserviceアーキテクチャ
メルペイのアーキテクチャ概要 Clients Merpay API Gateway API ServiceA ServiceA ServiceA API
メルペイのアーキテクチャのポイント Clients Merpay API Gateway API ServiceA ServiceA ServiceA API
1. Microservices 2. GKE(Google Kubernetes Engine) 3. API Gateway
Microservices • Scaleする組織&サービスに耐えられるアーキテクチャ • 機能やデータをサービスごとに分離できる ◦ コードが分かれている(当たり前) ◦ チームが分かれている ◦
データベースが分かれている ◦ Kubernetesのnamespaceが分かれている ◦ GCPのprojectが分かれている サービスの安定性・安全性を実現するために重要
MerpayのMicroservices • ほとんどはGoで書かれている ◦ Go microservice templateのようなコードがある • gRPCでやりとり ◦
protoファイルで定義を決めて共有できる ◦ 多言語対応が比較的カンタン • APIレイヤを分離することで、各サービスはサービスの機能に専念 できる ◦ クライアントを意識するのはAPIレイヤの仕事
GKE(Google Kubernetes Engine) • Microserviceのための機能 ◦ Namespace ◦ Secret ◦
RBAC ◦ Managed Istio(まだ使ってない) • 運用が楽になるための機能 ◦ Managed kubernetes ◦ Update/Rollback ◦ Load balance & Autoscale ◦ Auto repair
Merpay API Gateway Clients Merpay API Gateway API ServiceA ServiceA
ServiceA API
Merpay API Gateway (+GLB) • RequestのRouting + Protocol transform(後述) •
共通のEndpoint処理 ◦ DDoS Protection(GLB) ◦ SSL Termination(GLB) ◦ Authentication ◦ Buffering • Observability ◦ Logging & Tracing 参考: 「API GatewayによるMicroservices化」 by deeeet
API Gatewayの特徴 • メルカリのAPI Gatewayとcoreは同じ ◦ もともとcoreがGoのpkgとして実装されている ◦ coreの上にMerpayのロジックを載せている •
API Gateway自体もGKE上に動いている • ObservabilityはMicroserviceでは重要 ◦ ErrorRateやLatancyがサービスの信頼性の指標になる
API GatewayのProtocol Transform 3rd Party Merpay API Gateway API API
Browser App gRPC HTTP + Protobuf HTTP + JSON RESTful API
メルペイのアーキテクチャのポイント Clients Merpay API Gateway API ServiceA ServiceA ServiceA API
1. Microservices 2. GKE(Google Kubernetes Engine) 3. API Gateway
Microservices Platformの構築
Microservice Platform team @mercari • Microservices Platform = GCP, GKEとその周りの仕組み
◦ MerpayのサービスはMicroservicesPlatform上に構築 • Merpay SREはPlatform側の改善にも参加する
CI/CD • CI ◦ GitHubのPRベースの開発 ◦ CircleCIまたは CloudBuildでCI ◦ GoogleDockerRegistryにImageをPush
• CD ◦ SpinnakerでKubernetesのnamespaceに対してdeploy ◦ 開発者自身がdeployを行える ◦ Canary releaseなどの機能も今後利用していく
Bootstrap & Ops with Terraform • 新たなserviceを作るとき `./script/new` コマンドで ◦
GCP Project ◦ Kubernetes namespace ◦ Sentry/Pagerduty などを作成し、紐付けするPullRequestを自動生成するstarter-kitがあ る • Databaseの追加やIAMの追加などインフラに対する変更をTerraformの コードで管理・レビューできる
GCP project for GKE Centralized cluster Namespace: Service A Namespace:
Service B IAM: SRE IAM: Team A Service A Service B RBAC: Team A RBAC: Team B Bootstrap Bootstrap IAM: Team B
Platform Security • EndPointをAPI Gatewayに集約 • Serviceごとにコードやデータを分離 • 権限を持つチームメンバをコードで管理&Review •
GCP, Kubernetes, SpinnakerなどのAudit Loggingとその監視 • 各レイヤでのセキュリティ対策や監視 ◦ Deploy, Container Image ◦ Kubernetes Cluster, Pod ◦ GCP(Database, Network)
Microservicesの運用準備
運用体制イメージ サービスに関する問題 • Error • Latency • DB • 問い合わせ
Service Alert PlatformやInfraの問題 • kubernetes • Gateway • GCPまわり Platform Alert Service Team SRE (Sinmetal) Microservice Platform Team GCP
運用の仕組みの共通化 • Microserviceでは各サービスのチームがOwnerとなって運用を進め ていく。技術選定も自由。 • とはいえ、SREや他のチームのメンバーがサポートするためには共 通化が必要 • ルールの共通化: SLO(Service
Level Objective)を決めよう • ツールの共通化: StackDriver, Datadog, Sentry, Pagerduty
運用の仕組みの共通化 • SLO: サービスが信頼できる状態かどうか判断するための指標 ◦ 例: Gatewayで測定して、あるAPIのRequestの成功率が99.99% ◦ 指標がないと、何を直すのか、いつ緊急対応するのかの判断ができない •
ツールの共通化 ◦ ログ: StackDriver & BigQuery, メトリクス: Datadog, エラー通知: Sentry, 当番通 知: Pagerduty ◦ Microservice starter-kitで自動で各サービスのTeamやProjectなどが生成され る
まとめ
まとめ merpayのSREは • MicroservicePlatformを使ったサービス運用を行うチームです • MicroservicePlatform自体の改善にも参加しています GCPやりたい人、KubernetesやMicroserviceやりたい人、DB, Network, Securityなどが 得意な人、ぜひ一緒にやりましょう!!
merpay 採用ページの SiteReliability までお願いします We are hiring!!!