Slide 1

Slide 1 text

メルカリグループにおけるSREs @deeeeet, @foostan at SRE NEXT 2022

Slide 2

Slide 2 text

No content

Slide 3

Slide 3 text

Embedded SRE at Mercari

Slide 4

Slide 4 text

Taichi Nakashima @deeeet / @tcnksm Engineering head of Developer Productivity Engineering

Slide 5

Slide 5 text

https://e34.fm

Slide 6

Slide 6 text

Product A Team Mercari SRE Merpay SRE Service A Product B Team Service B Product C Team Service C Work closely or embedded Platform Platform Team Infrastructure organization

Slide 7

Slide 7 text

SRE vs. Platform Engineering
 ● SRE: Production operation, ROAD(*) ● Platform Engineering: Developer productivity & experience (*) Response, Observability, Availability, and Delivery

Slide 8

Slide 8 text

Missions
 ● Support product teams to improve service reliability ● Spread SRE practices across the organization ● Enable Platform toolings

Slide 9

Slide 9 text

Product A Team Mercari SRE Product B Team ① Assignment ② Work ③ Rotation Embedding System

Slide 10

Slide 10 text

The Works
 ● Search Infra Team ● Monolith API Team

Slide 11

Slide 11 text

Mercari Search Architecture

Slide 12

Slide 12 text

Service C Monolith Service B Service E Service A Mercari and Merpay Microservices Google Kubernetes Engine On premise Service D Monolith Physical machines Monolith Cloud Migration Migration

Slide 13

Slide 13 text

The Works
 ● SRE伝道師としてMicroservices SRE チームが取り組んでいる事例 ● Kubernetes HPA External Metrics の事例紹介 ● MicroservicesSREのEmbedded先でのお仕事 ● Elasticsearch運用ノウハウ

Slide 14

Slide 14 text

The Works
 ● SRE伝道師としてMicroservices SRE チームが取り組んでいる事例 ● Kubernetes HPA External Metrics の事例紹介 ● MicroservicesSREのEmbedded先でのお仕事 ● Elasticsearch運用ノウハウ

Slide 15

Slide 15 text

Future
 ● Embedded to the division, instead of the team ● Transforming SRE knowledge into the toolings

Slide 16

Slide 16 text

Merpay SRE Teamが目指すもの foostan

Slide 17

Slide 17 text

JP Development Engineering Mgmt Merpay SRE Team キーボードの人 foostan / Kosuke Adachi

Slide 18

Slide 18 text

信用を創造して、
 なめらかな社会を創る
 MISSION 18

Slide 19

Slide 19 text

メルペイのサービス規模 70 microservices 1000 pods 1000 万人 マイクロサービスアーキテク チャを採用、70以上のマイ クロサービス
 1000万人以上の利用者
 ※メルペイ「電子マネー」の登録を行ったユーザ と「メルペイコード決済」「ネット決済」「メルペイス マート払い(翌月払い・定額払い)」等の利用者 の合計(重複を除く)2021年12月末時
 1000を超えるKubernetes pods
 


Slide 20

Slide 20 text

Merpay SRE Teamとして意識していること 当たり前のようにメルペイを使えるようにする メルペイを利用するお客さまにとって最も重要なことは「信頼性」 が高いこと メルペイは金融サービスなので高い信頼性が求められる → いつでも使えて当たり前 → 素早いレスポンスは当たり前 → お金が正しいのが当たり前

Slide 21

Slide 21 text

信頼性を高めることはサービス成長を妨げる? サービス成長 信頼性 新機能、チャレンジ、変化 改善、対応、維持

Slide 22

Slide 22 text

サービス成長を支えるSREの様々な領域 サービス成長 信頼できるインフラ 新機能、チャレンジ、変化 開発者の生 産性向上 セキュリティ、法的要件、監査、 SLO、道を踏 み外さないためのガードレール リスクの検知 リスクの除外 障害 サ ー ビ ス の 監 視

Slide 23

Slide 23 text

Merpay SRE Teamが目指すもの 信頼できる インフラ マイクロ サービスへ の支援 開発者の 生産性向上 金融サービスを支える、信 頼できるインフラを提供す る。 開発者の生産性を向上し、 サービス成長を加速させ る。 マイクロサービスを運用す る上での課題を解決する。

Slide 24

Slide 24 text

信頼できるインフラ サービス成長 信頼できるインフラ 新機能、チャレンジ、変化 金融サービスを支えるインフラ マルチCDN/Cloud対応 Observabilityの改善 セキュリティ強化、監査ログ 高可用性 災害対策 高セキュリティ スケーラブル

Slide 25

Slide 25 text

マイクロサービスへの支援 Embedded SRE SLOベースの運用 パフォーマンス改善 CI/CD Production-Ready guard rails Chaos Engineering セキュリティ、法的要件、監査、 SLO、道を踏 み外さないためのガードレール リスクの検知 リスクの除外 障害 サ ー ビ ス の 監 視 サービス成長 新機能、チャレンジ、変化

Slide 26

Slide 26 text

開発者の生産性の向上 サービス成長 新機能、チャレンジ、変化 健康的なオンコール Playbookの整備 SLOベースのアラート インシデントから学ぶ 不要なアラートが発生しない 整備された運用手順と自動化 開発者の生 産性向上

Slide 27

Slide 27 text

まとめ ● Merpay SRE Teamとして意識すること ○ 当たり前のようにメルペイを使えるようにする ● サービス成長を支えるSREの様々な領域 ○ 信頼性を高めることはサービスの成長を妨げるものではない ○ SREはサービス開発以外のすべてに寄与する ● Merpay SRE Teamが目指すもの ○ 信頼できるインフラ ○ マイクロサービスへの支援 ○ 開発者の生産性向上

Slide 28

Slide 28 text

We are hiring https://sre-next.dev/2022/jobs オンラインブースも出展しているので、お 気軽にお越しください