Slide 1

Slide 1 text

@keke
 2019/09/25
 Engineer’s Meetup for Students


Slide 2

Slide 2 text

自己紹介
 01 02 03 学生時代のエンジニア経験 2年前のメルカリとの接点からメルペイ入社まで話 What’s SRE
 メルペイ SREではどんな技術を使って、どんなことをしてるの? 新卒SREは日頃、何をしているのか メルペイ SREと自分は何をしてるのか
 Backend EngineerやML Engineerとかって馴染みあるけど、SREって? 2 Outlines for Today


Slide 3

Slide 3 text

自己紹介
 3

Slide 4

Slide 4 text

4 Keke (Twitter: @_k_e_k_e)
 2017.3 Mercari BOLD Internship in USA 2019.4- Merpay, New Graduate (SRE Team)

Slide 5

Slide 5 text

5 Mercari Tech Blog

Slide 6

Slide 6 text

6 Meetup パネラーとして登壇@2019/09/11 


Slide 7

Slide 7 text

7 Meetup GCPUG Yokohama
 勤怠を自動化する技術 
 Ansible Night


Slide 8

Slide 8 text

2017.3
 
 第一期生
 2019.4
 
 BOLD Internship in USA 
 メルカリ Join
 メルカリ外で
 色々な長期&短期インターン 
 2019.2
 
 ここで興味が湧き、Joinを検討。 
 応募する。
 メルペイ機能リリース 
 8 エンジニア経験とメルカリ・メルペイとの接点
 (Backend, SRE, iOS, Blockchain, Hardware) 
 2019.6
 
 メルペイ SRE 
 Join


Slide 9

Slide 9 text

9 約2年間なにも接点がなかったが、 
 メルペイリリースのタイミングなどの理由で就職した「母川回帰タイプ」 
 イラスト: https://en.wikipedia.org/wiki/Chum_salmon#/media/File:Salmo_salar_GLERL_1.jpg
 エンジニア経験とメルカリ・メルペイとの接点


Slide 10

Slide 10 text

メルペイのMission、事業内容の共感でき、
 業界への世間の注目度が非常に高い点
 MercariのSREのプレゼンスは非常に高い点
 SREが守る金融事業は
 技術レベルの要求が高く、幅広い点
 01 02 03 10 なぜ入社したか、3つのPoint


Slide 11

Slide 11 text

What’s SRE
 11

Slide 12

Slide 12 text

Site Reliability Engineering
 ・Googleが最初に作ったエンジニアの職種(SRE) 
 
 “Site Reliability Engineeringとは、ある組織が、組織のシステム、サービスやプロダクト適切な信頼性のレ ベルを勝ち得るまで貢献するエンジニア工学の概念である” 
 (SRE Essentials https://speakerdeck.com/jhand/sre-essentials?slide=8)
 12 What’s SRE


Slide 13

Slide 13 text

13 What’s SRE
 引用: “What’s the Difference Between DevOps and SRE?” 
 https://www.youtube.com/watch?v=uTEL8Ff1Zvk&list=PLIivdWyY5sqJrKl7D2u-gmis8h9K66qoj&index=2&t=0s
 
 


Slide 14

Slide 14 text

14 What’s SRE
 「信頼性は一つの機能」
 SLO (サービスレベル目標) とエラーバジェットを元にDeveloperと交渉をする。
 
 例: 
 
 99.99%のAvailabilityをSLOとするサービスならば、約4分/月のダウンタイムが許される。
 
 4分を超えるダウンタイムが発生する機能などはSREはリリースを許可しない。
 それをソフトウェア的な問題と捉え、改善などをはかる。
 
 


Slide 15

Slide 15 text

15 What’s SRE
 詳しく知りたい人へ
 『SRE サイトリライアビリティエンジニアリング 
 ―Googleの信頼性を支えるエンジニアリングチーム』
 
 https://amzn.to/2Qay281
 
 


Slide 16

Slide 16 text

メルペイ SREと自分は何をしてるのか
 16

Slide 17

Slide 17 text

メルペイ SRE チーム
 17

Slide 18

Slide 18 text

#mercari_merpay_sre_msp Merpay SRE Responsibility ● メルペイという金融サービスのReliability ● 開発者がReliabilityを実現するための仕組みづくり Projects ● メルペイのインフラの構築・運用 ● メルペイのマイクロサービスのReliability(リリース・監視) ● メルペイのマイクロサービスのOperationと改善(自動化、ツール化) 参考資料: 「メルペイのマイクロサービスの構築と運用 / Cloud Native Days 2019」

Slide 19

Slide 19 text

#mercari_merpay_sre_msp マイクロサービスアーキテクチャ 参考資料: 「メルペイのマイクロサービスの構築と運用 / Cloud Native Days 2019」

Slide 20

Slide 20 text

自分
 20

Slide 21

Slide 21 text

#mercari_merpay_sre_msp My Project Improve Observability ● Cloud Spannerのモニタリング ● Kubernetesのネットワークスタッツの取得、および可視化 ● PagerDutyを使ったオンコール対応の監視 ● Terraformによる宣言的なモニタリングダッシュボードの作成 モニタリングダッシュボードにはDatadogを使用

Slide 22

Slide 22 text

#mercari_merpay_sre_msp 1. Cloud Spannerのモニタリング Cloud Spannerとは ● Google Cloud Platformだけで独自に提供されているデータベース ● “グローバルおよびリージョナル アプリケーション データ向けのスケーラブルなフルマネージ ド リレーショナル データベース サービス” 何をしているのか ● GAEとCloud Dataflowをあわせたバックアップ運用、およびその監視 ● インスタンスやデータベースのリソース監視 ● 監視はDatadogを使い、そのDashboardにはTerraformを使用

Slide 23

Slide 23 text

#mercari_merpay_sre_msp 2. Kubernetesのネットワークスタットの取得、可視化 ネットワークスタットって ● ラウンドトリップレイテンシをはじめ、 DNSルックアップ時間やTCPコネクション時間などの 統計情報のこと ● 一般的なRPCであるHTTP/1.1 や 、HTTP/2.0の上で構築されているgRPCを対象としてい る なんでしているのか ● レイテンシ増加など、ネットワークに関する問題がたまにある ○ 問題をドリルダウンして、早期の原因特定のため ● すべてのPodの実行環境が同環境ではないので、環境ごとの差異を知るため ○ リージョンやゾーンなどの地理的環境 ○ ホストのCPUやメモリなどのリソース環境など

Slide 24

Slide 24 text

#mercari_merpay_sre_msp 日頃、どんな技術を普段使ってる?

Slide 25

Slide 25 text

15% 35% 50% おおまかに、ここ最近の時間比率
 25

Slide 26

Slide 26 text

#mercari_merpay_sre_msp IT全体で SREはどんどん増えているため 選択肢の一つとして魅力的! なんでも聞いてください :)

Slide 27

Slide 27 text

(余談) フレックス制について
 27

Slide 28

Slide 28 text

#mercari_merpay_sre_msp 突然ですが... 朝型の人っていますか?

Slide 29

Slide 29 text

#mercari_merpay_sre_msp フレックス制(コアタイム12:00 - 16:00)は 不安だった...

Slide 30

Slide 30 text

コアタイム外に予定入ったりするかも?
 01 02 タスクで夜遅くまでいないといけなくなる?
 30 想定していた主な不安


Slide 31

Slide 31 text

コアタイム外に予定入ったりするかも?
 01 02 ミーティングなど基本は入らない。 適切な理由があれば入ることもあるが、滅多にない。 タスクで夜遅くまでいないといけなくなる?
 早急に対応が必要でないときは「これ、明日でいいですよ」など 一言いってくれる人が多い。 フレックス制が広く浸透していると感じている。 31 想定していた主な不安


Slide 32

Slide 32 text

#mercari_merpay_sre_msp 働きやすい = 生活がしやすい

Slide 33

Slide 33 text

Thank you!
 33 Keke Twitter: @_k_e_k_e