Mercari Engineer Meetup

46fdd2ebc85d68659b83d5eb5c6a49aa?s=47 Keke
September 25, 2019

Mercari Engineer Meetup

46fdd2ebc85d68659b83d5eb5c6a49aa?s=128

Keke

September 25, 2019
Tweet

Transcript

  1. @keke
 2019/09/25
 Engineer’s Meetup for Students


  2. 自己紹介
 01 02 03 学生時代のエンジニア経験 2年前のメルカリとの接点からメルペイ入社まで話 What’s SRE
 メルペイ SREではどんな技術を使って、どんなことをしてるの?

    新卒SREは日頃、何をしているのか メルペイ SREと自分は何をしてるのか
 Backend EngineerやML Engineerとかって馴染みあるけど、SREって? 2 Outlines for Today

  3. 自己紹介
 3

  4. 4 Keke (Twitter: @_k_e_k_e)
 2017.3 Mercari BOLD Internship in USA

    2019.4- Merpay, New Graduate (SRE Team)
  5. 5 Mercari Tech Blog

  6. 6 Meetup パネラーとして登壇@2019/09/11 


  7. 7 Meetup GCPUG Yokohama
 勤怠を自動化する技術 
 Ansible Night


  8. 2017.3
 
 第一期生
 2019.4
 
 BOLD Internship in USA 


    メルカリ Join
 メルカリ外で
 色々な長期&短期インターン 
 2019.2
 
 ここで興味が湧き、Joinを検討。 
 応募する。
 メルペイ機能リリース 
 8 エンジニア経験とメルカリ・メルペイとの接点
 (Backend, SRE, iOS, Blockchain, Hardware) 
 2019.6
 
 メルペイ SRE 
 Join

  9. 9 約2年間なにも接点がなかったが、 
 メルペイリリースのタイミングなどの理由で就職した「母川回帰タイプ」 
 イラスト: https://en.wikipedia.org/wiki/Chum_salmon#/media/File:Salmo_salar_GLERL_1.jpg
 エンジニア経験とメルカリ・メルペイとの接点


  10. メルペイのMission、事業内容の共感でき、
 業界への世間の注目度が非常に高い点
 MercariのSREのプレゼンスは非常に高い点
 SREが守る金融事業は
 技術レベルの要求が高く、幅広い点
 01 02 03 10 なぜ入社したか、3つのPoint


  11. What’s SRE
 11

  12. Site Reliability Engineering
 ・Googleが最初に作ったエンジニアの職種(SRE) 
 
 “Site Reliability Engineeringとは、ある組織が、組織のシステム、サービスやプロダクト適切な信頼性のレ ベルを勝ち得るまで貢献するエンジニア工学の概念である”

    
 (SRE Essentials https://speakerdeck.com/jhand/sre-essentials?slide=8)
 12 What’s SRE

  13. 13 What’s SRE
 引用: “What’s the Difference Between DevOps and

    SRE?” 
 https://www.youtube.com/watch?v=uTEL8Ff1Zvk&list=PLIivdWyY5sqJrKl7D2u-gmis8h9K66qoj&index=2&t=0s
 
 

  14. 14 What’s SRE
 「信頼性は一つの機能」
 SLO (サービスレベル目標) とエラーバジェットを元にDeveloperと交渉をする。
 
 例: 


    
 99.99%のAvailabilityをSLOとするサービスならば、約4分/月のダウンタイムが許される。
 
 4分を超えるダウンタイムが発生する機能などはSREはリリースを許可しない。
 それをソフトウェア的な問題と捉え、改善などをはかる。
 
 

  15. 15 What’s SRE
 詳しく知りたい人へ
 『SRE サイトリライアビリティエンジニアリング 
 ―Googleの信頼性を支えるエンジニアリングチーム』
 
 https://amzn.to/2Qay281


    
 

  16. メルペイ SREと自分は何をしてるのか
 16

  17. メルペイ SRE チーム
 17

  18. #mercari_merpay_sre_msp Merpay SRE Responsibility • メルペイという金融サービスのReliability • 開発者がReliabilityを実現するための仕組みづくり Projects •

    メルペイのインフラの構築・運用 • メルペイのマイクロサービスのReliability(リリース・監視) • メルペイのマイクロサービスのOperationと改善(自動化、ツール化) 参考資料: 「メルペイのマイクロサービスの構築と運用 / Cloud Native Days 2019」
  19. #mercari_merpay_sre_msp マイクロサービスアーキテクチャ 参考資料: 「メルペイのマイクロサービスの構築と運用 / Cloud Native Days 2019」

  20. 自分
 20

  21. #mercari_merpay_sre_msp My Project Improve Observability • Cloud Spannerのモニタリング • Kubernetesのネットワークスタッツの取得、および可視化

    • PagerDutyを使ったオンコール対応の監視 • Terraformによる宣言的なモニタリングダッシュボードの作成 モニタリングダッシュボードにはDatadogを使用
  22. #mercari_merpay_sre_msp 1. Cloud Spannerのモニタリング Cloud Spannerとは • Google Cloud Platformだけで独自に提供されているデータベース

    • “グローバルおよびリージョナル アプリケーション データ向けのスケーラブルなフルマネージ ド リレーショナル データベース サービス” 何をしているのか • GAEとCloud Dataflowをあわせたバックアップ運用、およびその監視 • インスタンスやデータベースのリソース監視 • 監視はDatadogを使い、そのDashboardにはTerraformを使用
  23. #mercari_merpay_sre_msp 2. Kubernetesのネットワークスタットの取得、可視化 ネットワークスタットって • ラウンドトリップレイテンシをはじめ、 DNSルックアップ時間やTCPコネクション時間などの 統計情報のこと • 一般的なRPCであるHTTP/1.1

    や 、HTTP/2.0の上で構築されているgRPCを対象としてい る なんでしているのか • レイテンシ増加など、ネットワークに関する問題がたまにある ◦ 問題をドリルダウンして、早期の原因特定のため • すべてのPodの実行環境が同環境ではないので、環境ごとの差異を知るため ◦ リージョンやゾーンなどの地理的環境 ◦ ホストのCPUやメモリなどのリソース環境など
  24. #mercari_merpay_sre_msp 日頃、どんな技術を普段使ってる?

  25. 15% 35% 50% おおまかに、ここ最近の時間比率
 25

  26. #mercari_merpay_sre_msp IT全体で SREはどんどん増えているため 選択肢の一つとして魅力的! なんでも聞いてください :)

  27. (余談) フレックス制について
 27

  28. #mercari_merpay_sre_msp 突然ですが... 朝型の人っていますか?

  29. #mercari_merpay_sre_msp フレックス制(コアタイム12:00 - 16:00)は 不安だった...

  30. コアタイム外に予定入ったりするかも?
 01 02 タスクで夜遅くまでいないといけなくなる?
 30 想定していた主な不安


  31. コアタイム外に予定入ったりするかも?
 01 02 ミーティングなど基本は入らない。 適切な理由があれば入ることもあるが、滅多にない。 タスクで夜遅くまでいないといけなくなる?
 早急に対応が必要でないときは「これ、明日でいいですよ」など 一言いってくれる人が多い。 フレックス制が広く浸透していると感じている。 31

    想定していた主な不安

  32. #mercari_merpay_sre_msp 働きやすい = 生活がしやすい

  33. Thank you!
 33 Keke Twitter: @_k_e_k_e