Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Mercari Engineer Meetup

Keke
September 25, 2019

Mercari Engineer Meetup

Keke

September 25, 2019
Tweet

More Decks by Keke

Other Decks in Technology

Transcript

  1. @keke

    2019/09/25

    Engineer’s Meetup for Students


    View Slide

  2. 自己紹介

    01
    02
    03
    学生時代のエンジニア経験
    2年前のメルカリとの接点からメルペイ入社まで話
    What’s SRE

    メルペイ SREではどんな技術を使って、どんなことをしてるの?
    新卒SREは日頃、何をしているのか
    メルペイ SREと自分は何をしてるのか

    Backend EngineerやML Engineerとかって馴染みあるけど、SREって?
    2
    Outlines for Today


    View Slide

  3. 自己紹介

    3

    View Slide

  4. 4
    Keke (Twitter: @_k_e_k_e)

    2017.3 Mercari BOLD Internship in USA
    2019.4- Merpay, New Graduate (SRE Team)

    View Slide

  5. 5
    Mercari Tech Blog

    View Slide

  6. 6
    Meetup
    パネラーとして登壇@2019/09/11 


    View Slide

  7. 7
    Meetup
    GCPUG Yokohama

    勤怠を自動化する技術 

    Ansible Night


    View Slide

  8. 2017.3


    第一期生

    2019.4


    BOLD Internship in USA 

    メルカリ Join

    メルカリ外で

    色々な長期&短期インターン 

    2019.2


    ここで興味が湧き、Joinを検討。

    応募する。

    メルペイ機能リリース 

    8
    エンジニア経験とメルカリ・メルペイとの接点

    (Backend, SRE, iOS, Blockchain, Hardware) 

    2019.6


    メルペイ SRE 

    Join


    View Slide

  9. 9
    約2年間なにも接点がなかったが、 

    メルペイリリースのタイミングなどの理由で就職した「母川回帰タイプ」 

    イラスト: https://en.wikipedia.org/wiki/Chum_salmon#/media/File:Salmo_salar_GLERL_1.jpg

    エンジニア経験とメルカリ・メルペイとの接点


    View Slide

  10. メルペイのMission、事業内容の共感でき、

    業界への世間の注目度が非常に高い点

    MercariのSREのプレゼンスは非常に高い点

    SREが守る金融事業は

    技術レベルの要求が高く、幅広い点

    01
    02
    03
    10
    なぜ入社したか、3つのPoint


    View Slide

  11. What’s SRE

    11

    View Slide

  12. Site Reliability Engineering

    ・Googleが最初に作ったエンジニアの職種(SRE) 


    “Site Reliability Engineeringとは、ある組織が、組織のシステム、サービスやプロダクト適切な信頼性のレ
    ベルを勝ち得るまで貢献するエンジニア工学の概念である” 

    (SRE Essentials https://speakerdeck.com/jhand/sre-essentials?slide=8)

    12
    What’s SRE


    View Slide

  13. 13
    What’s SRE

    引用: “What’s the Difference Between DevOps and SRE?” 

    https://www.youtube.com/watch?v=uTEL8Ff1Zvk&list=PLIivdWyY5sqJrKl7D2u-gmis8h9K66qoj&index=2&t=0s



    View Slide

  14. 14
    What’s SRE

    「信頼性は一つの機能」

    SLO (サービスレベル目標) とエラーバジェットを元にDeveloperと交渉をする。


    例: 


    99.99%のAvailabilityをSLOとするサービスならば、約4分/月のダウンタイムが許される。


    4分を超えるダウンタイムが発生する機能などはSREはリリースを許可しない。

    それをソフトウェア的な問題と捉え、改善などをはかる。



    View Slide

  15. 15
    What’s SRE

    詳しく知りたい人へ

    『SRE サイトリライアビリティエンジニアリング 

    ―Googleの信頼性を支えるエンジニアリングチーム』


    https://amzn.to/2Qay281



    View Slide

  16. メルペイ SREと自分は何をしてるのか

    16

    View Slide

  17. メルペイ SRE チーム

    17

    View Slide

  18. #mercari_merpay_sre_msp
    Merpay SRE
    Responsibility
    ● メルペイという金融サービスのReliability
    ● 開発者がReliabilityを実現するための仕組みづくり
    Projects
    ● メルペイのインフラの構築・運用
    ● メルペイのマイクロサービスのReliability(リリース・監視)
    ● メルペイのマイクロサービスのOperationと改善(自動化、ツール化)
    参考資料: 「メルペイのマイクロサービスの構築と運用 / Cloud Native Days 2019」

    View Slide

  19. #mercari_merpay_sre_msp
    マイクロサービスアーキテクチャ
    参考資料: 「メルペイのマイクロサービスの構築と運用 / Cloud Native Days 2019」

    View Slide

  20. 自分

    20

    View Slide

  21. #mercari_merpay_sre_msp
    My Project
    Improve Observability
    ● Cloud Spannerのモニタリング
    ● Kubernetesのネットワークスタッツの取得、および可視化
    ● PagerDutyを使ったオンコール対応の監視
    ● Terraformによる宣言的なモニタリングダッシュボードの作成
    モニタリングダッシュボードにはDatadogを使用

    View Slide

  22. #mercari_merpay_sre_msp
    1. Cloud Spannerのモニタリング
    Cloud Spannerとは
    ● Google Cloud Platformだけで独自に提供されているデータベース
    ● “グローバルおよびリージョナル アプリケーション データ向けのスケーラブルなフルマネージ
    ド リレーショナル データベース サービス”
    何をしているのか
    ● GAEとCloud Dataflowをあわせたバックアップ運用、およびその監視
    ● インスタンスやデータベースのリソース監視
    ● 監視はDatadogを使い、そのDashboardにはTerraformを使用

    View Slide

  23. #mercari_merpay_sre_msp
    2. Kubernetesのネットワークスタットの取得、可視化
    ネットワークスタットって
    ● ラウンドトリップレイテンシをはじめ、
    DNSルックアップ時間やTCPコネクション時間などの
    統計情報のこと
    ● 一般的なRPCであるHTTP/1.1 や 、HTTP/2.0の上で構築されているgRPCを対象としてい

    なんでしているのか
    ● レイテンシ増加など、ネットワークに関する問題がたまにある
    ○ 問題をドリルダウンして、早期の原因特定のため
    ● すべてのPodの実行環境が同環境ではないので、環境ごとの差異を知るため
    ○ リージョンやゾーンなどの地理的環境
    ○ ホストのCPUやメモリなどのリソース環境など

    View Slide

  24. #mercari_merpay_sre_msp
    日頃、どんな技術を普段使ってる?

    View Slide

  25. 15%
    35%
    50%
    おおまかに、ここ最近の時間比率

    25

    View Slide

  26. #mercari_merpay_sre_msp
    IT全体で
    SREはどんどん増えているため
    選択肢の一つとして魅力的!
    なんでも聞いてください :)

    View Slide

  27. (余談) フレックス制について

    27

    View Slide

  28. #mercari_merpay_sre_msp
    突然ですが...
    朝型の人っていますか?

    View Slide

  29. #mercari_merpay_sre_msp
    フレックス制(コアタイム12:00 - 16:00)は
    不安だった...

    View Slide

  30. コアタイム外に予定入ったりするかも?

    01
    02
    タスクで夜遅くまでいないといけなくなる?

    30
    想定していた主な不安


    View Slide

  31. コアタイム外に予定入ったりするかも?

    01
    02
    ミーティングなど基本は入らない。
    適切な理由があれば入ることもあるが、滅多にない。
    タスクで夜遅くまでいないといけなくなる?

    早急に対応が必要でないときは「これ、明日でいいですよ」など 一言いってくれる人が多い。
    フレックス制が広く浸透していると感じている。
    31
    想定していた主な不安


    View Slide

  32. #mercari_merpay_sre_msp
    働きやすい

    生活がしやすい

    View Slide

  33. Thank you!

    33
    Keke
    Twitter: @_k_e_k_e

    View Slide