Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Mercari Engineer Meetup
Search
Keke
September 25, 2019
Technology
1
3k
Mercari Engineer Meetup
Keke
September 25, 2019
Tweet
Share
More Decks by Keke
See All by Keke
リモートワークを支える勤怠管理 ~プラットフォームとしてのSlackの活用 ~
keisukeyamashita
0
650
Serving GitHub Actions Self-Hosted Runner as a Platform (Part 1: Introduction)
keisukeyamashita
0
370
Serverlessを取り巻く現状とAll Serverlessでプロダクトを構築する苦労
keisukeyamashita
10
3k
Spinnakerで実践するマイクロサービスの 安全なリリースフローとベストプラクティス
keisukeyamashita
3
1.1k
Spinnaker Application management by Terraform Plugins
keisukeyamashita
2
870
Open Policy AgentとSpinnakerで実現するマイクロサービスの安全な継続的デリバリー
keisukeyamashita
8
6.2k
How to develop a custom Terraform provider@Merpay SRE Tech Talk
keisukeyamashita
0
400
Introduction to Spinnaker Managed Pipeline Templates
keisukeyamashita
3
6.6k
Cloud Runでシステムを作るためのアーキテクチャのTipsとコストの話
keisukeyamashita
3
1.4k
Other Decks in Technology
See All in Technology
三菱電機で社内コミュニティを立ち上げた話
kurebayashi
1
350
エンジニアリングマネージャー視点での、自律的なスケーリングを実現するFASTという選択肢 / RSGT2025
yoshikiiida
4
3.6k
月間60万ユーザーを抱える 個人開発サービス「Walica」の 技術スタック変遷
miyachin
1
130
.NET 最新アップデート ~ AI とクラウド時代のアプリモダナイゼーション
chack411
0
200
Cloudflareで実現する AIエージェント ワークフロー基盤
kmd09
0
280
JuliaTokaiとJuliaLangJaの紹介 for NGK2025S
antimon2
1
110
【JAWS-UG大阪 reInvent reCap LT大会 サンバが始まったら強制終了】“1分”で初めてのソロ参戦reInventを数字で振り返りながら反省する
ttelltte
0
130
#TRG24 / David Cuartielles / Post Open Source
tarugoconf
0
570
ゼロからわかる!!AWSの構成図を書いてみようワークショップ 問題&解答解説 #デッカイギ #羽田デッカイギおつ
_mossann_t
0
1.5k
2025年に挑戦したいこと
molmolken
0
150
Reactフレームワークプロダクトを モバイルアプリにして、もっと便利に。 ユーザに価値を届けよう。/React Framework with Capacitor
rdlabo
0
120
データ基盤におけるIaCの重要性とその運用
mtpooh
4
460
Featured
See All Featured
A Modern Web Designer's Workflow
chriscoyier
693
190k
Stop Working from a Prison Cell
hatefulcrawdad
267
20k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
19
2.3k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
33
2k
Embracing the Ebb and Flow
colly
84
4.5k
No one is an island. Learnings from fostering a developers community.
thoeni
19
3.1k
Music & Morning Musume
bryan
46
6.3k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
27
1.5k
StorybookのUI Testing Handbookを読んだ
zakiyama
28
5.4k
Designing on Purpose - Digital PM Summit 2013
jponch
116
7.1k
Building Applications with DynamoDB
mza
93
6.2k
Transcript
@keke 2019/09/25 Engineer’s Meetup for Students
自己紹介 01 02 03 学生時代のエンジニア経験 2年前のメルカリとの接点からメルペイ入社まで話 What’s SRE メルペイ SREではどんな技術を使って、どんなことをしてるの?
新卒SREは日頃、何をしているのか メルペイ SREと自分は何をしてるのか Backend EngineerやML Engineerとかって馴染みあるけど、SREって? 2 Outlines for Today
自己紹介 3
4 Keke (Twitter: @_k_e_k_e) 2017.3 Mercari BOLD Internship in USA
2019.4- Merpay, New Graduate (SRE Team)
5 Mercari Tech Blog
6 Meetup パネラーとして登壇@2019/09/11
7 Meetup GCPUG Yokohama 勤怠を自動化する技術 Ansible Night
2017.3 第一期生 2019.4 BOLD Internship in USA
メルカリ Join メルカリ外で 色々な長期&短期インターン 2019.2 ここで興味が湧き、Joinを検討。 応募する。 メルペイ機能リリース 8 エンジニア経験とメルカリ・メルペイとの接点 (Backend, SRE, iOS, Blockchain, Hardware) 2019.6 メルペイ SRE Join
9 約2年間なにも接点がなかったが、 メルペイリリースのタイミングなどの理由で就職した「母川回帰タイプ」 イラスト: https://en.wikipedia.org/wiki/Chum_salmon#/media/File:Salmo_salar_GLERL_1.jpg エンジニア経験とメルカリ・メルペイとの接点
メルペイのMission、事業内容の共感でき、 業界への世間の注目度が非常に高い点 MercariのSREのプレゼンスは非常に高い点 SREが守る金融事業は 技術レベルの要求が高く、幅広い点 01 02 03 10 なぜ入社したか、3つのPoint
What’s SRE 11
Site Reliability Engineering ・Googleが最初に作ったエンジニアの職種(SRE) “Site Reliability Engineeringとは、ある組織が、組織のシステム、サービスやプロダクト適切な信頼性のレ ベルを勝ち得るまで貢献するエンジニア工学の概念である”
(SRE Essentials https://speakerdeck.com/jhand/sre-essentials?slide=8) 12 What’s SRE
13 What’s SRE 引用: “What’s the Difference Between DevOps and
SRE?” https://www.youtube.com/watch?v=uTEL8Ff1Zvk&list=PLIivdWyY5sqJrKl7D2u-gmis8h9K66qoj&index=2&t=0s
14 What’s SRE 「信頼性は一つの機能」 SLO (サービスレベル目標) とエラーバジェットを元にDeveloperと交渉をする。 例:
99.99%のAvailabilityをSLOとするサービスならば、約4分/月のダウンタイムが許される。 4分を超えるダウンタイムが発生する機能などはSREはリリースを許可しない。 それをソフトウェア的な問題と捉え、改善などをはかる。
15 What’s SRE 詳しく知りたい人へ 『SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム』 https://amzn.to/2Qay281
メルペイ SREと自分は何をしてるのか 16
メルペイ SRE チーム 17
#mercari_merpay_sre_msp Merpay SRE Responsibility • メルペイという金融サービスのReliability • 開発者がReliabilityを実現するための仕組みづくり Projects •
メルペイのインフラの構築・運用 • メルペイのマイクロサービスのReliability(リリース・監視) • メルペイのマイクロサービスのOperationと改善(自動化、ツール化) 参考資料: 「メルペイのマイクロサービスの構築と運用 / Cloud Native Days 2019」
#mercari_merpay_sre_msp マイクロサービスアーキテクチャ 参考資料: 「メルペイのマイクロサービスの構築と運用 / Cloud Native Days 2019」
自分 20
#mercari_merpay_sre_msp My Project Improve Observability • Cloud Spannerのモニタリング • Kubernetesのネットワークスタッツの取得、および可視化
• PagerDutyを使ったオンコール対応の監視 • Terraformによる宣言的なモニタリングダッシュボードの作成 モニタリングダッシュボードにはDatadogを使用
#mercari_merpay_sre_msp 1. Cloud Spannerのモニタリング Cloud Spannerとは • Google Cloud Platformだけで独自に提供されているデータベース
• “グローバルおよびリージョナル アプリケーション データ向けのスケーラブルなフルマネージ ド リレーショナル データベース サービス” 何をしているのか • GAEとCloud Dataflowをあわせたバックアップ運用、およびその監視 • インスタンスやデータベースのリソース監視 • 監視はDatadogを使い、そのDashboardにはTerraformを使用
#mercari_merpay_sre_msp 2. Kubernetesのネットワークスタットの取得、可視化 ネットワークスタットって • ラウンドトリップレイテンシをはじめ、 DNSルックアップ時間やTCPコネクション時間などの 統計情報のこと • 一般的なRPCであるHTTP/1.1
や 、HTTP/2.0の上で構築されているgRPCを対象としてい る なんでしているのか • レイテンシ増加など、ネットワークに関する問題がたまにある ◦ 問題をドリルダウンして、早期の原因特定のため • すべてのPodの実行環境が同環境ではないので、環境ごとの差異を知るため ◦ リージョンやゾーンなどの地理的環境 ◦ ホストのCPUやメモリなどのリソース環境など
#mercari_merpay_sre_msp 日頃、どんな技術を普段使ってる?
15% 35% 50% おおまかに、ここ最近の時間比率 25
#mercari_merpay_sre_msp IT全体で SREはどんどん増えているため 選択肢の一つとして魅力的! なんでも聞いてください :)
(余談) フレックス制について 27
#mercari_merpay_sre_msp 突然ですが... 朝型の人っていますか?
#mercari_merpay_sre_msp フレックス制(コアタイム12:00 - 16:00)は 不安だった...
コアタイム外に予定入ったりするかも? 01 02 タスクで夜遅くまでいないといけなくなる? 30 想定していた主な不安
コアタイム外に予定入ったりするかも? 01 02 ミーティングなど基本は入らない。 適切な理由があれば入ることもあるが、滅多にない。 タスクで夜遅くまでいないといけなくなる? 早急に対応が必要でないときは「これ、明日でいいですよ」など 一言いってくれる人が多い。 フレックス制が広く浸透していると感じている。 31
想定していた主な不安
#mercari_merpay_sre_msp 働きやすい = 生活がしやすい
Thank you! 33 Keke Twitter: @_k_e_k_e