Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
事業を横断したSRE組織の課題解決を加速する取り組み
Search
homirun
April 14, 2023
Technology
0
1.2k
事業を横断したSRE組織の課題解決を加速する取り組み
Pepabo Tech Conference #20 春のSREまつり(
https://pepabo.connpass.com/event/276927/
)
homirun
April 14, 2023
Tweet
Share
More Decks by homirun
See All by homirun
tusで受けて、SFTPで流す: ファイル転送を支える構成と実装
homirun
0
200
プライベートクラウドで動くKubernetesクラスタの運用とこれから
homirun
0
190
カラーミーショップの改善におけるSRE活動について
homirun
0
1.5k
バックエンド志望だった新卒がSREになるまで
homirun
0
2.3k
謎の拡張子.ipynb_てうLT1
homirun
0
210
Other Decks in Technology
See All in Technology
20201008_ファインディ_品質意識を育てる役目は人かAIか___2_.pdf
findy_eventslides
2
610
リセラー企業のテクサポ担当が考える、生成 AI 時代のトラブルシュート 2025
kazzpapa3
1
150
社内お問い合わせBotの仕組みと学び
nish01
1
570
10年の共創が示す、これからの開発者と企業の関係 ~ Crossroad
soracom
PRO
1
720
Simplifying Cloud Native app testing across environments with Dapr and Microcks
salaboy
0
140
社内報はAIにやらせよう / Let AI handle the company newsletter
saka2jp
8
1.4k
プロポーザルのコツ ~ Kaigi on Rails 2025 初参加で3名の登壇を実現 ~
naro143
1
210
能登半島地震で見えた災害対応の課題と組織変革の重要性
ditccsugii
0
550
SwiftUIのGeometryReaderとScrollViewを基礎から応用まで学び直す:設計と活用事例
fumiyasac0921
0
160
AI駆動開発を推進するためにサービス開発チームで 取り組んでいること
noayaoshiro
0
260
「れきちず」のこれまでとこれから - 誰にでもわかりやすい歴史地図を目指して / FOSS4G 2025 Japan
hjmkth
1
290
OpenAI gpt-oss ファインチューニング入門
kmotohas
2
1.2k
Featured
See All Featured
Code Review Best Practice
trishagee
72
19k
Building a Scalable Design System with Sketch
lauravandoore
463
33k
Building an army of robots
kneath
306
46k
Fireside Chat
paigeccino
40
3.7k
Building a Modern Day E-commerce SEO Strategy
aleyda
43
7.7k
Code Reviewing Like a Champion
maltzj
526
40k
Navigating Team Friction
lara
190
15k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
We Have a Design System, Now What?
morganepeng
53
7.8k
Into the Great Unknown - MozCon
thekraken
40
2.1k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.5k
Transcript
1 事業を横断したSRE組織の 課題解決を加速する取り組み ほみるん a.k.a 新宮 隆太 / GMO PEPABO
inc. 2023.04.14 Pepabo Tech Conference #20 春のSREまつり
技術部 プラットフォームグループ 2021年 新卒入社 2 自己紹介 新宮 隆太 Shingu Ryuta •
あだ名: ほみるん • 新卒3年目 • 自宅にKubernetesクラスタを飼ってます • Twitter : @h0mirun_deux
3 アジェンダ 1. 事業を横断したSRE組織について 2. 取り組みの紹介 3. まとめ
4 1. 事業を横断したSRE組織について
5 基本的にサービスは事業部で開発している GMOペパボのエンジニア組織 1. 事業を横断したSRE組織について 採用目的2021 技術部編 https://tech.pepabo.com/2021/06/25/hiring-tech-division-2021/
6 横断組織である技術部 GMOペパボのエンジニア組織 1. 事業を横断したSRE組織について Pepabo Tech Talk -入社1年以内のメンバーが語る、ペパボの SREチームの取り組み
- ペパボのSREについて https://tech.pepabo.com/pdf/pepabo-sre-202104.pdf
7 技術部 プラットフォームグループ 普段担当するサービスごとでチームが別れている 1. 事業を横断したSRE組織について プラットフォームグループ minneチーム SUZURIチーム ECチーム
8 技術部 プラットフォームグループ サービスから独立したSREチーム • 各サービスのSLI/SLOの策定・運用 • ソフトウェアエンジニアリングを用いたサービス運用効率化 • メトリクスを元にしたパフォーマンスチューニング
• インフラ周り • オンコール対応 1. 事業を横断したSRE組織について より具体的なSRE活動はPHP Conference 2022の動画を御覧ください!
9 2. 取り組みの紹介
10 勉強会 定期的な読書会・勉強会の実施 2. 取り組みの紹介
定期的な読書会・勉強会の実施 11 勉強会 2. 取り組みの紹介
定期的な読書会・勉強会の実施 12 勉強会 2. 取り組みの紹介
定期的な読書会・勉強会の実施 13 勉強会 2. 取り組みの紹介 など... 弊社テックブログに過去の記録があるのでぜひ見てください!
14 SoS会(スクラム・オブ・スクラム) 各事業部担当チーム間の情報共有の場 • 各チーム近況報告 • オンコール対応の共有 • 困りごとの相談 2.
取り組みの紹介
15 全員オンコール 夜間・休日のオンコールは担当チームの枠を超えて全サービスを見る体制 2. 取り組みの紹介 プラットフォームグループ minneチーム SUZURIチーム ECチーム minne事業部の
サービス SUZURI事業部の サービス EC事業部の サービス 平日昼
16 全員オンコール 夜間・休日のオンコールは担当チームの枠を超えて全サービスを見る体制 2. 取り組みの紹介 プラットフォームグループ minneチーム SUZURIチーム ECチーム minne事業部の
サービス SUZURI事業部の サービス EC事業部の サービス 夜間・休日
17 全員オンコール 夜間・休日のオンコールは担当チームの枠を超えて全サービスを見る体制 • オンコール負荷の軽減 • オンコール待機時間が平均化されるように • 不要なアラートの精査・自動化の優先度が上昇 •
サービス特有の事情はドキュメント化 詳しくは、弊社テックブログを見てください! 2. 取り組みの紹介
18 オンコールトレーニング 過去のアラートを使って、どのように解決していくとよいかを考えるトレーニング • チームにジョインしたばかりのメンバーがオンコールに入りやすくなる • 普段担当していないサービスへの理解が進む 2. 取り組みの紹介
19 オンコールトレーニング - レギュレーション 出題者と回答者に分かれて実施する 1. 出題者は発生した事象例を回答者に説明 2. 取り組みの紹介 この監視が落ちたら
まず何をしますか? 出題者 回答者
20 オンコールトレーニング - レギュレーション 出題者と回答者に分かれて実施する 1. 出題者は発生した事象例を回答者に説明 2. 回答者は自分の考えを説明して原因と対策を回答 2.
取り組みの紹介 まずユーザー影響を確認していきます! 具体的には... 出題者 回答者
21 オンコールトレーニング - レギュレーション 出題者と回答者に分かれて実施する 1. 出題者は発生した事象例を回答者に説明 2. 回答者は自分の考えを説明して原因と対策を回答 3.
出題者が回答者の回答に対してフィードバック 2. 取り組みの紹介 よさそうです! 更に良くするなら.... 出題者 回答者
22 3. まとめ
23 今回お話したこと • サービスを横断したSRE組織が各サービスのエンジニアと協力して、サービスの 信頼性を向上させている。 • サービス横断組織の強みを活かすために、様々な取り組みを行っている。 3. まとめ
ご静聴ありがとうございました! 24