Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
事業を横断したSRE組織の課題解決を加速する取り組み
Search
homirun
April 14, 2023
Technology
0
1.2k
事業を横断したSRE組織の課題解決を加速する取り組み
Pepabo Tech Conference #20 春のSREまつり(
https://pepabo.connpass.com/event/276927/
)
homirun
April 14, 2023
Tweet
Share
More Decks by homirun
See All by homirun
tusで受けて、SFTPで流す: ファイル転送を支える構成と実装
homirun
0
190
プライベートクラウドで動くKubernetesクラスタの運用とこれから
homirun
0
170
カラーミーショップの改善におけるSRE活動について
homirun
0
1.5k
バックエンド志望だった新卒がSREになるまで
homirun
0
2.3k
謎の拡張子.ipynb_てうLT1
homirun
0
210
Other Decks in Technology
See All in Technology
専門分化が進む分業下でもユーザーが本当に欲しかったものを追求するプロダクトマネジメント/Focus on real user needs despite deep specialization and division of labor
moriyuya
2
1.4k
Engineering Failure-Resilient Systems
infraplumber0
0
130
【新卒研修資料】数理最適化 / Mathematical Optimization
brainpadpr
29
14k
AI時代の大規模データ活用とセキュリティ戦略
ken5scal
1
200
モノレポにおけるエラー管理 ~Runbook自動生成とチームメンションの最適化
biwashi
0
340
AIと描く、未来のBacklog 〜プロジェクト管理の次の10年を想像し、創造するセッション〜
hrm_o25
0
110
AIエージェントを現場で使う / 2025.08.07 著者陣に聞く!現場で活用するためのAIエージェント実践入門(Findyランチセッション)
smiyawaki0820
7
1.3k
AIが住民向けコンシェルジュに?Amazon Connectと生成AIで実現する自治体AIエージェント!
yuyeah
0
170
UDDのススメ - 拡張版 -
maguroalternative
1
610
[OCI Technical Deep Dive] OCIで生成AIを活用するためのソリューション解説(2025年8月5日開催)
oracle4engineer
PRO
0
120
Agent Development Kitで始める生成 AI エージェント実践開発
danishi
0
160
AIに目を奪われすぎて、周りの困っている人間が見えなくなっていませんか?
cap120
1
700
Featured
See All Featured
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
26k
Why Our Code Smells
bkeepers
PRO
338
57k
StorybookのUI Testing Handbookを読んだ
zakiyama
30
6k
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3.4k
Designing Experiences People Love
moore
142
24k
For a Future-Friendly Web
brad_frost
179
9.9k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
131
19k
Java REST API Framework Comparison - PWX 2021
mraible
33
8.8k
The Cost Of JavaScript in 2023
addyosmani
53
8.8k
Optimising Largest Contentful Paint
csswizardry
37
3.4k
BBQ
matthewcrist
89
9.8k
Transcript
1 事業を横断したSRE組織の 課題解決を加速する取り組み ほみるん a.k.a 新宮 隆太 / GMO PEPABO
inc. 2023.04.14 Pepabo Tech Conference #20 春のSREまつり
技術部 プラットフォームグループ 2021年 新卒入社 2 自己紹介 新宮 隆太 Shingu Ryuta •
あだ名: ほみるん • 新卒3年目 • 自宅にKubernetesクラスタを飼ってます • Twitter : @h0mirun_deux
3 アジェンダ 1. 事業を横断したSRE組織について 2. 取り組みの紹介 3. まとめ
4 1. 事業を横断したSRE組織について
5 基本的にサービスは事業部で開発している GMOペパボのエンジニア組織 1. 事業を横断したSRE組織について 採用目的2021 技術部編 https://tech.pepabo.com/2021/06/25/hiring-tech-division-2021/
6 横断組織である技術部 GMOペパボのエンジニア組織 1. 事業を横断したSRE組織について Pepabo Tech Talk -入社1年以内のメンバーが語る、ペパボの SREチームの取り組み
- ペパボのSREについて https://tech.pepabo.com/pdf/pepabo-sre-202104.pdf
7 技術部 プラットフォームグループ 普段担当するサービスごとでチームが別れている 1. 事業を横断したSRE組織について プラットフォームグループ minneチーム SUZURIチーム ECチーム
8 技術部 プラットフォームグループ サービスから独立したSREチーム • 各サービスのSLI/SLOの策定・運用 • ソフトウェアエンジニアリングを用いたサービス運用効率化 • メトリクスを元にしたパフォーマンスチューニング
• インフラ周り • オンコール対応 1. 事業を横断したSRE組織について より具体的なSRE活動はPHP Conference 2022の動画を御覧ください!
9 2. 取り組みの紹介
10 勉強会 定期的な読書会・勉強会の実施 2. 取り組みの紹介
定期的な読書会・勉強会の実施 11 勉強会 2. 取り組みの紹介
定期的な読書会・勉強会の実施 12 勉強会 2. 取り組みの紹介
定期的な読書会・勉強会の実施 13 勉強会 2. 取り組みの紹介 など... 弊社テックブログに過去の記録があるのでぜひ見てください!
14 SoS会(スクラム・オブ・スクラム) 各事業部担当チーム間の情報共有の場 • 各チーム近況報告 • オンコール対応の共有 • 困りごとの相談 2.
取り組みの紹介
15 全員オンコール 夜間・休日のオンコールは担当チームの枠を超えて全サービスを見る体制 2. 取り組みの紹介 プラットフォームグループ minneチーム SUZURIチーム ECチーム minne事業部の
サービス SUZURI事業部の サービス EC事業部の サービス 平日昼
16 全員オンコール 夜間・休日のオンコールは担当チームの枠を超えて全サービスを見る体制 2. 取り組みの紹介 プラットフォームグループ minneチーム SUZURIチーム ECチーム minne事業部の
サービス SUZURI事業部の サービス EC事業部の サービス 夜間・休日
17 全員オンコール 夜間・休日のオンコールは担当チームの枠を超えて全サービスを見る体制 • オンコール負荷の軽減 • オンコール待機時間が平均化されるように • 不要なアラートの精査・自動化の優先度が上昇 •
サービス特有の事情はドキュメント化 詳しくは、弊社テックブログを見てください! 2. 取り組みの紹介
18 オンコールトレーニング 過去のアラートを使って、どのように解決していくとよいかを考えるトレーニング • チームにジョインしたばかりのメンバーがオンコールに入りやすくなる • 普段担当していないサービスへの理解が進む 2. 取り組みの紹介
19 オンコールトレーニング - レギュレーション 出題者と回答者に分かれて実施する 1. 出題者は発生した事象例を回答者に説明 2. 取り組みの紹介 この監視が落ちたら
まず何をしますか? 出題者 回答者
20 オンコールトレーニング - レギュレーション 出題者と回答者に分かれて実施する 1. 出題者は発生した事象例を回答者に説明 2. 回答者は自分の考えを説明して原因と対策を回答 2.
取り組みの紹介 まずユーザー影響を確認していきます! 具体的には... 出題者 回答者
21 オンコールトレーニング - レギュレーション 出題者と回答者に分かれて実施する 1. 出題者は発生した事象例を回答者に説明 2. 回答者は自分の考えを説明して原因と対策を回答 3.
出題者が回答者の回答に対してフィードバック 2. 取り組みの紹介 よさそうです! 更に良くするなら.... 出題者 回答者
22 3. まとめ
23 今回お話したこと • サービスを横断したSRE組織が各サービスのエンジニアと協力して、サービスの 信頼性を向上させている。 • サービス横断組織の強みを活かすために、様々な取り組みを行っている。 3. まとめ
ご静聴ありがとうございました! 24