Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
スタートアップの1人目SREが SREチームを分割しようと考えるに至るまで
Search
Hiroki Takatsuka
April 06, 2025
Technology
1
140
スタートアップの1人目SREが SREチームを分割しようと考えるに至るまで
ゆるSRE勉強会 #10 - connpass
https://yuru-sre.connpass.com/event/348136/
Hiroki Takatsuka
April 06, 2025
Tweet
Share
More Decks by Hiroki Takatsuka
See All by Hiroki Takatsuka
どちらかだけじゃもったいないかも? ECSとEKSを適材適所で併用するメリット、運用課題とそれらの対応について
tk3fftk
2
540
そろそろOn-Callの通知音について考えてみよう (PagerDuty編)
tk3fftk
1
760
なにもしてないのにNew Relicのデータ転送量が増えていたときに確認したこと
tk3fftk
3
430
緊急SOS!KubernetesのCompletedな10万Jobぜんぶ消す
tk3fftk
3
6.9k
1人目の専任SREがポストモーテム文化を改善したらエンジニア以外にも広まり、 他部門との連携も強化された話+
tk3fftk
2
3.3k
Aurora MySQL ハマリポイントと対応
tk3fftk
1
540
Other Decks in Technology
See All in Technology
DenoとJSRで実現する最速MCPサーバー開発記 / Building MCP Servers at Lightning Speed with Deno and JSR
yamanoku
1
260
AIにどこまで任せる?実務で使える(かもしれない)AIエージェント設計の考え方
har1101
3
1.2k
Agentic Workflowという選択肢を考える
tkikuchi1002
1
360
AIの最新技術&テーマをつまんで紹介&フリートークするシリーズ #1 量子機械学習の入門
tkhresk
0
120
Amazon Bedrockで実現する 新たな学習体験
kzkmaeda
1
380
AWS アーキテクチャ作図入門/aws-architecture-diagram-101
ma2shita
29
9.5k
キャディでのApache Iceberg, Trino採用事例 -Apache Iceberg and Trino Usecase in CADDi--
caddi_eng
0
170
CSS、JSをHTMLテンプレートにまとめるフロントエンド戦略
d120145
0
200
UIテスト自動化サポート- Testbed for XCUIAutomation practice
notoroid
0
110
“社内”だけで完結していた私が、AWS Community Builder になるまで
nagisa53
1
130
[TechNight #90-1] 本当に使える?ZDMの新機能を実践検証してみた
oracle4engineer
PRO
3
140
原則から考える保守しやすいComposable関数設計
moriatsushi
3
500
Featured
See All Featured
Scaling GitHub
holman
459
140k
How to train your dragon (web standard)
notwaldorf
92
6.1k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.9k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
4
200
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
124
52k
Faster Mobile Websites
deanohume
307
31k
Become a Pro
speakerdeck
PRO
28
5.4k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.4k
Site-Speed That Sticks
csswizardry
10
650
Navigating Team Friction
lara
187
15k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
7
700
How GitHub (no longer) Works
holman
314
140k
Transcript
スタートアップの1人目SREが SREチームを分割しようと考えるに至るまで ゆるSRE勉強会#10 2025/04/04 primeNumber Inc. プロダクト開発本部 SRE Group 髙塚
広貴 (@tk3fftk)
目次 2 1. はじめに 2. 何を話すのか 3. なぜSREチームを分割しようとしているか 4. どうSREチームを分割しようとしているか
5. まとめ
3 髙塚広貴 (@tk3fftk) 株式会社primeNumber Head of SRE • ヤフー株式会社 (2016
~ 2022) ◦ CI/CDプラットフォーム Screwdriver.cd SREチームのスクラムマスターやEM • 株式会社primeNumber (2022 ~ ) ◦ TROCCO®/COMETA®のSRE/Security • 猫🐈 ◦ アルくん (アビシニアン ♂ 5歳) • ゆるSREのLTは2回目 ◦ #8でPagerDutyの通知音の話をしました
会社概要 4 株式会社primeNumber 代表取締役CEO 田邊 雄樹 2015年11月 約105名 約34億円 東京都品川区上大崎3丁目1番1号
JR東急目黒ビル5F 会社名 代表 創業 メンバー数 累計調達額 オフィス © primeNumber Inc.
あらゆるデータを、 ビジネスの力に変える。 人とAIが共存する時代に。 知の源泉となるデータを、 誰もがすばやく、自由に使えるように。 primeNumberは、テクノロジーの力で データ活用における不自由をなくし、 あらゆるデータを、ビジネスの力に変えていく。 そして、それまでの常識や産業の枠を超えて、 さまざまな人や企業、技術、アイデアとつながり、
まだない価値を共に生み出していく。 私たちは、人とデータの開かれた関係を築くことで、 人の創造力を解放し、 世界中のビジネスと社会全体の可能性を拡げます。 VISION 5 © primeNumber Inc.
6 primeNumberの事業 データエンジニアリング知識の有無にかかわらず、「あらゆるデータを、ビジネスの力に変える」を実現 するべく、複数のプロダクト・サービスを提供しています。 © primeNumber Inc. 活用 分析 可視化
蓄積 統合 点在 データテクノロジー領域の課題解決を実現する コンサルティング・エンジニアリングサービス データ基盤の構築や運用を 支援するクラウドETL データの発見・理解・活用を 促進するデータカタログサービス 顧客データ分析後の施策実行 (“ACTION”)を支援するサービス
7 今日話したいこと
8 SREの組織的な話ってあんまり転がってない?ような気がする • SREチーム、Embedded / Platform みたいな分け方はおそらく一般的 • でもみんなそれって「いつ」「なぜ」分けたの? •
一例として自分がここ数ヶ月で分けるためにやった話を持ってきた • 「うちはこうだったよ」みたいな話をぜひ懇親会で聞きたく 🙏
9 なぜSREチームを分割しようとしたのか
10 背景 primeNumberのSRE組織は、プロダクトの信頼性向上を主軸に置きつつ、セキュリティ基盤 の構築、クラウドの組織管理、利用SaaSの管理など、幅広い領域を担当しています。 プロダクトや組織の急成長にともない、プロダクトの信頼性と、全社で利用されるシステム の信頼性という異なる信頼性を1チームで最適化することが困難になってきました。 特に、クラウドネイティブ環境におけるセキュリティガバナンスの高度化や、SaaS統合管理 の複雑化が顕著になる中で「Corporate SRE」という新たな専門チームを立ち上げるに至り ました。
SREの知見を全社横断で適用し、組織の信頼性を高める Corporate SRE - 株式会社primeNumber より
11 とか言ってますが「やることが..やることが多い..!!」状態になったため • SREチームの正社員2人(うち1人はEMかつ兼務あり)しかいないのよ〜😭 ◦ (でもついに今度3人目が入ってくれます、やったね!!! • SREの責務が増えてきて1チームで全部見るのはつらい ◦ 「プロダクト」のSREをやりながらAWS
Organization管理など全社利用のモノも見 るのはコンテキストスイッチが激しい (たぶんあるあるだけど) ▪ 組織のサイズが小さいうちはやむなしだけど、100人越えたらそうも言ってられない • 他チーム・部署に移譲できないのか? ◦ 逆にお願いされたり、すでに連携して進めているものも • 最適化するなら、求められるマインドやスキルセットも異なっているはず 👉 チーム分けてポジション作って採用を目指そう!
12 どうSREチームを分割しようとしたか
13 こうしようとしている、のでここに至るまでを話します
14 まずは業務の洗い出し(サクセッションプランニング)からやってみた • エレガントパズル で知ったやつ • 本来は自分の後任を見つける・育成するためのプロセス 自分は何をしているのか?を理解する (リストアップする)ことが第一歩 -
カレンダーを見てミーティングで の役割を書き留める - カレンダーを見てミーティング以 外のことを書き留める - 繰り返し行われてきたプロセス と、そのプロセスにおける役割を 書き留める
15 これを領域に合わせてざっくりマッピング チームを分けるといってもすぐに人を増やせるわけではないので、仮想的にチーム内チーム
16 ちょっと先の展望も考える • 業務委託メンバーへは徐々にCorp SRE領域のタスクをアサインしていくようにする • Corp SRE領域向けのJob Description(≒ 求人、募集要項)を作って採用候補者を探す
◦ Product SRE領域とは求めるマインド・スキルセットが異なるはずなので、別枠に
17 確度は低いがさらに先の展望も考えておく • 「人が取れる」前提になるが完全に分離し、Corp SREはよりSecurity, CorpIT領域との連携を強めて いきたい • マネジメント層の想定などはひとまずpending
18 できあがったのがこちらになります SREの知見を全社横断で適用し、組織の信頼性を高める Corporate SRE - 株式会社primeNumber より
19 Q. なんで “Corporate SRE” なの? A. 誤解やミスマッチをできるだけ減らしたい • セキュリティチームと情シスと連携してる部分を一緒にやる+全社SaaS管理などを想定
◦ 組織の信頼性を高める 〜SRE/情シス/セキュリティの領域を超えて〜の影響が大きい • プロダクトが多くないので、開発組織が分散してない ◦ EmbeddedとPlatformという分け方をすると誤解やミスマッチが起こりそう ▪ 入ったら「ぜんぜんPlatformちゃうやんけ!!!」とぼくならなります、たぶん ◦ AWSとかGoogle Cloudは見てもらうけどCCoEってほどでもないし… • プロダクト領域のSREとコーポレート領域SRE的な分け方をするのがいいのではないか
20 まとめ・所感
21 まとめ・所感 • pN社でSREがなぜ、どう考えてSREチームを分けたかを話してみました ◦ 結果はこれから… ◦ 懇親会でぜひみなさんの話も聞かせてください👂 • 即分割、とはいかないので兆候が見えたら考えはじめてみてもいいかも
• 越境した業務に悩んでる人は組織の信頼性を高める 〜SRE/情シス/セキュリ ティの領域を超えて〜の資料を見るといいぞ! • ポジション作るときはスカウト文や選考フローもセットで考えようね (大慌て した人より)