Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
スタートアップの1人目SREが SREチームを分割しようと考えるに至るまで
Search
Hiroki Takatsuka
April 06, 2025
Technology
1
230
スタートアップの1人目SREが SREチームを分割しようと考えるに至るまで
ゆるSRE勉強会 #10 - connpass
https://yuru-sre.connpass.com/event/348136/
Hiroki Takatsuka
April 06, 2025
Tweet
Share
More Decks by Hiroki Takatsuka
See All by Hiroki Takatsuka
セキュアなAI活用のためのLiteLLMの可能性
tk3fftk
3
2k
どちらかだけじゃもったいないかも? ECSとEKSを適材適所で併用するメリット、運用課題とそれらの対応について
tk3fftk
2
810
そろそろOn-Callの通知音について考えてみよう (PagerDuty編)
tk3fftk
1
990
なにもしてないのにNew Relicのデータ転送量が増えていたときに確認したこと
tk3fftk
3
490
緊急SOS!KubernetesのCompletedな10万Jobぜんぶ消す
tk3fftk
3
7.1k
1人目の専任SREがポストモーテム文化を改善したらエンジニア以外にも広まり、 他部門との連携も強化された話+
tk3fftk
2
3.9k
Aurora MySQL ハマリポイントと対応
tk3fftk
1
600
Other Decks in Technology
See All in Technology
なぜフロントエンド技術を追うのか?なぜカンファレンスに参加するのか?
sakito
10
2k
AI/MLのマルチテナント基盤を支えるコンテナ技術
pfn
PRO
5
780
プロダクトマネージャーが押さえておくべき、ソフトウェア資産とAIエージェント投資効果 / pmconf2025
i35_267
2
500
バグハンター視点によるサプライチェーンの脆弱性
scgajge12
2
600
HIG学習用スライド
yuukiw00w
0
110
【pmconf2025】PdMの「責任感」がチームを弱くする?「分業型」から全員がユーザー価値に本気で向き合う「共創型開発チーム」への変遷
toshimasa012345
0
170
コミューンのデータ分析AIエージェント「Community Sage」の紹介
fufufukakaka
0
220
GitLab Duo Agent Platformで実現する“AI駆動・継続的サービス開発”と最新情報のアップデート
jeffi7
0
190
Oracle Technology Night #95 GoldenGate 26ai の実装に迫る1
oracle4engineer
PRO
0
110
Kiro Autonomous AgentとKiro Powers の紹介 / kiro-autonomous-agent-and-powers
tomoki10
0
120
セキュリティAIエージェントの現在と未来 / PSS #2 Takumi Session
flatt_security
3
1.5k
形式手法特論:CEGAR を用いたモデル検査の状態空間削減 #kernelvm / Kernel VM Study Hokuriku Part 8
ytaka23
2
390
Featured
See All Featured
Automating Front-end Workflow
addyosmani
1371
200k
Speed Design
sergeychernyshev
33
1.4k
Writing Fast Ruby
sferik
630
62k
Building Applications with DynamoDB
mza
96
6.8k
4 Signs Your Business is Dying
shpigford
186
22k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.8k
A Tale of Four Properties
chriscoyier
162
23k
A better future with KSS
kneath
240
18k
Code Review Best Practice
trishagee
73
19k
The Language of Interfaces
destraynor
162
25k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.1k
Transcript
スタートアップの1人目SREが SREチームを分割しようと考えるに至るまで ゆるSRE勉強会#10 2025/04/04 primeNumber Inc. プロダクト開発本部 SRE Group 髙塚
広貴 (@tk3fftk)
目次 2 1. はじめに 2. 何を話すのか 3. なぜSREチームを分割しようとしているか 4. どうSREチームを分割しようとしているか
5. まとめ
3 髙塚広貴 (@tk3fftk) 株式会社primeNumber Head of SRE • ヤフー株式会社 (2016
~ 2022) ◦ CI/CDプラットフォーム Screwdriver.cd SREチームのスクラムマスターやEM • 株式会社primeNumber (2022 ~ ) ◦ TROCCO®/COMETA®のSRE/Security • 猫🐈 ◦ アルくん (アビシニアン ♂ 5歳) • ゆるSREのLTは2回目 ◦ #8でPagerDutyの通知音の話をしました
会社概要 4 株式会社primeNumber 代表取締役CEO 田邊 雄樹 2015年11月 約105名 約34億円 東京都品川区上大崎3丁目1番1号
JR東急目黒ビル5F 会社名 代表 創業 メンバー数 累計調達額 オフィス © primeNumber Inc.
あらゆるデータを、 ビジネスの力に変える。 人とAIが共存する時代に。 知の源泉となるデータを、 誰もがすばやく、自由に使えるように。 primeNumberは、テクノロジーの力で データ活用における不自由をなくし、 あらゆるデータを、ビジネスの力に変えていく。 そして、それまでの常識や産業の枠を超えて、 さまざまな人や企業、技術、アイデアとつながり、
まだない価値を共に生み出していく。 私たちは、人とデータの開かれた関係を築くことで、 人の創造力を解放し、 世界中のビジネスと社会全体の可能性を拡げます。 VISION 5 © primeNumber Inc.
6 primeNumberの事業 データエンジニアリング知識の有無にかかわらず、「あらゆるデータを、ビジネスの力に変える」を実現 するべく、複数のプロダクト・サービスを提供しています。 © primeNumber Inc. 活用 分析 可視化
蓄積 統合 点在 データテクノロジー領域の課題解決を実現する コンサルティング・エンジニアリングサービス データ基盤の構築や運用を 支援するクラウドETL データの発見・理解・活用を 促進するデータカタログサービス 顧客データ分析後の施策実行 (“ACTION”)を支援するサービス
7 今日話したいこと
8 SREの組織的な話ってあんまり転がってない?ような気がする • SREチーム、Embedded / Platform みたいな分け方はおそらく一般的 • でもみんなそれって「いつ」「なぜ」分けたの? •
一例として自分がここ数ヶ月で分けるためにやった話を持ってきた • 「うちはこうだったよ」みたいな話をぜひ懇親会で聞きたく 🙏
9 なぜSREチームを分割しようとしたのか
10 背景 primeNumberのSRE組織は、プロダクトの信頼性向上を主軸に置きつつ、セキュリティ基盤 の構築、クラウドの組織管理、利用SaaSの管理など、幅広い領域を担当しています。 プロダクトや組織の急成長にともない、プロダクトの信頼性と、全社で利用されるシステム の信頼性という異なる信頼性を1チームで最適化することが困難になってきました。 特に、クラウドネイティブ環境におけるセキュリティガバナンスの高度化や、SaaS統合管理 の複雑化が顕著になる中で「Corporate SRE」という新たな専門チームを立ち上げるに至り ました。
SREの知見を全社横断で適用し、組織の信頼性を高める Corporate SRE - 株式会社primeNumber より
11 とか言ってますが「やることが..やることが多い..!!」状態になったため • SREチームの正社員2人(うち1人はEMかつ兼務あり)しかいないのよ〜😭 ◦ (でもついに今度3人目が入ってくれます、やったね!!! • SREの責務が増えてきて1チームで全部見るのはつらい ◦ 「プロダクト」のSREをやりながらAWS
Organization管理など全社利用のモノも見 るのはコンテキストスイッチが激しい (たぶんあるあるだけど) ▪ 組織のサイズが小さいうちはやむなしだけど、100人越えたらそうも言ってられない • 他チーム・部署に移譲できないのか? ◦ 逆にお願いされたり、すでに連携して進めているものも • 最適化するなら、求められるマインドやスキルセットも異なっているはず 👉 チーム分けてポジション作って採用を目指そう!
12 どうSREチームを分割しようとしたか
13 こうしようとしている、のでここに至るまでを話します
14 まずは業務の洗い出し(サクセッションプランニング)からやってみた • エレガントパズル で知ったやつ • 本来は自分の後任を見つける・育成するためのプロセス 自分は何をしているのか?を理解する (リストアップする)ことが第一歩 -
カレンダーを見てミーティングで の役割を書き留める - カレンダーを見てミーティング以 外のことを書き留める - 繰り返し行われてきたプロセス と、そのプロセスにおける役割を 書き留める
15 これを領域に合わせてざっくりマッピング チームを分けるといってもすぐに人を増やせるわけではないので、仮想的にチーム内チーム
16 ちょっと先の展望も考える • 業務委託メンバーへは徐々にCorp SRE領域のタスクをアサインしていくようにする • Corp SRE領域向けのJob Description(≒ 求人、募集要項)を作って採用候補者を探す
◦ Product SRE領域とは求めるマインド・スキルセットが異なるはずなので、別枠に
17 確度は低いがさらに先の展望も考えておく • 「人が取れる」前提になるが完全に分離し、Corp SREはよりSecurity, CorpIT領域との連携を強めて いきたい • マネジメント層の想定などはひとまずpending
18 できあがったのがこちらになります SREの知見を全社横断で適用し、組織の信頼性を高める Corporate SRE - 株式会社primeNumber より
19 Q. なんで “Corporate SRE” なの? A. 誤解やミスマッチをできるだけ減らしたい • セキュリティチームと情シスと連携してる部分を一緒にやる+全社SaaS管理などを想定
◦ 組織の信頼性を高める 〜SRE/情シス/セキュリティの領域を超えて〜の影響が大きい • プロダクトが多くないので、開発組織が分散してない ◦ EmbeddedとPlatformという分け方をすると誤解やミスマッチが起こりそう ▪ 入ったら「ぜんぜんPlatformちゃうやんけ!!!」とぼくならなります、たぶん ◦ AWSとかGoogle Cloudは見てもらうけどCCoEってほどでもないし… • プロダクト領域のSREとコーポレート領域SRE的な分け方をするのがいいのではないか
20 まとめ・所感
21 まとめ・所感 • pN社でSREがなぜ、どう考えてSREチームを分けたかを話してみました ◦ 結果はこれから… ◦ 懇親会でぜひみなさんの話も聞かせてください👂 • 即分割、とはいかないので兆候が見えたら考えはじめてみてもいいかも
• 越境した業務に悩んでる人は組織の信頼性を高める 〜SRE/情シス/セキュリ ティの領域を超えて〜の資料を見るといいぞ! • ポジション作るときはスカウト文や選考フローもセットで考えようね (大慌て した人より)