Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
多数のサービスを運営する事業会社におけるSREの苦悩
Search
Tech Leverages
February 24, 2023
Programming
0
470
多数のサービスを運営する事業会社におけるSREの苦悩
Tech Leverages
February 24, 2023
Tweet
Share
More Decks by Tech Leverages
See All by Tech Leverages
古き良き Laravel のシステムは関数型スタイルでリファクタできるのか
leveragestech
1
870
リファクタリングいつやるの? 〜依存の整理〜
leveragestech
0
73
ディメンショナルモデリングを軽く語る
leveragestech
1
3.4k
アクターモデルによる効率的な分散システム設計
leveragestech
0
3.3k
Terraform による運用効率化の取り組みと最新のテストアプローチの紹介
leveragestech
0
3.3k
OpenFGAで拓く次世代認可基盤 〜予告編〜
leveragestech
0
3.3k
リソース・管理効率の向上だけでない、分散システムとしてのTiDBの魅力
leveragestech
0
3.3k
作ってわかる!非同期ランタイム
leveragestech
0
3.3k
レバテック開発部 技術広報 これまでとこれから
leveragestech
0
170
Other Decks in Programming
See All in Programming
F#で自在につくる静的ブログサイト - 関数型まつり2025
pizzacat83
0
280
20250528 AWS Startupイベント登壇資料:AIコーディングの取り組み
procrustes5
0
150
「ElixirでIoT!!」のこれまでとこれから
takasehideki
0
330
実践ArchUnit ~実例による検証パターンの紹介~
ogiwarat
2
240
Parallel::Pipesの紹介
skaji
2
900
コード書くの好きな人向けAIコーディング活用tips #orestudy
77web
3
270
REST API設計の実践 – ベストプラクティスとその落とし穴
kentaroutakeda
2
360
技術懸念に立ち向かい 法改正を穏便に乗り切った話
pop_cashew
0
1.2k
AIエージェントによるテストフレームワーク Arbigent
takahirom
0
360
関数型まつり2025登壇資料「関数プログラミングと再帰」
taisontsukada
2
730
2度もゼロから書き直して、やっとブラウザでぬるぬる動くAIに辿り着いた話
tomoino
0
150
Gleamという選択肢
comamoca
6
650
Featured
See All Featured
Adopting Sorbet at Scale
ufuk
77
9.4k
VelocityConf: Rendering Performance Case Studies
addyosmani
329
24k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Making the Leap to Tech Lead
cromwellryan
134
9.3k
Thoughts on Productivity
jonyablonski
69
4.7k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
How GitHub (no longer) Works
holman
314
140k
Done Done
chrislema
184
16k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
130
19k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
357
30k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
16
910
Navigating Team Friction
lara
186
15k
Transcript
多数のサービスを運営する 事業会社における SREの苦悩 レバレジーズ株式会社 SREチームリーダー 竹下義晃 2023/02/24
自己紹介 レバレジーズ株式会社 SREチーム リーダー 竹下義晃 経歴 2009/3 東京大学大学院 農学生命科学研究科 修了
2009/4 芸者東京株式会社 入社 2020/6 レバレジーズ株式会社 入社 一般社団法人 Japan Scala Association 理事 兼任 現在Webフロント、バックエンド、インフラ、データ分析など多岐に携わっています SREチームの立ち上げ、推進も行っています 前職では、アプリマーケターとして Traffic Run!など全米1位を獲得したハイパーカジュアルゲー ムのUA/MOを担当したことも
©2022 Leverages inc. 会社紹介 IT領域 医療・介護領域 海外・クロスボーダー領域 若年層領域、その他
本日の概要 レバレジーズでは、先程紹介したように複数のサービスを展開し ており、その中でSREとしてどのような体制が良いかを模索中 その課題と、どう対処しようとしているかの紹介です まだ明確な方針がたってなく発散しているものも多くあります
課題 • ドメインの多さ+自己組織化チーム • タコツボ化 • セキュリティやベストプラクティスの変更反映 • 組織の持続性
現在の方針
ドメインの多さ+自己組織化チーム # 現状 3,40サービス運営しておりドメインの種類も多い。今後も増えていく # 課題 これまでの中央集権的なインフラチームの場合、一人が複数のサービスを見ることに なってしまう => 認知負荷が増大、かつ、自己組織化チームとの相性も最悪
# 方針 Embedded SREを各チームに置きつつ、SREチームがサポートという体制 Embedded SREはアプリエンジニアを育成 技術を標準化、プラットフォーム化し技術面の認知負荷を下げる
タコツボ化 # 現状 サービス単位で自己組織化されているため、チーム単位で動くことになる。 # 課題 知見はチームに貯まるが、外に出にくい。チームの局所最適化も起きやすい。 SREチームがPull型で情報を取りに行くのも限界がある # 方針
Embedded SREからSREチームへのPush型情報共有も合わせて行えるように文化、意 識の醸成
セキュリティやベストプラクティスの全体反映 # 現状 変更を全サービスへ展開するのを各チームに依頼するが、チーム内優先度が上がらな いと実施がなかなかされない # 課題 自己組織化しているため、タスク優先度はチームで決められる。特に停止時間が発生し たり、作業工数が多いと後回しにされがち。 履行確認もSREチーム、各チームともに負担
# 方針 プラットフォーム化によるチームの作業工数の低減
持続性 # 現状 1~数サービスにEmbeddedSREが配置されることになるが、会社全体で見るとかなりの 人数になるため、異動や転職、病欠等がどうしても発生する # 課題 異動や転職、病欠等が発生した際にもサービスを維持する必要がある # 方針
プラットフォーム化、技術の標準化により、SREチームのエンジニアが一時的に入れるよ うにする Embedded SREの育成をなるべく短期間でできるように、トレーニングプログラムを作成
SREの現在 • 技術標準化、プラットフォーム化の推進 ◦ ECS Fargate等サーバーレス化 ◦ terraformによるIaC化 ◦ Datadogによるメトリックス監視やログ監視
◦ etc • Embedded SREの育成 ◦ 勉強会やハンズオンの開催 ◦ トレーニングプランの作成 • 会社に働きかけてSRE体制と文化の浸透 ◦ 情報発信 を同時に進めています。
最後に レバレジーズでは、一緒にSREチームを作って行ってもらえる多様性のあるメンバーを求 めています! • 文化づくりや組織づくりをやりたい人 • 技術力を駆使してプラットフォーム開発したい人 • 開発者体験を改善するための仕組みや体制をつくりたい人
We are hiring! 現在レバレジーズでは一緒に働いてくれる仲間を募集しています。 SRE以外の職種も絶賛募集中なので、ご興味のある方は、以下のリンクからご 応募ください。 https://recruit.jobcan.jp/leverages/