Upgrade to Pro — share decks privately, control downloads, hide ads and more …

SRE立ち上げから2年 ー 全部やらないためのイネイブリング

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

SRE立ち上げから2年 ー 全部やらないためのイネイブリング

Encraft #24 マルチプロダクトを支えるSREのリアル @ 株式会社ナレッジワーク の発表資料です。
https://knowledgework.connpass.com/event/386458/

Avatar for Akihiro Kawakami (kawa)

Akihiro Kawakami (kawa)

April 21, 2026

Other Decks in Technology

Transcript

  1. © SmartHR, Inc. SRE⽴ち上げから2年 ー 全部やらないためのイネイブリング 川上 晃弘 SmartHR 技術統括本部

    SREユニット 2026/04/21 Encraft #24 マルチプロダクトを支える SREのリアル @ 株式会社ナレッジワーク 1
  2. 2018年〜 2026年 2024年初頭 2017年頃 SREチームの変遷 6 初代SREチーム チーム解散 SRE不在期間 1名から

    SREチーム(再)⽴ ち上げ 5名体制へ拡⼤ 機能開発に リソースを集中 さらなる成⻑のために機能開 発のアジリティと信頼性のバ ランスを取りたい!
  3. イネイブリングを主体とした戦略 9 SREチームが責任を持つこと SLO計測の仕組みや運⽤する環境の提供 モニタリングなどに必要なTerraformモジュー ルや共通ライブラリの開発‧保守 キャパシティプランニングや負荷試験の設計‧ 実施⽀援 インシデント対応プロセスのオーナーシップ やらないこと

    特定のプロダクトチームに紐づく運⽤業務の全 ⾯的な肩代わり ⼿作業でのサーバープロビジョニングや個別環 境の構築作業 SREが提供するプラットフォーム以外で発⽣し た問題に対する⼀次対応 イネイブリング: 開発チームが自律的にサービスの信頼性を向上・維持できるよう、SREが直接作業を代行するの ではなく、技術的なツール整備や教育、ベストプラクティスの提供を通じて支援・並走すること
  4. SLI/SLOの導⼊⽀援 11 1 SLO導⼊ガイドの作成 と Terraformモジュールの整備 2 ⼩さく始めるためのSLO導⼊ワークショップの設計‧実施⽀援 3 SLO導⼊の⽬的‧意味を開発チーム全体に共有

    4 SLO振り返り会の伴⾛サポート ※詳細は SRE Kaigi 2026 「認知負荷を最⼩化するオブザーバビリティとSLOの導 ⼊―4名のSREが200名のプロダクトエンジニアを⽀援」を参照ください ⽬的: 信頼性と機能開発のバランスを取れるようにしたい
  5. SRE不在期間と⽐べてどう変わったか? 13 SRE不在期間(2018〜2023) 信頼性についての議論がされることが少な かった 共通モジュールは有志でメンテナンス 標準がなく、ナレッジが分散しがち インフラ周りの相談先がなかった SRE⽴ち上げ後: イネイブリング主体

    SLI/SLO導⼊により信頼性が可視化され、 信頼性に関する議論がされるようになった SREが共通モジュールやガイドラインを整備 ベストプラクティス集による標準化 ⽀援を受けながら⾃⾛が可能になった